Spark的误解-不仅spark是内存计算，hadoop也是内存计算-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Spark的误解-不仅spark是内存计算，hadoop也是内存计算

阅读量：6641 次

发布时间：2019-06-25

本文共 487 字，大约阅读时间需要 1 分钟。

市面上有一些初学者的误解，他们拿spark和hadoop比较时就会说，Spark是内存计算，内存计算是spark的特性。请问在计算机领域，mysql,redis,ssh框架等等他们不是内存计算吗?依据冯诺依曼体系结构，有什么技术的程序不是在内存中运行，需要数据从硬盘中拉取，然后供cpu进行执行？所有说sprk的特点是内存计算相当于什么都没有说。那么spark的真正特点是什么?抛开spark的执行模型的方式，它的特点无非就是多个任务之间数据通信不需要借助硬盘而是通过内存，大大提高了程序的执行效率。而hadoop由于本身的模型特点，多个任务之间数据通信是必须借助硬盘落地的。那么spark的特点就是数据交互不会走硬盘。只能说多个任务的数据交互不走硬盘，但是sprk的shuffle过程和hadoop一样仍然必须走硬盘的。

本文是翻译的出处 https://0x0fff.com/spark-misconceptions/。

本文转自zsdnr 51CTO博客，原文链接：http://blog.51cto.com/12942149/1949730，如需转载请自行联系原作者

你可能感兴趣的文章

ABBYY PDF Transformer+的安装方法

重逢Windows从powerShell开始

JAVA 的异常那些事

Android Studio中如何打JAR包

IDEA 快捷键 (OSX)

Linux下单独编译安装php且支持mysql扩展

转转数据平台部诚招 Java、大数据工程师、架构师

LoadRunner的Socket脚本关联小技巧

Qt学习（002-1）

那些都是我们必须要经历的

SAN系统拓扑

如何调整Linux系统为正确时区

mysql更新数据库中所有相同的某个字段的值

生成图片缩略图

hibernate查询数据库6种方法

Centos6.3利用iptables配置网关防火墙

SpringAOP 调研过程

镜像源汇总1

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-01-26 17:32:38 当前IP: 3.12.146.166 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我