速度

spark把运算的中间数据存放在内存,迭代计算效率更高;MR的中间结果需要落地,需要保存到磁盘,这样必然会有磁盘IO操作,影响性能

容错性

spark容错性高,它通过弹性分布式数据集RDD来实现高效容错,RDD是一组分布式的存储在节点内存中的只读性质的数据集,这些集合是弹性的,某一部分丢失或者出错,可以通过整个数据集的计算流程的血缘关系来实现重建;

MR的话容错可能只能重新计算了,成本较高

适用面

spark更加通用,spark提供了transformation和action这两大类的多个功能的api,另外还有流式处理sparkstreaming模块,图计算GraphX等;MR只提供了map和reduce两种操作,流计算以及其他模块的支持比较缺乏

框架和生态

Spark框架和生态更为复杂,首先由RDD、血缘lineage、执行时的有向无环图DAG、stage划分等等,

很多时候spark作业都需要根据不同的业务场景的需要进行调优,以达到性能要求,MR框架及其生态相对较为简单,对性能的要求也相对较弱,但是运行较为稳定,适合长期后台运行

运行环境:

MR运行在YARN上,

spark

local:本地运行
standalone:使用Spark自带的资源管理框架,运行spark的应用
yarn:将spark应用类似mr一样,提交到yarn上运行
mesos:类似yarn的一种资源管理框架

参考

Spark和MR的区别 - 任重而道远的小蜗牛 - 博客园

Spark与MR的区别相关推荐

  1. 大数据---spark和mr的区别

    首先最核心的两点:内存和磁盘的区别:job中途失败重新计算的区别. ---spark最核心的概念是RDD(弹性分布式数据集),它的所有rdd在并行运算过程程中,可以做到数据共享,也就是可以重复使用mr ...

  2. Spark 和 MR 的区别: 多进程与多线程模型

    精选30+云产品,助力企业轻松上云!>>> 先说结论:Hadoop MapReduce采用了多进程模型,而Spark采用了多线程模型 接下来,来一起分析,这两种模式的区别以及优缺点: ...

  3. Spark和Hadoop的区别和比较

    Spark主要用于大数据的计算,而Hadoop以后主要用于大数据的存储(比如HDFS.Hive.HBase等),以及资源调度(Yarn). Spark的特点: 速度快:Spark基于内存进行计算(当然 ...

  4. 谈谈spark.sql.shuffle.partitions和 spark.default.parallelism 的区别及spark并行度的理解

    谈谈spark.sql.shuffle.partitions和 spark.default.parallelism 的区别及spark并行度的理解 spark.sql.shuffle.partitio ...

  5. [转载]智能科普:VR、AR、MR的区别

    智能科普:VR.AR.MR的区别 http://news.zol.com.cn/553/5534833.html news.zol.com.cn 2015-11-23 16:00 近日, 获得谷歌5亿 ...

  6. Spark:Yarn-cluster和Yarn-client区别与联系

    我们都知道Spark支持在yarn上运行,但是Spark on yarn有分为两种模式yarn-cluster和yarn-client,它们究竟有什么区别与联系?阅读完本文,你将了解. Spark支持 ...

  7. Hive on Spark与SparkSql的区别

    Hive on Spark与SparkSql的区别 hive on spark大体与SparkSQL结构类似,只是SQL引擎不同,但是计算引擎都是spark! 核心代码 #初始化Spark SQL # ...

  8. spark和tez的区别

    MapReduce MapReduce是一种编程模型,mapreduce是hive的默认执行引擎,用于大规模数据集(大于1TB)的并行运算.概念"Map(映射)"和"Re ...

  9. NPL程序设计语言,CNN,RNN,LSTM ,spark和hadoop的区别,云计算,kubeflow

    目录 NPL程序设计语言 深度学习框架建模:CNN,RNN,LSTM spark和hadoop的区别 云计算

最新文章

  1. Goolge新AI算法实时生成3D场景 | 可下载
  2. 微软宣布公开预览Dev Spaces for AKS
  3. 【渝粤题库】国家开放大学2021春3907安全原理题目
  4. php动态获取函数参数
  5. 自定义_如何自定义协议
  6. php设置路径别名,react设置文件路径别名的具体方法你知道么
  7. Python3 - 刷博客访问量脚本
  8. 外设键盘_记得那个被称为‘顶级外设’的国产品牌吗,现在推出这样一把键盘...
  9. HDU-1233-还是畅通工程(最小生成树)
  10. gnss观测质量检查软件下载_【速查】你可能下载了个假“北斗”!
  11. 017—mysql问答
  12. [转载]浅谈敏捷管理在软件项目中应用
  13. 重新想象 Windows 8 Store Apps (23) - 文件系统: 文本的读写, 二进制的读写, 流的读写, 最近访问列表和未来访问列表...
  14. python 股票指标库talib_Talib金融库的使用
  15. oCPC实践录 | 成本优化策略之eCPC(2)
  16. 刷脸支付星星之火可以燎原
  17. Unity 打图集Atlas
  18. 【Pyton安装】Python入门最详细的环境安装(附步骤),按照步骤点,几分钟就可以完成哦~
  19. Qq也进入鸿蒙系统,鸿蒙系统完善进行中,手机QQ接入HMS不需要后台运行秒收信息...
  20. 【unity】动画状态机中Transition的settings两段动画如何设置?

热门文章

  1. Vue打包时报错:ReferenceError: primordials is not defined
  2. 基于stm32的蓝牙遥控智能小车_基于51用蓝牙控制小车(提高篇)
  3. mapbox 加载json数据 和数据中颜色 和高度 并根据数值加载颜色
  4. Android Studio导入so文件到项目中
  5. java c 传递字符串数组_JNI传递字符串数组J-StringArray
  6. centos ipv6 网卡_Linux_03-Centos的基本网络配置
  7. 外键查询_详解MySQL数据库删除所有表的外键约束、禁用外键约束相关脚本
  8. linuxmove命令_linux中mv命令使用详解
  9. 如何获取一个随机数:10 - 99
  10. python前端用什么架构_Python web世界观——web架构概览(适合传统软件工程师)...