2019独角兽企业重金招聘Python工程师标准>>>

Spark基于这样的理念,当数据庞大时,把计算过程传递给数据要比把数据传递给计算过程要更富效率。每个节点存储(或缓存)它的数据集,然后任务被提交给节点。

所以这是把过程传递给数据。这和Hadoop map/reduce非常相似,除了积极使用内存来避免I/O操作,以使得迭代算法(前一步计算输出是下一步计算的输入)性能更高。

Shark只是一个基于Spark的查询引擎(支持ad-hoc临时性的分析查询)

而Storm的架构和Spark截然相反。Storm是一个分布式流计算引擎。每个节点实现一个基本的计算过程,而数据项在互相连接的网络节点中流进流出。和Spark相反,这个是把数据传递给过程。

两个框架都用于处理大量数据的并行计算。

Storm在动态处理大量生成的“小数据块”上要更好(比如在Twitter数据流上实时计算一些汇聚功能或分析)。

Spark工作于现有的数据全集(如Hadoop数据)已经被导入Spark集群,Spark基于in-memory管理可以进行快讯扫描,并最小化迭代算法的全局I/O操作。

不过Spark流模块(Streaming Module)倒是和Storm相类似(都是流计算引擎),尽管并非完全一样。

Spark流模块先汇聚批量数据然后进行数据块分发(视作不可变数据进行处理),而Storm是只要接收到数据就实时处理并分发。

不确定哪种方式在数据吞吐量上要具优势,不过Storm计算时间延迟要小。

总结下,Spark和Storm设计相反,而Spark Steaming才和Storm类似,前者有数据平滑窗口(sliding window),而后者需要自己去维护这个窗口。

转载于:https://my.oschina.net/u/2338362/blog/508017

两款高性能并行计算引擎Storm和Spark比较相关推荐

  1. 推动RISC-V拾级而上 赛昉科技发布两款高性能产品: JH7110多媒体处理器与VisionFive 2开发板

    推动RISC-V拾级而上  赛昉科技发布两款高性能产品 8月23日,RISC-V领域迎来重大突破.RISC-V软硬件生态领导者赛昉科技在线举办2022新产品发布会,揭晓两款重磅新品:全球首款量产高性能 ...

  2. 中国RISC-V机遇与变革下,赛昉科技发布两款高性能新品

    8月23日,专注于RISC-V芯片研发的赛昉科技举办2022新产品发布会,发布两款重磅新品:全球首款量产高性能RISC-V多媒体处理器--昉·惊鸿7110(JH7110),和全球性能最高的量产RISC ...

  3. WIN7+VS2010编译两款2D游戏引擎 风魂和HGE(C++源码)

    大名鼎鼎的两款2D引擎不用多介绍了.只是原版的源代码编译环境vc6.0很多无法通过. 所以这次将WIN7+VS2010编译通过的源代码放上.并附上自己找的一些例程源代码 风魂引擎 Xz_说明中添加了一 ...

  4. Hadoop、storm和Spark的区别、比较

    一.hadoop.Storm该选哪一个? 为了区别hadoop和Storm,该部分将回答如下问题: 1.hadoop.Storm各是什么运算 2.Storm为什么被称之为流式计算系统 3.hadoop ...

  5. NS 宣布推出两款 Boomer D 类音频子系统

    NS 宣布推出两款 Boomer D 类音频子系统 美国国家半导体公司(National Semiconductor Corporation)宣布推出两款高性能.低功率 Boomer® D 类音频子系 ...

  6. 沙漠之鹰和战术匕首--两款前端极简模板引擎

    一.前言 说起前端模板引擎,那可真是多如牛毛,只要是前端coder,怎么着你都听说或用过几款,社区里面的文章也有介绍,或者问问度娘,这里不再赘述.其中比较知名的有 artTemplate.doT.mu ...

  7. 从Storm和Spark 学习流式实时分布式计算的设计

    转自:http://www.dataguru.cn/thread-341168-1-1.html 流式实时分布式计算系统在互联网公司占有举足轻重的地位,尤其在在线和近线的海量数据处理上.而处理这些海量 ...

  8. 国产GPU添新玩家,AMD出身,两款业界第一7nm芯片曾由他打造

    金磊 发自 凹非寺 量子位 | 公众号 QbitAI 他在现场只是播放了一张的演讲内容. 竟引得众人不约而同,纷纷高举手机拍照,会场更是掌声不断. 他叫钱军,很多人熟知这个名字,是因为他曾在AMD担任 ...

  9. Flink及Storm、Spark主流流框架比较-实时框架比较

    实时计算框架对比 - flink,storm,spark 三者的区别 我相信有不少的工程师都有着这样的处境,在学flink之前很好奇flink,storm,spark的区别是什么,为什么现在很多企业都 ...

最新文章

  1. mysql grant教程_MySQL如何使用授权命令grant
  2. wicket_Wicket模型的干净方法
  3. ZooKeeper--分层仲裁简介
  4. sublime text3设置空格和tab键
  5. Python 用Django创建自己的博客(2)
  6. python pyfile py_Python中py文件引用另一个py文件变量的方法
  7. 企业级PHP后台开发框架
  8. python中日期转换,python中常用到的时间日期格式转换!
  9. cookie获取失败(时间差导致的cookie失效)
  10. 信息安全从业者书单推荐(2020.6.28更新)
  11. 程序员讲装修内容思路
  12. 揭秘北京龙泉寺,连清华北大学子都排队出家的神秘科研组织
  13. Mac和Windows哪个好 ?windows和mac对比介绍
  14. 如何1人5天开发完3D数据可视化大屏 【一】
  15. HtmlEditor在线编辑器V3.0提供
  16. win10微软图标点击无反应_Win10系统点击无线图标没反应的解决方法
  17. 【国产之光】:龙芯1B(嵌入式方向)
  18. 世界星载SAR发展2——SeaSat(1978,美国)
  19. 完成RPA类产品设计需要解决哪些技术问题
  20. vue微信分享给朋友,朋友圈自定义网页链接url改变了

热门文章

  1. Windows驱动开发 - 内核模式下的字符串操作
  2. Windows 公共控件库研究
  3. 图解Oracle同义词
  4. 在虚拟机中温习DOS
  5. linux进程篇 (二) 进程的基本控制
  6. BZOJ 2820 YY的GCD 莫比乌斯反演
  7. python venv下安装mysql出错 解决方法
  8. Extjs--FormPanel(2)
  9. rgb565和rgb555的文件头区别_Windows可执行文件格式
  10. c语言数组在栈上的分配,彻底弄懂为什么不能把栈上分配的数组(字符串)作为返回值...