hadoop 是实现了 mapreduce 的思想,将数据切片计算来处理大量的离线数据。
hadoop处理的数据必须是已经存放在 hdfs 上或者类似 hbase 的数据库中。所以
hadoop 实现的时候是通过移动计算到这些存放数据的机器上来提高效率而 storm
不同,storm 是一个流计算框架。处理的数据是实时消息队列中的,所以须要我们
写好一个 topology 逻辑放在那,接收进来的数据来处理,所以是通过移动数据平均
分配到机器资源来获得高效率。
   
      hadoop 的长处是处理数据量大(瓶颈是硬盘和 namenode,网络等),分析
灵活,可以通过实现 dsl,mdx 等拼接 hadoop 命令或者直接使用 hive。pig 等来
灵活分析数据。适应对大量维度进行组合分析缺点就是慢:每次运行前要分发 jar 
包,hadoop 每次 map 数据超出阙值后会将数据写入本地文件系统,然后在 reduce 
的时候再读进来。
   
   storm 的长处是全内存计算,由于内存寻址速度是硬盘的百万倍以上,所以 storm 
的速度相比較 hadoop 很快(瓶颈是内存。cpu)缺点就是不够灵活:必需要先写
好 topology结构来等数据进来分析。

转载于:https://www.cnblogs.com/wzjhoutai/p/6879821.html

storm与hadoop的对照相关推荐

  1. Storm精华问答 | storm与Hadoop有什么区别?

    戳蓝字"CSDN云计算"关注我们哦! 归于Apache社区,Storm被业界称为实时版Hadoop.随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍.而目前已是分 ...

  2. Storm精华问答 | storm与Hadoop区别?

    戳蓝字"CSDN云计算"关注我们哦! Apache Storm是一个分布式实时大数据处理系统.Storm设计用于在容错和水平可扩展方法中处理大量数据.它是一个流数据框架,具有最高的 ...

  3. 为什么 Storm 比 Hadoop 快?是由哪几个方面决定的?

    https://www.zhihu.com/question/20098507 为什么 Storm 比 Hadoop 快?是由哪几个方面决定的?修改 写补充说明 举报 添加评论 分享 • 邀请回答 按 ...

  4. 大数据之jstorm,storm,hbase,hadoop and so on

    大数据之jstorm,storm,hbase,hadoop and so on ActiveMQ_in_Action__最新版.pdf: http://www.t00y.com/file/766927 ...

  5. 大数据框架对比:Hadoop、Storm、Samza、Spark和Flink——flink支持SQL,待看

    简介 大数据是收集.整理.处理大容量数据集,并从中获得见解所需的非传统战略和技术的总称.虽然处理数据所需的计算能力或存储容量早已超过一台计算机的上限,但这种计算类型的普遍性.规模,以及价值在最近几年才 ...

  6. hadoop lambda_Delta架构:统一Lambda架构并利用Hadoop / REST中的Storm

    hadoop lambda 最近,一群人要求我详细介绍我为我们的书<分布式实时计算的风暴蓝图>撰写的Druid / Storm集成. 德鲁伊很棒. 风暴很棒. 两者一起解决了实时维查询/聚 ...

  7. Delta架构:统一Lambda架构并利用Hadoop / REST中的Storm

    最近,一群人要求我详细介绍我为我们的书<分布式实时计算的风暴蓝图>撰写的Druid / Storm集成. 德鲁伊很棒. 风暴很大. 两者一起解决了实时维查询/聚合问题. 实际上,人们正在将 ...

  8. Hadoop、storm和Spark的区别、比较

    一.hadoop.Storm该选哪一个? 为了区别hadoop和Storm,该部分将回答如下问题: 1.hadoop.Storm各是什么运算 2.Storm为什么被称之为流式计算系统 3.hadoop ...

  9. 【分布式计算】关于Hadoop、Spark、Storm的讨论

    参考资料: 与 Hadoop 对比,如何看待 Spark 技术?:https://www.zhihu.com/question/26568496 还要不要做大数据:http://sinofool.cn ...

最新文章

  1. 真实记录疑似Linux病毒导致服务器 带宽跑满的解决过程
  2. java和php哪个运行更快,java和php哪个入门快?-php教程
  3. python的本质,讨论 - 廖雪峰的官方网站
  4. 使用 System.Net.Http.Json 简化 HttpClient 的使用
  5. Spark函数讲解: combineByKey
  6. linux g++ gcc
  7. cs61a 课时笔记 对象的抽象
  8. c语言中string函数的作用是,c++中的string常用函数用法总结
  9. 恋恋山城 Jean de Florette (1986) 男人的野心 / 弗洛莱特的若望 / 让·德·弗罗莱特 / 水源 下一部 甘泉,玛侬...
  10. 微信Python自动回复代码
  11. java 获取视频时间_java 获取视频时间
  12. 人类简史 从动物到上帝
  13. Python Pytorch
  14. 7-13 旭旭的交友标准PTA
  15. MPEG2相关原理概述
  16. 支付产品理解第二篇——闪付与手机支付
  17. OA办公系统,为企业内部管理“铺桥搭路”
  18. 基于点击量的趋势分析python_【Python数据科学实战项目】之 基于MovieLens的影评趋势分析详解...
  19. 芯片的二线战场:14nm与12nm争夺战
  20. 2018沈阳网络赛:J kachang KD树

热门文章

  1. centos6+ 将程序 注册到 service进行启动 停止 重启等:以nginx为例,添加nginx脚本
  2. core 实例化接口_实例讲解Springboot整合MongoDB进行CRUD操作的两种方式
  3. 别再用代码开发了!整理了30套精美可视化大屏模板,零套路直接领
  4. 详解3种常用数据分析方法,满足你职场95%的高频需求
  5. 帆软报表重要Activator之DesignerStartup
  6. HTML限制输入个数,如何使用CSS(或jQuery,如果需要)限制输入HTML输入的字符数?
  7. 得到选择框句柄 怎么操作_怎么选择小前锋才能在NBA2kol2中使自己的阵容得到提升...
  8. c51转汇编语言窗口,在C51语言中如何嵌入汇编语言
  9. python 两阶段聚类_Python,如何对多元时间序列进行聚类?
  10. hnu 暑期实训之挖掘机技术哪家强