Apache Storm简介
由 chalex 创建,小路依依 最后一次修改 2016-12-12
什么是Apache Storm?
Apache Storm是一个分布式实时大数据处理系统。Storm设计用于在容错和水平可扩展方法中处理大量数据。它是一个流数据框架,具有最高的摄取率。虽然Storm是无状态的,它通过Apache ZooKeeper管理分布式环境和集群状态。它很简单,您可以并行地对实时数据执行各种操作。
Apache Storm继续成为实时数据分析的领导者。Storm易于设置和操作,并且它保证每个消息将通过拓扑至少处理一次。
Apache Storm vs Hadoop
基本上Hadoop和Storm框架用于分析大数据。两者互补,在某些方面有所不同。Apache Storm执行除持久性之外的所有操作,而Hadoop在所有方面都很好,但滞后于实时计算。下表比较了Storm和Hadoop的属性。
Storm Hadoop
实时流处理 批量处理
无状态 有状态
主/从架构与基于ZooKeeper的协调。主节点称为nimbus,从属节点是主管。 具有/不具有基于ZooKeeper的协调的主 - 从结构。主节点是作业跟踪器,从节点是任务跟踪器。
Storm流过程在集群上每秒可以访问数万条消息。 Hadoop分布式文件系统(HDFS)使用MapReduce框架来处理大量的数据,需要几分钟或几小时。
Storm拓扑运行直到用户关闭或意外的不可恢复故障。 MapReduce作业按顺序执行并最终完成。
两者都是分布式和容错的
如果nimbus / supervisor死机,重新启动使它从它停止的地方继续,因此没有什么受到影响。 如果JobTracker死机,所有正在运行的作业都会丢失。
使用Apache Storm的例子
Apache Storm对于实时大数据流处理非常有名。因此,大多数公司都将Storm用作其系统的一个组成部分。一些值得注意的例子如下 -
Twitter - Twitter正在使用Apache Storm作为其“发布商分析产品”。 “发布商分析产品”处理Twitter平台中的每个tweets和点击。 Apache Storm与Twitter基础架构深度集成。
NaviSite - NaviSite正在使用Storm进行事件日志监控/审计系统。系统中生成的每个日志都将通过Storm。Storm将根据配置的正则表达式集检查消息,如果存在匹配,那么该特定消息将保存到数据库。
Wego - Wego是位于新加坡的旅行元搜索引擎。旅行相关数据来自世界各地的许多来源,时间不同。Storm帮助Wego搜索实时数据,解决并发问题,并为最终用户找到最佳匹配。
Apache Storm优势
下面是Apache Storm提供的好处列表:
• Storm是开源的,强大的,用户友好的。它可以用于小公司和大公司。
• Storm是容错的,灵活的,可靠的,并且支持任何编程语言。
• 允许实时流处理。
• Storm是令人难以置信的快,因为它具有巨大的处理数据的力量。
• Storm可以通过线性增加资源来保持性能,即使在负载增加的情况下。它是高度可扩展的。
• Storm在几秒钟或几分钟内执行数据刷新和端到端传送响应取决于问题。它具有非常低的延迟。
• Storm有操作智能。
• Storm提供保证的数据处理,即使群集中的任何连接的节点死或消息丢失。

storm简介(大数据技术)相关推荐

  1. Flink简介—大数据技术

    Flink是什么? Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行状态计算. 国内使用Flink的企业,挺多的 为什么要用Flink? 流数据更加符合生活中数据的真实 ...

  2. 大数据技术之_17_Storm学习_Storm 概述+Storm 基础知识+Storm 集群搭建+Storm 常用 API+Storm 分组策略和并发度

    大数据技术之_17_Storm学习 一 Storm 概述 1.1 离线计算是什么? 1.2 流式计算是什么? 1.3 Storm 是什么? 1.4 Storm 与 Hadoop 的区别 1.5 Sto ...

  3. Spark大数据技术与应用 第一章Spark简介与运行原理

    Spark大数据技术与应用 第一章Spark简介与运行原理 1.Spark是2009年由马泰·扎哈里亚在美国加州大学伯克利分校的AMPLab实验室开发的子项目,经过开源后捐赠给Aspache软件基金会 ...

  4. 大数据技术之 HBase简介

    大数据技术之 HBase 第 1 章 HBase 简介 1.1 HBase 定义 HBase 是一种分布式.可扩展.支持海量数据存储的 NoSQL 数据库. 1.2 HBase 数据模型 逻辑上,HB ...

  5. 《Storm技术内幕与大数据实践》作者陈敏敏谈大数据技术在电商领域的应用

    在10月15~17日的QCon上海2015上,1号店资深架构师.<Storm技术内幕与大数据实践>一书作者陈敏敏将分享<1号店通用精准化平台架构以及大数据营销实践>.在大会开始 ...

  6. 大数据技术学习路线,有信心能坚持学习的朋友,从现在开始吧

    如果你看完有信心能坚持学习的话,那就当下开始行动吧! 推荐下我自己建的大数据学习交流群:199427210,群里都是学大数据开发的,如果你正在学习大数据 ,小编欢迎你加入,大家都是软件开发党,不定期分 ...

  7. 大型网站技术架构:核心原理与案例分析 mobi_大数据技术经典学习路线

    如果你看完有信心能坚持学习的话,那就当下开始行动吧! 点击链接加入群聊[大数据学习交流群]:想要在大数据这个领域汲取养分,让自己壮大成长.分享方向,行动以前先分享下一个大数据交流分享资源,欢迎想学习, ...

  8. 水环境模型与大数据技术融合研究

    点击上方蓝字关注我们 水环境模型与大数据技术融合研究 马金锋1, 饶凯锋1, 李若男1,2, 张京1, 郑华1,2 1 中国科学院生态环境研究中心城市与区域生态国家重点实验室,北京 100085 2  ...

  9. 大数据学习路线图 让你精准掌握大数据技术学习

    大数据指不用随机分析法这样捷径,而采用所有数据进行分析处理的方法.互联网时代每个企业每天都要产生庞大的数据,对数据进行储存,对有效的数据进行挖掘分析并应用需要依赖于大数据开发,大数据开发课程采用真实商 ...

  10. 云计算与大数据技术应用前四章知识点整理

    第一章云计算概论 1.1什么是云计算 1.1.1云计算的定义: 定义:指按需使用IT资源和应用程序,通过互联网.按使用量付费. 像水电煤(资源性产品)一样利用你的IT资源,计算存储网络资源. 有三个关 ...

最新文章

  1. .NET Core微服务之基于MassTransit实现数据最终一致性(Part 1)
  2. 数学 计算机工作,不过有人说先学数学,后学计算机后劲足一点,工作也可以的,这估...
  3. [Asp.net]绝对路径和相对路径
  4. HTTP和RPC的优缺点
  5. c++类与类的聚合(Aggregation)关系
  6. surefire 拉起testng单元测试类的源码流程阅读(一)
  7. 用Spring长轮询Tomcat
  8. oracle linux内存推荐分配,[20191114]linux内存分配的讨论.txt
  9. linux机器的物理内存监控,Linux内存监控工具
  10. 深度学习笔记_损失函数softmax和SVM
  11. 应用HTK搭建语音拨号系统2:创建单音素HMM模型
  12. 解决:xml文件单行注释、多行注释问题
  13. canvas图片合成模糊变清晰的方法
  14. 移动设备管理的具体措施有哪些?(下)
  15. 使用数位板遇到的常见问题及解决方法
  16. 产品设计必读书籍推荐
  17. OpenGL学习---高级光照---法线贴图
  18. 计算机网络专题讲座,我院举行《计算机网络新技术》专题讲座
  19. 7.23翻倍奖励——滴滴快车单(成交率≥60%,≥5指派单)
  20. 使用更便捷的时间序列预测模型 2022-6-2

热门文章

  1. sql 数据库 实例删除
  2. vue 横向菜单滚动定位_使用vue组件+iscroll实现一个横向菜单,不能正确滑动
  3. java lock接口_Java Lock接口
  4. ios yymodel 将字典转数组模型_TensorNet——基于TensorFlow的大规模稀疏特征模型分布式训练框架
  5. 树莓派Raspbian Buster/Debian 10 安装ROS
  6. VC6 + OpenCV1.0实现图片缩放显示
  7. gcc编译选项-Os的用法
  8. element-ui 设置table width %百分比
  9. [react] react是什么?它的主要特点是什么?
  10. 前端学习(3317):connect 2