戳蓝字“CSDN云计算”关注我们哦!

Apache Storm是一个分布式实时大数据处理系统。Storm设计用于在容错和水平可扩展方法中处理大量数据。它是一个流数据框架,具有最高的摄取率。今天,我们就挑一些Storm的安装配置问题来看看吧。

1

  Q:Storm简介


A:1.Storm是一套分布式的、可靠的,可容错的用于处理流式数据的系统。

2.Storm也是基于C/S架构来进行工作的,C负责将数据处理的方式的jar(Topology)发送给S,S解析C发送过来的jar(Topology),并按一定规则jar变成多个Task((Spout/Bolt)),生成相关的进程和线程运行里面的Task。

2

Q:topology工作原理

A:1.Storm集群中有两种节点,一种是控制节点(Nimbus节点),另一种是工作节点(Supervisor节点)。 
2.所有Topology任务的 提交必须在Storm客户端节点上进行(需要配置 storm.yaml文件),由Nimbus节点分配给其他Supervisor节点进行处理。 
3.Nimbus节点首先将提交的Topology进行分片(Spout/Bolt),分成一个个的Task,并将Task和Supervisor相关的信息提交到 zookeeper集群上。 
4.Supervisor会去zookeeper集群上认领自己的Task,通知自己的Worker进程进行Task的处理。

3

       Q:Storm有哪些特性?


A: 1.适用场景广泛: storm可以实时处理消息和更新DB,对一个数据量进行持续的查询并返回客户端(持续计算),对一个耗资源的查询作实时并行化的处理(分布式方法调用,即DRPC),storm的这些基础API可以满足大量的场景。

2. 可伸缩性高:  Storm的可伸缩性可以让storm每秒可以处理的消息量达到很高。扩展一个实时计算任务,你所需要做的就是加机器并且提高这个计算任务的并行度 。Storm使用ZooKeeper来协调集群内的各种配置使得Storm的集群可以很容易的扩展。

3. 保证无数据丢失: 实时系统必须保证所有的数据被成功的处理。 那些会丢失数据的系统的适用场景非常窄, 而storm保证每一条消息都会被处理, 这一点和S4相比有巨大的反差。

4. 异常健壮: storm集群非常容易管理,轮流重启节点不影响应用。

5. 容错性好:在消息处理过程中出现异常, storm会进行重试

6. 语言无关性: Storm的topology和消息处理组件(Bolt)可以用任何语言来定义, 这一点使得任何人都可以使用storm。

4

Q:Storm的集群结构

A:

5

  Q:为什么要用Storm?为什么不用Spark?

  

  A:很多场景下,我们希望系统能够实时的处理一条数据、甚至是事务。也就是说,在处理数据、事务的过程中,到达系统,并能马上得到结果。其次,在成万上亿条数据大量涌入系统时,也要求“实时”的到事务处理的结果。此时,单个节点已经是杯水车薪了,而Storm的关键一项是因为它支持分布式并行计算!如果说,你遇到了以上相似的场景,那Storm可以当仁不让的扛起实时处理的大旗!

这个问题其实很难界定,因为Spark在RDD粒度上,可以满足实时计算的要求,当然,使用RDD还有其他优势;但总的来说,Storm 的实时性更强。其次,Storm的框架完全按照流式处理的思想构建,和项目场景结合性更强一些。(Spark 用的不是很多,欢迎吐槽。)

在看Storm之前,很多人都对Hadoop有一定了解,为了能更快入戏,我们以Hadoop为参照,以下是它使用yarn之前的架构,对照Storm Server框架理解。

小伙伴们冲鸭,后台留言区等着你!

关于Storm,今天你学到了什么?还有哪些不懂的?除此还对哪些话题感兴趣?快来留言区打卡啦!留言方式:打开第XX天,答:……

同时欢迎大家搜集更多问题,投稿给我们!风里雨里留言区里等你~

福利

扫描添加小编微信,备注“姓名+公司职位”,加入【云计算学习交流群】,和志同道合的朋友们共同打卡学习!

推荐阅读:

  • 同样是消息队列,Kafka凭什么速度那么快?

  • 苹果宣布加入CNCF;华为要求美国运营商支付专利费;微软删除最大的公开人脸识别数据集

  • 如何给老婆解释什么是微服务?

  • 任正非:华为 100% 没有后门

  • 阿里巴巴杨群:高并发场景下Python的性能挑战

  • 那些去德国的程序员后来怎么样了?

  • 新技术“红”不过十年,半监督学习为什么是个例外?

  • 独家对话V神! 质疑之下的以太坊路在何方?

真香,朕在看了!

Storm精华问答 | 为什么要用Storm?不用Spark?相关推荐

  1. Storm精华问答 | 为什么这么多人用Spark而不用Storm?

    戳蓝字"CSDN云计算"关注我们哦! Storm被业界称为实时版Hadoop.随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,以及大数据实时处理解决方案的应用日 ...

  2. Storm精华问答 | storm与Hadoop有什么区别?

    戳蓝字"CSDN云计算"关注我们哦! 归于Apache社区,Storm被业界称为实时版Hadoop.随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍.而目前已是分 ...

  3. Storm精华问答 | 如何处理常见故障?

    Hadoop能够进行大批量数据的离线处理,但是在实时计算上的表现实在是不尽如人意;而Storm就可以担当这部分的角色,今天,就让我们看看关于Storm的精华问答吧. 1 Q:发布topology到远程 ...

  4. Storm精华问答 | task与executor有什么关系?

    戳蓝字"CSDN云计算"关注我们哦! 归于Apache社区,Storm被业界称为实时版Hadoop.随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍.而目前已是分 ...

  5. Storm精华问答 | storm与Hadoop区别?

    戳蓝字"CSDN云计算"关注我们哦! Apache Storm是一个分布式实时大数据处理系统.Storm设计用于在容错和水平可扩展方法中处理大量数据.它是一个流数据框架,具有最高的 ...

  6. Storm精华问答 | Storm如何连接MySQL?

    Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop.随着越来越多的场景对Hadoop的MapReduce高延迟无法容忍,大数据实时处理解决方案的应用日趋广泛,目前已 ...

  7. Storm精华问答 | 如何理解spout/bolt的生命周期?

    戳蓝字"CSDN云计算"关注我们哦! Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop.随着越来越多的场景对Hadoop的MapReduce高 ...

  8. Storm精华问答 | Storm的配置需要注意什么问题?

    戳蓝字"CSDN云计算"关注我们哦! Apache Storm是一个分布式实时大数据处理系统.Storm设计用于在容错和水平可扩展方法中处理大量数据.它是一个流数据框架,具有最高的 ...

  9. Storm精华问答 | 最火的流式处理框架——Storm

    戳蓝字"CSDN云计算"关注我们哦! Storm是Twitter开源的分布式实时大数据处理框架,被业界称为实时版Hadoop.  今天就为大家带来Storm诞生到发展再到实践,赶快 ...

最新文章

  1. javascript 利用 - 枚举思想 - 添加地名的一个小例子
  2. python 多线程日志切割+日志分析
  3. 为什么应该学习Kotlin
  4. Python 打印不换行
  5. JAVA 的读取Excel方法_纯Java的方式读取excel2007
  6. python打包exe报错_python 程序打包为 windows 可执行程序 exe
  7. oracle数据库存储管理总结,oracle数据库存储管理
  8. SQL Server 2019中的图形数据库功能–第1部分
  9. Atitit 艺术与编程艺术 项目工程艺术 1. 艺术可以分为造型艺术、表演艺术、综合艺术和语言艺术四大类。 1 2. 造型艺术 10 2 2.1. (一) 绘画和雕塑  11 2 2.2. (二
  10. 小区防盗系统 c语言,住宅小区防盗报警系统方案以及系统组成
  11. [远程桌面]程mstsc连接Windows Server2008 未安装任何音频输出设备 启用声音音频解决
  12. c# meiju(摘)
  13. 英语作文《健康的重要性》
  14. edge浏览器整理收藏夹 找不到收藏夹
  15. 创业者李一男:过去的荣耀早已归零
  16. 如何一键远程开机,远程唤醒功能
  17. 偏移出来的数据不准_cad偏移(cad偏移数据和输入的数据不准确)
  18. 什么是MVVM模式?
  19. 机器学习的相关代码汇总
  20. 正定矩阵、负定矩阵、半正定矩阵、半负定矩阵

热门文章

  1. java floyd_百度百科里面的floyd算法java的代码,总是无法运行。请问是代码有问题吗,如何编译啊?...
  2. yii2 mysql update_yii2 + mysql 常用增删改查操作语法以及事务
  3. 惊艳!28岁就任副教授,年纪轻轻已是博导、院长
  4. 区块链跟银行有什么关系?
  5. 深度学习(2)--常见概率分布(2)
  6. 【java机器学习】支持向量机之拉格朗日乘子法解释
  7. 算法6:只有五行的Floyd最短路算法
  8. C++11并发实战(专栏)
  9. 面向切面编程--AOP(二)
  10. C++面试/技巧(四)