1、现象:生产中分别部署了两台服务器,独立运行storm,然后拓扑程序提交是本地模式,发现不用启动storm和zookeeper也可以运行;

#jps  没有下面进程
 QuorumPeerMain  //zookeeper进程
 supervisor  
 nimbus

2、验证:在拓扑程序中增加参数传递,1代表本地模式,2代表集群模式

1)关闭集群后,传参1运行本地模式成功,传参2运行集群模式失败;

2)启动集群后,传参2集群模式提交运行,成功;

本地模式:不用启动storm和zookeeper集群
  storm jar /tmp/glabeling.jar com.glabeling.GlabelingInfoTopology -N 1-C /tmp/glabeling.xml > /tmp/storm.logs
   集群模式:需启动storm和zookeeper集群
storm jar /tmp/glabeling.jar com.glabeling.GlabelingInfoTopology -N 2 -C /tmp/glabeling.xml > /tmp/storm.logs

3、过程中,对zookeeper作用记录下:

Storm中使用Zookeeper主要用于Storm集群各节点的分布式协调工作,具体功能如下:
(1)存储客户端提供的topology任务信息,nimbus负责将任务分配信息写入Zookeeper,supervisor从Zookeeper上读取任务分配信息;
(2)存储supervisor和worker的心跳(包括它们的状态),使得nimbus可以监控整个集群的状态, 从而重启一些挂掉的worker;
(3)存储整个集群的所有状态信息和配置信息。

在线实时大数据平台Storm本地模式运行的一个小发现相关推荐

  1. 在线实时大数据平台Storm集群组件学习

    Hadoop常用于离线的复杂的大数据处理,Spark常用于离线的快速(轻量级)的大数据处理, Storm常用于在线的实时的大数据处理:这句话一定程度上反应了三套大数据平台的鲜明特征.Storm是一套实 ...

  2. 在线实时大数据平台Storm并行和通信机制理解

    1.storm系统角色和应用组件基本理解: 和Hadoop一起理解,清晰点. 1)物理节点Nimubus,负责资源分配和任务调度: 2)物理节点Supervisor负责接受nimbus分配的任务,启动 ...

  3. 在线实时大数据平台Storm输入源共享试验

    1.背景:topology程序提交集群模式运行试验,验证在同一文件输入源情况下,worker之间是否会重复输入处理,以及数据变量能否在不同worker之间共享,如果文件新增数据,topology会不会 ...

  4. 在线实时大数据平台Storm集成redis开发(分布锁)

    1.需求场景:spout从ftp列表中拿到未读取的文件读取并发射行到Bolt,bolt进行业务处理后提交下一Bolt入库.用redis主要是:保存文件列表对象,使用分布锁来同步互斥访问共享对象,使文件 ...

  5. 在线实时大数据平台Storm并行度试验

    集群模式试验:同一文件输入数据如何处理,数据变量共享 1)集群模式一个worker内一个spout一个Bolt jps:1个worker storm list:1个wokers,4个tasks 2)集 ...

  6. 在线实时大数据平台Storm开发之wordcount

    可以在Eclipse下通过Maven引入storm-starter项目,这里直接将storm目录下lib中的jar包引入到工程中. 由于storm-core-1.0.1.jar中带有default.y ...

  7. 在线实时大数据平台Storm单机部署

    centos单机下部署storm,主要用于开发测试用.部署的IP地址用zoo1代替,要注意/etc/hosts下对应ip和主机名. 1.Zookeeper部署 Apache官网http://zooke ...

  8. 在线实时大数据平台Storm版本兼容的问题

    部署了storm1.0.1最新版,但原来生产的程序是storm0.8.2版本并在该版本环境中运行,直接将程序放到1.0.1环境中storm jar运行失败. 重构程序,引入storm-core-1.0 ...

  9. 工商银行实时大数据平台建设历程及展望

    ‍ 摘要:本文整理自中国工商银行大数据平台负责人袁一在 Flink Forward Asia 2021 的分享.主要内容包括: 工行实时大数据平台建设历程 工行实时大数据平台建设思路 展望 Tips: ...

最新文章

  1. Linux下的版本升级只是浮云
  2. js/jq进行日期格式化为:yyyy-MM-dd 如2017-05-08
  3. 【学术相关】不喜欢做研究,到底要不要读博士?
  4. cloudera manager 及CDH卸载
  5. 几种在不同的位置打开 SAP HANA Database explorer 的办法
  6. hibernate与jpa_将JPA Hibernate与OptaPlanner集成
  7. 【Python CheckiO 题解】Text Editor
  8. python基本的信号与槽函数的使用 信号发射 槽函数接收
  9. ligerui_ligerTree_005_动态增加“树”节点
  10. c语言标准库assert,C 标准库 - assert.h
  11. smarty手册-smarty中foreach循环语句详解
  12. php如何实现文件操作,php实现操作文件的各种方式总结(附代码)
  13. 【硬件】推荐软件『软硬件的基准测试工具』
  14. 分页缓冲池内存过高_揭秘:为什么新买的8G内存却显示4G可用,是系统出错还是被人坑了?...
  15. 阿里云Kubernetes SpringCloud 实践进行时(5): 弹性服务与容错处理
  16. VC2010 Tab控件使用
  17. 海康工业相机USB接口连接Halcon21后,海康MVS客户端无法打开,如何解决
  18. 美通社企业新闻汇总 | 2019.1.3
  19. java list 索引值_List中固定某个索引的值-简单替换位置
  20. 经典S Q L语句大全

热门文章

  1. 数据库系统概论:第十章 数据库恢复技术
  2. asyncdata连接php,如何使用Nuxt和asyncData观察路由更改
  3. java表底层生产工具_使用Java工具解决生产故障(一)-jcmd介绍
  4. Ansible之playbook(剧本)介绍和配置详解
  5. 在IIS上搭建WebSocket服务器(三)
  6. 负数赋值给无符号数的陷阱【转】
  7. [转]Outlook HTML渲染
  8. Ubuntu编译安装VASP
  9. Linux内核开发之将驱动程序添加到内核
  10. WinCE下多份BSP的维护技巧