1 ,两种大数据框架 :

  1. 批处理 : 一批数据一起,走一波
    例如 : mr
  2. 实时处理 : 不停走,来一个数据,走一波
    例如 :storm

2 ,storm 特征 : 快,实时

  1. Storm 是个实时的、分布式以及具备高容错的计算系统
  2. Storm 进程常驻内存
  3. Storm 数据不经过磁盘,在内存中处理

3 ,官网 :

http://storm.apache.org/

4 ,storm 架构 :

  1. Nimbus : 主节点进程,老板
  2. Supervisor : 分节点守护进程,分店店长
  3. Worker : 工作进程 ,工人

5 ,编程模型 :

DAG ( Topology ) :有向无环图
Spout : 起点
Bolt : 每个数据处理节点 ( 为了保证实时性,每个 bolt 的逻辑不宜太复杂 )

6 ,数据传输

  1. ZMQ( twitter早期产品 ,已经不用 )
    ZeroMQ 开源的消息传递框架,并不是一个MessageQueue
  2. Netty ( 正在使用 )
    Netty是基于NIO的网络框架,更加高效。(之所以Storm 0.9版本之后使用Netty,是因为ZMQ的license和Storm的license不兼容。)

7 ,高可靠性

  1. 异常处理
  2. 消息可靠性保障机制 ( ACK :消息确认机制 )

8 ,可维护性

StormUI 图形化监控接口

9 ,流式处理(异步 与 同步)

客户端提交数据进行结算,并不会等待数据计算结果

10 ,逐条处理

例:ETL(数据清洗)extracted transform load

11 ,统计分析

例:计算PV、UV、访问热点 以及 某些数据的聚合、加和、平均等
客户端提交数据之后,计算完成结果存储到Redis、HBase、MySQL或者其他MQ当中,
客户端并不关心最终结果是多少。

12 ,实时请求应答服务(同步)

客户端提交数据请求之后,立刻取得计算结果并返回给客户端

13 ,实时性比较 :

  1. storm : 实时处理
  2. spark : 微批处理
  3. mr : 批处理
框架 storm sparkStreaming mapReduce
处理数据方式 流式处理 微批处理 批处理
耗费时间 毫秒级 秒级 分钟级
特征 专门做实时计算,常驻内存 可以很好的与别的组件结合 mr 模型,反复启停

1 ,storm 框架介绍相关推荐

  1. 一、Hadoop框架介绍

    OK~从今天开始,我们就开始我们的破茧成蝶--大数据篇系列的博客编写,今天是第一篇,开篇为<Hadoop框架介绍>,Hadoop系列将会收录在<破茧成蝶--大数据篇>专栏中.下 ...

  2. python爬虫scrapy框架教程_Python爬虫教程-30-Scrapy 爬虫框架介绍

    从本篇开始学习 Scrapy 爬虫框架 Python爬虫教程-30-Scrapy 爬虫框架介绍 框架:框架就是对于相同的相似的部分,代码做到不出错,而我们就可以将注意力放到我们自己的部分了 常见爬虫框 ...

  3. 2019年上半年收集到的人工智能开源框架介绍文章

    2019年上半年收集到的人工智能开源框架介绍文章 TensorFlow基本使用 TensorFlow.js:让你在浏览器中也能玩转机器学习 人工智能学习框架TensorFlow渐近分析 TensorF ...

  4. ESFramework网络通信框架介绍之(2)――网络通信消息NetMessage

    ESFramework网络通信框架与元数据 较之C++而言,.NET是一个更加"动态"的平台,其动态能力建立在反射机制之上,而反射的基础是"元数据". 上文已经 ...

  5. dommel mysql_.Net Core AA.FrameWork应用框架介绍

    开发多年,一直在从社区获取开源的便利,也深感社区力量的重要性,今天开源一个应用基础框架AA.FrameWork,也算是回馈社区,做出一点点贡献,希望能够帮助类似当年入行的我. AA.FrameWork ...

  6. Foundation框架介绍

    Foundation框架介绍 前言 在开发初期,个人发现开发主要涉及到这几个方面:语言语法使用.UIKit.Foundation, 语言是开发基础,UIkit主要负责用户界面设计,其他最常用的就是Fo ...

  7. 【Django】创建项目及框架介绍,学习笔记(一)

    [学习教程] 1.Django基础教程:https://code.ziqiangxuetang.com/django/django-tutorial.html 2.Django博客:http://ww ...

  8. 流行的9个Java框架介绍: 优点、缺点等等

    流行的9个Java框架介绍: 优点.缺点等等 在 2018年,Java仍然是世界上最流行的编程语言.它拥有一个巨大的生态系统,在全世界有超过900万Java开发人员.虽然Java不是最直接的语言,但是 ...

  9. iOS流媒体直播整个框架介绍(HLS、RTSP)

    iOS流媒体直播整个框架介绍(HLS.RTSP) 目录技术文章2016年7月17日 一.HTTP(WebService) 基于HTTP的渐进下载Progressive Download流媒体播放仅是在 ...

最新文章

  1. 无人驾驶推进时间表及五大技术领域关键节点
  2. carafe 上采样
  3. leetcode111 爬楼梯 python实现
  4. 在WPF中处理Windows消息
  5. [转]Myeclipse9引入easy_ui时,其中的部分js文件报错
  6. 宝贝,我帮你清了购物车哦!
  7. mysql 正则regrx_正则表达式
  8. QT4.8.5 显示中文
  9. 力扣232. 用栈实现队列(JavaScript)
  10. 【codeforces】【比赛题解】#872 CF Round #440 (Div.2)
  11. ajax页面无刷新分页,JS+Ajax+Jquery实现页面无刷新分页以及分组 超强的实现
  12. 推送数据分析全新升级,优化方向一目了然
  13. 想要下载,却没有积分,CSDN你做个人吧
  14. 《微习惯:简单到不可能失败的自我管理法则》读书小结
  15. 新CCF-CSP认证历年真题解
  16. 360安全卫士指控QQ侵犯用户隐私
  17. Yahoo!团队实践分享:网站性能优化的35条黄金守则
  18. java通过poi导出excel和pdf
  19. 简图 新聚合图床源码 自带鉴黄功能
  20. opencv 提取彩色图像轮廓

热门文章

  1. java 调用 su,java调用外部应用程序
  2. 二层网络及三层网络的子网掩码设置原则
  3. linux软件 mac地址,Linux MAC地址
  4. python中jieba库的安装
  5. 牛顿下山法求解非线性方程(组)(C实现)
  6. STM32控制NRF24L01无线模块进行通信
  7. H.264笔记整理3
  8. proftpd的SSH_DISCONNECT (Read TImed out,Key exchange failed.错误解决
  9. 路径和(cdq分治)
  10. 什么是接口测试?测试人员为什么要做接口测试?