淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用Mysql作为消息存储媒介。可全然水平扩容,为了进一步减少成本。我们觉得存储部分能够进一步优化,2011年初,Linkin开源了Kafka这个优秀的消息中间件。淘宝中间件团队在对Kafka做过充分Review之后,Kafka无限消息堆积,高效的持久化速度吸引了我们,可是同一时候发现这个消息系统主要定位于日志传输,对于使用在淘宝交易、订单、充值等场景下还有诸多特性不满足。为此我们又一次用Java语言编写了RocketMQ,定位于非日志的可靠消息传输(日志场景也OK),眼下RocketMQ在阿里集团被广泛应用在订单,交易,充值。流计算,消息推送,日志流式处理。binglog分发等场景。

为了方便大家选型。整理一份RocketMQ与Kafka的对照文档,文中如有错误之处,欢迎来函指正。

vintage.wang@gmail.com

数据可靠性

RocketMQ支持异步实时刷盘,同步刷盘。同步Replication,异步Replication
Kafka使用异步刷盘方式。异步Replication

总结:RocketMQ的同步刷盘在单机可靠性上比Kafka更高,不会由于操作系统Crash,导致数据丢失。

同一时候同步Replication也比Kafka异步Replication更可靠。数据全然无单点。另外Kafka的Replication以topic为单位,支持主机宕机,备机自己主动切换,可是这里有个问题,由于是异步Replication,那么切换后会有数据丢失。同一时候Leader假设重新启动后。会与已经存在的Leader产生数据冲突。开源版本号的RocketMQ不支持Master宕机,Slave自己主动切换为Master,阿里云版本号的RocketMQ支持自己主动切换特性。

性能对照

Kafka单机写入TPS约在百万条/秒,消息大小10个字节
RocketMQ单机写入TPS单实例约7万条/秒。单机部署3个Broker。能够跑到最高12万条/秒,消息大小10个字节

总结:Kafka的TPS跑到单机百万。主要是因为Producer端将多个小消息合并,批量发向Broker。

RocketMQ为什么没有这么做?

Producer通常使用Java语言,缓存过多消息,GC是个非常严重的问题
Producer调用发送消息接口,消息未发送到Broker,向业务返回成功,此时Producer宕机,会导致消息丢失。业务出错
Producer通常为分布式系统,且每台机器都是多线程发送,我们觉得线上的系统单个Producer每秒产生的数据量有限。不可能上万。

缓存的功能全然能够由上层业务完毕。

单机支持的队列数

Kafka单机超过64个队列/分区。Load会发生明显的飙高现象,队列越多。load越高,发送消息响应时间变长
RocketMQ单机支持最高5万个队列。Load不会发生明显变化

队列多有什么优点?

单机能够创建很多其它Topic。由于每一个Topic都是由一批队列组成
Consumer的集群规模和队列数成正比,队列越多,Consumer集群能够越大

消息投递实时性

Kafka使用短轮询方式,实时性取决于轮询间隔时间
RocketMQ使用长轮询,同Push方式实时性一致,消息的投递延时通常在几个毫秒。

消费失败重试

Kafka消费失败不支持重试
RocketMQ消费失败支持定时重试,每次重试间隔时间顺延

总结:比如充值类应用,当前时刻调用运营商网关。充值失败,可能是对方压力过多,稍后在调用就会成功,如支付宝到银行扣款也是类似需求。

这里的重试须要可靠的重试,即失败重试的消息不由于Consumer宕机导致丢失。

严格的消息顺序

Kafka支持消息顺序,可是一台Broker宕机后。就会产生消息乱序
RocketMQ支持严格的消息顺序。在顺序消息场景下。一台Broker宕机后。发送消息会失败。可是不会乱序

Mysql Binlog分发须要严格的消息顺序

定时消息

Kafka不支持定时消息
RocketMQ支持两类定时消息
开源版本号RocketMQ仅支持定时Level
阿里云ONS支持定时Level,以及指定的毫秒级别的延时时间

分布式事务消息

Kafka不支持分布式事务消息
阿里云ONS支持分布式定时消息,未来开源版本号的RocketMQ也有计划支持分布式事务消息

消息查询

Kafka不支持消息查询
RocketMQ支持依据Message Id查询消息。也支持依据消息内容查询消息(发送消息时指定一个Message Key,随意字符串,比如指定为订单Id)

总结:消息查询对于定位消息丢失问题很有帮助,比如某个订单处理失败,是消息没收到还是收到处理出错了。

消息回溯

Kafka理论上能够依照Offset来回溯消息
RocketMQ支持依照时间来回溯消息,精度毫秒。比如从一天之前的某时某分某秒開始又一次消费消息

总结:典型业务场景如consumer做订单分析。可是因为程序逻辑或者依赖的系统发生问题等原因,导致今天消费的消息所有无效,须要又一次从昨天零点開始消费,那么以时间为起点的消息重放功能对于业务很有帮助。

消费并行度

Kafka的消费并行度依赖Topic配置的分区数。如分区数为10。那么最多10台机器来并行消费(每台机器仅仅能开启一个线程),或者一台机器消费(10个线程并行消费)。

即消费并行度和分区数一致。

RocketMQ消费并行度分两种情况
顺序消费方式并行度同Kafka全然一致
乱序方式并行度取决于Consumer的线程数。如Topic配置10个队列。10台机器消费,每台机器100个线程,那么并行度为1000。

消息轨迹

Kafka不支持消息轨迹
阿里云ONS支持消息轨迹

开发语言友好性

Kafka採用Scala编写
RocketMQ採用Java语言编写

Broker端消息过滤

Kafka不支持Broker端的消息过滤
RocketMQ支持两种Broker端消息过滤方式
依据Message Tag来过滤。相当于子topic概念
向server上传一段Java代码,能够对消息做随意形式的过滤,甚至能够做Message Body的过滤拆分。

消息堆积能力

理论上Kafka要比RocketMQ的堆积能力更强。只是RocketMQ单机也能够支持亿级的消息堆积能力。我们觉得这个堆积能力已经全然能够满足业务需求。

开源社区活跃度

Kafka社区更新较慢
RocketMQ的github社区有250个个人、公司用户登记了联系方式。QQ群超过1000人。https://github.com/alibaba/RocketMQ/issues/1

商业支持

Kafka原开发团队成立新公司,眼下暂没有相关产品看到
RocketMQ在阿里云上已经开放公測近半年,眼下以云服务形式免费供大家商用。并向用户承诺99.99%的可靠性。同一时候彻底攻克了用户自己搭建MQ产品的运维复杂性问题。 http://www.aliyun.com/product/ons

成熟度

Kafka在日志领域比較成熟
RocketMQ在阿里集团内部有大量的应用在使用。每天都产生海量的消息,而且顺利支持了多次天猫双十一海量消息考验。是数据削峰填谷的利器。

转自【https://github.com/alibaba/RocketMQ/wiki/rmq_vs_kafka】

Ali RocketMQ与Kafka对照相关推荐

  1. Ali RocketMQ与Kafka对比

    淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用Mysql作为消息存储媒介,可完全水平扩容,为了进一步降低成本,我们认为存储部分可以进一步优化,2011年初,Linkin开源了Kaf ...

  2. 事务消息大揭秘!RocketMQ、Kafka、Pulsar全方位对比

    导语 | 事务是一个程序执行单元,里面的所有操作要么全部执行成功,要么全部执行失败.RocketMQ.Kafka和Pulsar都是当今业界应用十分广泛的开源消息队列(MQ)组件,笔者在工作中遇到关于M ...

  3. RocketMQ与Kafka对比(18项差异)

    转自:https://github.com/alibaba/RocketMQ/wiki/rmq_vs_kafka 淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用MySQL作为消息存 ...

  4. 浅谈 RocketMQ、Kafka、Pulsar 的事务消息

    作者:ruoyuliu刘若愚,腾讯 WXG 后台开发工程师 导语 事务是一个程序执行单元,里面的所有操作要么全部执行成功,要么全部执行失败.RocketMQ.Kafka 和 Pulsar 都是当今业界 ...

  5. 消息队列之推还是拉,RocketMQ 和 Kafka是如何做的?

    今天我们就来谈一谈消息队列的推拉模式,这也是一个面试热点,例如你在简历里面写了 RocketMQ ,基本上会问你 RocketMQ 采用的是推模式还是拉模式啊?是拉模式?不是有 PushConsume ...

  6. Rocketmq vs Kafka

    消息队列概念举例 小红是小明的姐姐,小红为了督促小明多读书,经常寻找好书给小明看,先前的方式是这样的,小红先问小明什么时候有空,然后把书送到小明跟前并且监督小明读完书再离开,久而久之,两人都有些厌烦, ...

  7. 消息中间件合集:MQ(ActiveMQ/RabbitMQ/RocketMQ)+Kafka+笔记

    最近有好多朋友都去投岗秋招提前批,面完回来跟我说碰到消息中间件一类的问题就挂了.额,有点不知所措,于是乎小编就想着做一次消息中间件的专题,归类整理了MQ(ActiveMQ/RabbitMQ/Rocke ...

  8. 惊了 消息中间件合集:MQ(ActiveMQ/RabbitMQ/RocketMQ)+Kafka+笔记

    最近有好多朋友都去投岗秋招提前批,面完回来跟我说碰到消息中间件一类的问题就挂了. 附面试思维导图: 额,有点不知所措,于是乎小编就想着做一次消息中间件的专题,归类整理了MQ( ActiveMQ/Rab ...

  9. 分布式消息队列RocketMQ与Kafka的18项差异之“拨乱反正“之2

    在前1篇,我讨论了RocketMQ与Kakfa的对比中,几个不太严谨的地方.本着严谨的精神,不偏袒任何一方,本篇想分析一下RocketMQ在Kafka的基础上,的确做的几个改进.有不对之处,敬请指正. ...

最新文章

  1. 清华姚班“斩获”AAAI 2020最佳学生论文:首届弟子贝小辉携手本科在读李子豪,攻坚算法博弈研究...
  2. 如何理解段路由(SPRING)?—Vecloud微云
  3. 完全卸载mongodb
  4. 【CV】MTCNN:3个CNN,胜过1个诸葛亮
  5. Python数据分析很难学?60天就够了!
  6. 装饰器前奏2(2017年8月23日 11:50:39)(2017年8月29日 16:07:32)
  7. Portal for ArcGIS 资源承载数据类型
  8. mysql-server rpm_Mysql rpm包安装
  9. 代码动态逍遥叹之狂学php
  10. 飞机大战小游戏3.0
  11. 阿里云-高性能计算招聘
  12. cachecloud:安装部署(一)
  13. arch linux yaourt arm,在ARM設備(樹莓派、香蕉派)上為Arch Linux配置yaourt
  14. 蓝桥杯, 38线译码器74Hc138
  15. 使用卷积神经网络进行实时面部表情检测
  16. 科大奥瑞物理实验——傅里叶光学
  17. XmlHttp是什么
  18. Encountered end of file
  19. tf.meshgrid
  20. vue中如何使用节流(throttle)函数

热门文章

  1. 一种二维条码图像处理流程
  2. 【FFmpeg】FFmpeg中操作目录、文件的接口
  3. 【Qt】在Qt中使用opencv,不要使用opencv创建窗口
  4. Linux驱动:TI达芬奇系列kernel中cup类型的判断,以cpu_is_ti81xx()为例
  5. python自动输出_python自动化报告的输出
  6. ssm框架mysql配置_ssm框架使用详解配置两个数据源
  7. Java项目:慢病报销管理信息系统(java+MySQL+Jdbc+Servlet+Jsp)
  8. 【单片机】以输出方波为例的 定时器使用
  9. spark编程基础--6.DataFrame
  10. iOS关于像素的适配