转自:https://github.com/alibaba/RocketMQ/wiki/rmq_vs_kafka

淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用MySQL作为消息存储媒介,可完全水平扩容,为了进一步降低成本,我们认为存储部分可以进一步优化,2011年初,Linkin开源了Kafka这个优秀的消息中间件,淘宝中间件团队在对Kafka做过充分Review之后,Kafka无限消息堆积,高效的持久化速度吸引了我们,但是同时发现这个消息系统主要定位于日志传输,对于使用在淘宝交易、订单、充值等场景下还有诸多特性不满足,为此我们重新用Java语言编写了RocketMQ,定位于非日志的可靠消息传输(日志场景也OK),目前RocketMQ在阿里集团被广泛应用在订单,交易,充值,流计算,消息推送,日志流式处理,binglog分发等场景。

为了方便大家选型,整理一份RocketMQ与Kafka的对比文档,文中如有错误之处,欢迎来函指正。vintage.wang@gmail.com

数据可靠性

总结:RocketMQ的同步刷盘在单机可靠性上比Kafka更高,不会因为操作系统Crash,导致数据丢失。 同时同步Replication也比Kafka异步Replication更可靠,数据完全无单点。另外Kafka的Replication以topic为单位,支持主机宕机,备机自动切换,但是这里有个问题,由于是异步Replication,那么切换后会有数据丢失,同时Leader如果重启后,会与已经存在的Leader产生数据冲突。开源版本的RocketMQ不支持Master宕机,Slave自动切换为Master,阿里云版本的RocketMQ支持自动切换特性。

性能对比

总结:Kafka的TPS跑到单机百万,主要是由于Producer端将多个小消息合并,批量发向Broker。

RocketMQ为什么没有这么做?

  1. Producer通常使用Java语言,缓存过多消息,GC是个很严重的问题
  2. Producer调用发送消息接口,消息未发送到Broker,向业务返回成功,此时Producer宕机,会导致消息丢失,业务出错
  3. Producer通常为分布式系统,且每台机器都是多线程发送,我们认为线上的系统单个Producer每秒产生的数据量有限,不可能上万。
  4. 缓存的功能完全可以由上层业务完成。

单机支持的队列数

队列多有什么好处?

  1. 单机可以创建更多Topic,因为每个Topic都是由一批队列组成
  2. Consumer的集群规模和队列数成正比,队列越多,Consumer集群可以越大

消息投递实时性

消费失败重试

总结:例如充值类应用,当前时刻调用运营商网关,充值失败,可能是对方压力过多,稍后在调用就会成功,如支付宝到银行扣款也是类似需求。

这里的重试需要可靠的重试,即失败重试的消息不因为Consumer宕机导致丢失。

严格的消息顺序

Mysql Binlog分发需要严格的消息顺序

定时消息

分布式事务消息

消息查询

总结:消息查询对于定位消息丢失问题非常有帮助,例如某个订单处理失败,是消息没收到还是收到处理出错了。

消息回溯

总结:典型业务场景如consumer做订单分析,但是由于程序逻辑或者依赖的系统发生故障等原因,导致今天消费的消息全部无效,需要重新从昨天零点开始消费,那么以时间为起点的消息重放功能对于业务非常有帮助。

消费并行度

  • Kafka的消费并行度依赖Topic配置的分区数,如分区数为10,那么最多10台机器来并行消费(每台机器只能开启一个线程),或者一台机器消费(10个线程并行消费)。即消费并行度和分区数一致。

  • RocketMQ消费并行度分两种情况

    • 顺序消费方式并行度同Kafka完全一致
    • 乱序方式并行度取决于Consumer的线程数,如Topic配置10个队列,10台机器消费,每台机器100个线程,那么并行度为1000。

消息轨迹

开发语言友好性

Broker端消息过滤

消息堆积能力

理论上Kafka要比RocketMQ的堆积能力更强,不过RocketMQ单机也可以支持亿级的消息堆积能力,我们认为这个堆积能力已经完全可以满足业务需求。

开源社区活跃度

商业支持

成熟度

RocketMQ与Kafka对比(18项差异)相关推荐

  1. 分布式消息队列RocketMQ与Kafka的18项差异之“拨乱反正”

    我们知道,阿里的RocketMQ其实源自Kafka.同时网络上一直流传着1篇阿里中间件团队所写的RocketMQ与Kafka的18项差异的文章,并且被广泛转发.比如: http://blog.csdn ...

  2. 分布式消息队列RocketMQ与Kafka的18项差异之“拨乱反正“之2

    在前1篇,我讨论了RocketMQ与Kakfa的对比中,几个不太严谨的地方.本着严谨的精神,不偏袒任何一方,本篇想分析一下RocketMQ在Kafka的基础上,的确做的几个改进.有不对之处,敬请指正. ...

  3. RocketMQ与kafka对比(18项差异)-转自阿里中间件

    淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用Mysql作为消息存储媒介,可完全水平扩容,为了进一步降低成本,我们认为存储部分可以进一步优化,2011年初,Linkin开源了Kaf ...

  4. Ali RocketMQ与Kafka对比

    淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用Mysql作为消息存储媒介,可完全水平扩容,为了进一步降低成本,我们认为存储部分可以进一步优化,2011年初,Linkin开源了Kaf ...

  5. 事务消息大揭秘!RocketMQ、Kafka、Pulsar全方位对比

    导语 | 事务是一个程序执行单元,里面的所有操作要么全部执行成功,要么全部执行失败.RocketMQ.Kafka和Pulsar都是当今业界应用十分广泛的开源消息队列(MQ)组件,笔者在工作中遇到关于M ...

  6. 消息中间件学习总结(9)——RocketMQ与kafka差异比较分析

    淘宝内部的交易系统使用了淘宝自主研发的Notify消息中间件,使用Mysql作为消息存储媒介,可完全水平扩容,为了进一步降低成本,我们认为存储部分可以进一步优化,2011年初,Linkin开源了Kaf ...

  7. rocketmq怎么保证数据不会重复_阿里架构师亲授:Kafka和RocketMQ的消息复制实现的差异点在哪?...

    众所周知,消息队列在收发两端,主要是依靠业务代码,配合请求确认的机制,来保证消息不会丢失的.而在服务端,一般采用持久化和复制的方式来保证不丢消息. 把消息复制到多个节点上,不仅可以解决丢消息的问题,还 ...

  8. 360度无死角 | Pulsar与Kafka对比全解析

    点击上方蓝色字体,选择"设为星标" 回复"资源"获取更多资源 2020 年,Pulsar 受到持续关注,Pulsar 的应用场景也越来越广泛. 本文分别从性能. ...

  9. MLPerf基准测试再发榜,浪潮AI服务器刷新18项纪录

    近日,全球倍受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,其中浪潮AI服务器NF5488A5一举创造18项性能纪录,在数据中心AI推理性能上遥遥领先其他厂商产品. MLPerf是当前全球 ...

最新文章

  1. 在 Linux 系统中安装Load Generator ,并在windows 调用
  2. linux开始时间and结束时间,Linux NTP configure and Hangcheck-time
  3. html画圆中有个正方形,这样画圆内接正方形,非常简单!
  4. android studio开关按钮,Android studio实现滑动开关
  5. 重温前端基础(二) 移动WEB开发
  6. java细节_java细节知识
  7. C语言电话薄登录系统,求助 哈稀表编电话薄程序(c语言) 算法
  8. 上周的工作总结和下周的学习安排
  9. java execlp_Linux下的C程序,使用函数execlp运行Shell命令
  10. MATLAB R2013 a版及序列号
  11. HTML5制作个人简历模板
  12. web打印插件hiprint
  13. 多项式插值与样条插值的解释与示例(matlab)
  14. SQL实现次日、三日及七日用户留存率的计算
  15. 推荐几个做自媒体好用的电影素材网站
  16. 老男孩教育 | 5分钟带你搞懂日志采集利器Filebeat!
  17. TCP/IP模型背后的内涵(一)
  18. 麦田的守望者背景与分析
  19. 还有什么服务器有无限连击,无限元宝动作类变态服有哪些
  20. 关于BeanUtils.populate

热门文章

  1. Hive运行方式、gui
  2. LeetCode 8 字符串转整数 (atoi)
  3. Swift Property Wrapper 属性包装器
  4. swift_023(Swift 的继承)
  5. 关于设置GridControl属性在代码中的顺序带来的不同效果
  6. MySQL学习随笔记录
  7. webpack 安装卸载
  8. 20145326蔡馨熤《信息安全系统设计基础》第1周学习总结
  9. 基于mjpg-streamer网络视频服务器移植
  10. label自适应高度