前言

​对集群健康状况、使用主题、消费组资源的巡检,发现达到阈值则发送告警信息给管理员或者资源申请者。监控是告警的基础,告警的巡检基于前面两篇文章中监控采集到的数据。

​告警的重要性不必过多地赘述,RocketMQ 集群往往承载着公司核心业务流转。如果集群不可用往往影响是全公司的业务,事故责任是公司最高级别的。

本文从告警项的设计、告警流程、告警实战给出指导建议,在实践中以此为思路扩展完善,实现自己公司的定制化告警。

告警项设计

下图分别从主题、消费组、集群维度罗列了比较重要的告警项以及触发条件包括哪些方面。

触发条件

  • 触发阈值:超过某个特定的数值,例如:消费积压超过 10 万。
  • 时间间隔:间隔多久检测,例如:5 分钟内消费积压超过 10 万。
  • 触发次数:在时间间隔内满足阈值的次数,例如:5 分钟内消费积压超过 10 万,触发了 3 次。
  • 告警时间段:收到告警通知的时间范围,例如:在 9:00-22:00 之间收到告警信息。

主题告警

发送速度:当发送速度满足触发条件设定的阈值时发送告警信息。

例如:5

RocketMQ 集群告警相关推荐

  1. RocketMQ集群启动报错:java.lang.RuntimeException: Lock failed,MQ already started

    启动RocketMQ集群后报错: java.lang.RuntimeException: Lock failed,MQ already startedat org.apache.rocketmq.st ...

  2. rocketmq集群安装部署过程(4.0.0版本)、安装中的常见问题举例

    本篇博文参考:http://www.cnblogs.com/quchunhui/p/7126868.html,然后按照自己的环境进行重新编写 准备工作: 下载rocketmq-all-4.0.0-in ...

  3. 双RocketMq集群的搭建

    一.双Master RocketMq集群的搭建 1.服务器环境: 序号 IP 用户名 角色 模式 1 192.168.211.128 root nameServer1,brokerServer1 Ma ...

  4. 从生产故障解锁RocketMQ集群部署的最佳实践

    1.故障描述 RocketMQ 集群采取的部署架构为2主2从,其部署架构如下图所示: 其部署架构中一个非常明显的特点是一台物理机上分别部署了 nameserver,broker 两个进程. 其中一台机 ...

  5. RocketMQ集群详解

    集群特点 (1)NameServer:是一个几乎无状态节点,可集群部署,节点之间无任何信息同步. (2)Broker:部署相对复杂,Broker分为Master与Slave,一个Master可以对应多 ...

  6. 从年末生产故障解锁RocketMQ集群部署的最佳实践

    [CSDN 编者按]因为一次生产事故,导致年终奖泡汤!在一番问题查找之后,终于找到了罪魁祸首!MQ集群中某一台物理机内存引发的故障,从而导致系统异常重启,而更关键的问题是,为什么一台Broker由于内 ...

  7. 阿里二面:RocketMQ 集群 Broker 挂了,会造成什么影响?

    大家好,我是君哥.今天分享 RocketMQ 的 Broker 挂了,会带来什么影响. 面试官:你好,如果 RocketMQ 集群中的一个 Broker 挂了,会造成什么影响呢? 我:Broker 挂 ...

  8. RocketMQ 集群平滑运维

    前言 在 RocketMQ 集群的运维实践中,无论线上 Broker 节点启动和关闭,还是集群的扩缩容,都希望是平滑的,业务无感知.正所谓 "随风潜入夜,润物细无声" ,本文以实际 ...

  9. rocketmq 集群部署

    架构图 部署环境 hostname ip 备注 mqnamesrv1 10.0.0.1 namesrv mqnamesrv2 10.0.0.2 namesrv mqbroker3 10.0.0.3 b ...

最新文章

  1. iOS ERROR ITMS - 打包上传报错整理
  2. Windows 8 :妥协的产物
  3. 分离数据库(Detach database).
  4. mysql my.ini my.cnf_Mysql配置文件my.ini/my.cnf
  5. martingale、markov chain、Monte Carlo、MCMC
  6. 学校计算机教室的用途,录播教室有什么功能,又有哪些用途
  7. 【带着canvas去流浪(11)】Three.js入门学习笔记
  8. 华为回怼特朗普;中兴首款 5G 上市;iPhone 可免息分期购买 | 极客头条
  9. CCF2014123集合竞价(C语言版)
  10. 如何开发一个完整的JavaScript组件
  11. UG NX 工程图视图概述
  12. 计算机网络的软件系统包括哪几部分,系统软件由哪几部分组成?
  13. Java 基础篇:第十九章:多线程
  14. 彻底搞懂AQS-重点方法精讲 [并发劝退- 哭唧唧]
  15. android仿抖音直播间聊天,Uni-App直播小视频|仿微信聊天界面|uniapp仿抖音
  16. Android调用miui给权限,Android 11+MIUI12,APP任意获取用户隐私的路子被封死
  17. 家乡,属于梦的记忆140
  18. 分享2D Unity游戏的动画制作经验
  19. L2TP详解(四)——LAC自动拨号隧道和会话建立过程
  20. Oracle孤陋寡闻之wm_concat之巨坑

热门文章

  1. 研究生复试发邮件注意事项
  2. 更愿意思念更早的“金陵”
  3. 机器学习和深度学习的主要术语(中英)
  4. Windows7更改自己的计算机名,方便局域网内的用户识别
  5. UVM和C-完美结合
  6. Windows Defender内核隔离无法关闭,提示此设置由管理员进行管理
  7. 手把手教你搭建自己的 AV1 Analyzer
  8. 看得见的算法蒙特卡洛问题——使用蒙特卡洛算法求PI值
  9. JSX列表渲染(五)——4种写法:基本写法 遍历写法 map遍历写法(常用-加工处理数组的每一项数据,最后形成一个新的数组) 列表遍历可以直接写到表达式中
  10. Android 仿QQ退出(点击返回键不退出app,点击icon直接进入上次退出的页面)