prometheus告警功能
Prometheus对指标的收集、存储同告警能力分属于Prometheus Server和AlertManager(通用的组件,可由企业自行开发)两个独立的组件,前者仅负责基于"告警规则"生成告警通知,具体的告警操作则由后者完成;

Alertmanager负责处理由客户端发来的告警通知客户端通常是Prometheus server,但它也支持接收来自其它工具的告警;
Alertmanager对告警通知进行分组、去重后,根据路由规则将其路由到不同的receiver,如Email、短信或PagerDuty等;
目前Alertmanager还不支持钉钉,那用户完全可以通过Webhook与钉钉机器人进行集成,从而通过钉钉接收告警信息。同时AltManager还提供了静默和告警抑制机制来对告警通知行为进行优化
PS:webhook是一个APr概念, webhook是一种web回调或者http的push APT.Webhook作为一个轻量的事件处理应用
(一)定义:
1.告警功能概述:
prometheus对指标的收集、存储与告警能力分属于Prometheus serve和alertmanager两个独立的组件,pro-server只负责通过"告警规则"生成告警通知,具体告警操作是由alertmmanager完成

告警规则:
是由PromQL编写的布尔值表达式使用>< =与一个常用量值,比如80%进行比较,其返回值为true或false

prometheus-server对抓取到的指标序列与告警规则中做为比较的Prometheus匹配,则会把此样本值抓取过来作比较,若返回值为true则认为指标异常,不能满足false,则为正常值以上表达式为告警规则表达式
比如:筛选一个指标数据cpu使用率<0%系统异常

2.通知告警信息
一旦条件表达式为true了就会触发通知信息,送给altermanager,由alter借助”特定服务的API或者访问入口",将此信息发出去一般称为告警媒介,也可以借助邮件进行告警SMTP

”特定服务的API或者访问入口": 例如 pageduty(告警平台) slock(群组) smtp server (邮件)

3.prometheus监控系统的告警逻辑

route:告警路由,分组、分类分发告警消息给不同渠道

prometheus通过alter-rule规则,生成告警通知给altermanager
altermanager会生成本地的告警路由表(第一路由默认称为根路由,所有的告警信息都需要一个根路由,没有一个匹配项,则需要设置一个默认路由)为实现将特定的信息发送给特定的用户
例如:
按消息级别来看,严重、中等、普通级别,红色报警、蓝色报警,应用发送方
按分组:业务运维、系统运维、基础设施运维、k8s运维
1.告警功能:
除了基本的告警通知能力外,Altermanager还支持对告警进行去重、分组、抑制、

2.静默、抑制、分组等功能;

分组 (Grouping):将相似告警合并为单个告警通知的机制,在系统因大面积故障而触发告警潮时,分组机制能避免用户被大量的告警噪声淹没,进而导致关键信息的隐没;
抑制(Inhibition):系统中某个组件或服务故障而触发告警通知后,那些依赖于该组件或服务的其它组件或服务可能也会因此而触发告警,抑制便是避免类似的级联告警的一种特性,从而让用户能将精力集中于真正的故障所在;
静默(silent):是指在一个特定的时间窗口内,即便接收到告警通知,Alertmanager也不会真正向用户发送告警信息的行为;通常,在系统例行维护期间,需要激活告警系统的静默特性;
路由(route):用于配置Alertmanager如何处理传入的特定类型的告警通知,其基本逻辑是根据路由匹配规则的匹配结果来确定处理当前告警通知的路径和行为


部署告警对接邮箱

prometheus告警功能相关推荐

  1. Prometheus告警功能——对接邮箱

    目录 前言 告警功能概述 告警规则 通知告警信息 prometheus监控系统的告警逻辑 告警功能: 部署告警对接邮箱 故障模拟 前言 Prometheus对指标的收集.存储同告警能力分属于Prome ...

  2. prometheus监控告警功能

    prometheus监控K8S 监控告警功能 alertmanager邮箱告警配置 首先开通SMTP服务,QQ邮箱:设置–帐号–开通POP3/SMTP服务,记住生成的密码(其它邮箱同理) 编辑prom ...

  3. 5.prometheus告警插件-alertmanager、自定义webhook案例编写

    5.prometheus告警插件-alertmanager 参考文章: https://www.bookstack.cn/read/prometheus-book/alert-install-aler ...

  4. Zabbix 配置钉钉告警功能

    需求 Zabbix配置钉钉告警和Prometheus配置钉钉告警类似.只不过Zabbix通过钉钉告警是通过Python脚本实现.而Prometheus是通过钉钉的二进制包实现. 我们现在主要来讲解Za ...

  5. zabbix企业级分布式监控系统第二版pdf_XSKY监控告警功能通过Zabbix官方认证,轻松支持微信短信等实时告警...

    近日,XSKY SDS产品提供的Zabbix监控告警功能通过Zabbix官方认证,并入选Zabbix官方推荐的存储监控解决方案. 随着XSKY SDS产品深入各个行业,客户对存储监控的需求越来越高,希 ...

  6. 最易懂的Prometheus告警原理详解

    通俗易懂的一篇文章,主要介绍了 Prometheus 什么时候告警,什么时候不会告警.同时介绍了 Prometheus 告警原理. 警报是监控系统中必不可少的一块, 当然了, 也是最难搞的一块. 我们 ...

  7. linux查看文件句柄阀值,prometheus 告警指标

    记录了prometheus 告警指标 主机和硬件监控 可用内存指标 主机中可用内存容量不足 10% - alert: HostOutOfMemory expr: node_memory_MemAvai ...

  8. 开箱即用的 Prometheus 告警规则集

    作者 | AddoZhang       责编 | 欧阳姝黎 在配置系统监控的时候,是不是即使绞尽脑汁监控的也还是不够全面,或者不知如何获取想要的指标. Awesome Prometheus aler ...

  9. cacti实现微信告警功能

    背景 近来受朋友所托,为他实现cacti的微信告警功能,但是在印象之中,cacti的thold插件貌似只有邮件告警功能吧?于是花了点时间在网络上搜索了相关信息,发现cacti的微信告警的信息着实很少, ...

最新文章

  1. 7、在对象内部尽量直接访问实例变量
  2. 迁移学习之VGG16和VGG19
  3. 大学学了java可以做点什么_学习Java的,大学毕业一般从事些什么工作?
  4. 利用 TensorFlow 实现上下文的 Chat-bots
  5. [js插件开发教程]一步步开发一个可以定制配置的隔行变色小插件
  6. X264码率控制流程分析
  7. 【CDN】域名无法访问,ping不到,tracert不到
  8. Spring Boot2 整合 Ehcache
  9. 认识Javascript数组
  10. 智能化改造!AI技术在传统企业大有可为!
  11. 杭电acm 1846 Brave Game(巴什博弈)
  12. pkg-config --cflags --libs
  13. Python报错: RuntimeError: The current Numpy installation (‘D:\\Develop\\anaconda\\lib\\site-packages\\
  14. 白鹭引擎 - 矢量绘图 ( graphics )
  15. 微弱信号检测(放大电路篇——集成运放)
  16. 华为2019 秋招笔试题
  17. java setw_C++ setw:格式化输出(详解版)
  18. 1-7-2 查询水果价格分数
  19. win 10 设置静态ip 子网前缀长度
  20. 自定义电子邮件 html_如何在Windows 10中设置和自定义电子邮件帐户

热门文章

  1. 网络显示连接,不能还是上网,找不到DNS怎么办?
  2. 对不起,精英主义与特斯拉精神背道而驰
  3. idfa码如何查看_小E告诉你:如何快速登录和高效使用华为电子邮件
  4. bzoj3265 志愿者招募加强版
  5. 【语音控制】0成本实现小爱远程开关电脑
  6. 往事的回忆:木星如何抓获小彗星
  7. 多线程处理Excel导入数据入库
  8. 为什么看P1dB压缩,而不是2dB,3dB压缩
  9. 上帝视角学JAVA- 基础08-类06【2021-08-07】
  10. 第二章:计算思维——知识点整理