Prometheus将告警分为两个部分:Prometheus 和 Alertmanager。其中Prometheus配置告警触发规则,对指标进行监控和计算,将再将告警信息发送到Alertmanager中。Alertmanager对告警进行管理,比如合并抑制等操作。

wget https://github.com/prometheus/alertmanager/releases/download/v0.23.0/alertmanager-0.23.0.linux-amd64.tar.gz

tar -xvzf alertmanager-0.23.0.linux-amd64.tar.gz  -C /usr/local/

cd /usr/local/

mv alertmanager-0.23.0.linux-amd64/ alertmanager

配置system管理

vim /usr/lib/systemd/system/alertmanager.service

[Unit]

Description=alertmanager System

Documentation=alertmanager System

[Service]

ExecStart=/usr/local/alertmanager/alertmanager --config.file=/usr/local/alertmanager/alertmanager.yml

[Install]

WantedBy=multi-user.target

systemctl restart alertmanager.service   启动

修改 prometheus 配置文件

vim prometheus/prometheus.yml

配置 alertmanager对应的ip和端口

alerting:

alertmanagers:

- static_configs:

- targets:

- 192.168.11.141:9093

rule_files:    #指定报警规则所在路径和文件

- "/usr/local/prometheus/rules/host_monitor.yml"

编写告警规则

mkdir prometheus/rules/

vim prometheus/rules/host_monitor.yml

groups:

- name: node-up

rules:

- alert: node-up

expr: up == 0

for: 10s

labels:

severity: warning

team: node

annotations:

summary: "运维部门的 {{ $labels.instance }} 服务已停止运行超过 10s!"

告警配置参数

alert:告警规则的名称。

expr:基于 PromQL 表达式告警触发条件,用于计算是否有时间序列满足该条件。

for:评估等待时间,可选参数。用于表示只有当触发条件持续一段时间后才发送告警。在等待期间新产生告警的状态为 pending。

labels:自定义标签,允许用户指定要附加到告警上的一组附加标签。

annotations:用于指定一组附加信息,比如用于描述告警详细信息的文字等,annotations 的内容在告警产生时会一同作为参数发送到 Alertmanager。

summary 描述告警的概要信息,description 用于描述告警的详细信息。

同时 Alertmanager 的 UI 也会根据这两个标签值,显示告警信息。

systemctl restart  prometheus  配置完成后重启

prometheus监控报警部署Alertmanager相关推荐

  1. 搭建Prometheus监控报警

    基于上一篇博客继续进行部署 一.Prometheus & AlertManager 介绍 Prometheus 是一套开源的系统监控.报警.时间序列数据库的组合,最初有 SoundCloud ...

  2. 阿里云容器Kubernetes监控(七) - Prometheus监控方案部署

    前言 Prometheus是一款面向云原生应用程序的开源监控工具,作为第一个从CNCF毕业的监控工具而言,开发者对于Prometheus寄予了巨大的希望.在Kubernetes社区中,很多人认为Pro ...

  3. Prometheus监控系部署配置过程

    一.前言 Prometheus是由SoundCloud开发的开源监控报警系统和时序列数据库(TSDB),基于Go语言开发,是Google BorgMon监控系统的开源版本.Prometheus在201 ...

  4. prometheus监控预警之AlertManager邮箱报警

    Alertmanager 主要用于接收 Prometheus 发送的告警信息,它支持丰富的告警通知渠道,例如邮件.微信.钉钉.Slack 等常用沟通工具,而且很容易做到告警信息进行去重,降噪,分组等, ...

  5. Prometheus 监控报警系统 AlertManager 之邮件告警

    文章目录 1.Prometheus & AlertManager 介绍 2.环境.软件准备 3.启动并配置 Prometheus 3.1.Docker 启动 Prometheus 3.2.Do ...

  6. prometheus监控告警功能

    prometheus监控K8S 监控告警功能 alertmanager邮箱告警配置 首先开通SMTP服务,QQ邮箱:设置–帐号–开通POP3/SMTP服务,记住生成的密码(其它邮箱同理) 编辑prom ...

  7. (二) prometheus报警-----自定义 / alertmanager监控,报警设置

    文章目录 1. prometheus报警设置: . 介绍 2.自定义告警规则 定义告警规则 模板化 查看告警状态 2.下载并报警组件alertmanager 2.1 配置alertmanager 2. ...

  8. caas k8s主控节点如何查询_k8s中部署prometheus监控告警系统prometheus系列文章第一篇...

    前言 本篇文章主要介绍k8s集群中部署prometheus,并且配置prometheus的动态.静态服务发现,实现监控容器.物理节点.service.pod等资源指标,配置prometheus的web ...

  9. Prometheus监控神器-Alertmanager篇(1)

    本章节主要涵盖了Alertmanager的工作机制与配置文件的比较详细的知识内容,由浅入深的给大家讲解. 警报一直是整个监控系统中的重要组成部分,Prometheus监控系统中,采集与警报是分离的.警 ...

最新文章

  1. UITableView 添加长按手势UILongPressGestureRecognizer
  2. 冲向大牛之安卓---2014.11月面试经常碰到的一些问题
  3. 浅谈JavaScript中按键事件的e.keyCode || e.which || e.charCode
  4. buu [BJDCTF 2020]这是base??
  5. STM32L1X系列GPIO运用
  6. 从Bayesian Deep Learning到Adversarial Robustness新范式
  7. java指令导出data文件_直接用 java 命令行动态生成jpg文件 (转)
  8. ipython和anaconda区别_anaconda和python区别
  9. 3.jenkins 基础
  10. 公众号获取用户手机号_微信公众号如何选取种子用户
  11. 潜在语义分析(TF-IDF、LSA)
  12. 带通滤波器的matlab程序设计
  13. 【粗解】【通信编码】卷积编码器的简单实现
  14. 通过调用rundll32.exe来打开一些系统特定文件
  15. React+TS学习和使用(三):React Redux和项目的路由配置
  16. 汇编语言L0C,单片机汇编语言指令查表.doc
  17. 商城项目解析(前端页面知识,用户如何访问服务器,hosts的修改,nginx)
  18. POI 2014 切题记
  19. 中文命名实体识别(ner)迁移学习
  20. 微信小程序云开发项目-个人待办事项-02今日模块开发

热门文章

  1. 既然MAC地址是唯一的,为什么还需要IP地址?
  2. [源码解析] 深度学习流水线并行GPipe (2) ----- 梯度累积
  3. git如何忽略一个文件
  4. about GLOBAL TEMPORARY TABLES
  5. 网关和代理服务器的异同
  6. PowerPC的字节序问题
  7. 中文puppy linux7.5,Puppy Linux 7.5发布,支持UEFI启动的
  8. MySQL缓冲池-Buffer Pull
  9. 精美Bootstrap二手物品交易市场模板Html
  10. Python爬虫之——爬取妹子图片