监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎。本文主要分享在 Prometheus 实践中遇到的一些问题和思考,如果你对 Kubernetes 监控体系或 Prometheus 的设计还不太了解,可以先看下容器监控系列[1]。

几点原则

  • 监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是不必要的指标采集,浪费人力和存储资源(To B商业产品例外)。

  • 需要处理的告警才发出来,发出来的告警必须得到处理。

  • 简单的架构就是最好的架构,业务系统都挂了,监控也不能挂。Google SRE 里面也说避免使用 Magic 系统,例如机器学习报警阈值、自动修复之类。这一点见仁见智吧,感觉很多公司都在搞智能 AI 运维。

Prometheus 的局限

  • Prometheus 是基于 Metric 的监控,不适用于日志(Logs)、事件(Event)、调用链(Tracing&#

最全 Prometheus 踩坑集锦相关推荐

  1. Prometheus 踩坑集锦

    Prometheus 踩坑集锦 1 几点原则 2 Prometheus 的局限 3 K8S 集群中常用的 exporter 4 K8S 核心组件监控与 Grafana 面板 5 采集组件 All IN ...

  2. (Python+Tensorflow)编程踩坑集锦

    (Python+Tensorflow)编程踩坑集锦 1 开发环境安装 推荐视频:https://www.icourse163.org/learn/PKU-1002536002?tid=14529374 ...

  3. 高可用 Prometheus 架构实践中的踩坑集锦

    监控系统的历史悠久,是一个很成熟的方向,而 Prometheus 作为新生代的开源监控系统,慢慢成为了云原生体系的事实标准,也证明了其设计很受欢迎. 本文主要分享在 Prometheus 实践中遇到的 ...

  4. 使用三台阿里云服务器搭建Hadoop集群(云计算实验踩坑集锦)

    使用阿里云服务器搭建这个hadoop集群,踩得坑人已经傻了,浪费了我快一周的时间. 1.准备环节 准备三台阿里云服务器 Namenode 121.196.224.191 Datanode1 121.1 ...

  5. 集成声网(Agora)SDK踩坑集锦系列

    本文以Android平台为例,使用的声网SDK版本2.4.0. 问题一./app/src/main/res/values/strings.xml:4:34: Error: 元素内容必须由格式正确的字符 ...

  6. Vue项目中监听全屏事件,实现全屏功能和按esc退出全屏(解决全屏踩坑难题)

    展示效果: 全屏功能 代码: <el-buttontype="button"id="full-btn-medium"@click="VideoF ...

  7. 课件学习验证/多计时器/<cover-view>使用/节流解决撞循环/video组件全屏踩坑(存档)

    <template><view><view class="new-tab"><img class="new-tab-img-ba ...

  8. (JNI/JNA)java 调用c/c++ 动态链接库 全套操作+踩坑集锦

    第一篇文章终于写完-跨行三年,一直都是看别人的文章-今天咱终于自己写了一篇,自己总结的,希望能给你一点点帮助,如有错误,希望指出,立马改正. 0 前言 Java代码是跨平台的,其与硬件环境彻底&quo ...

  9. js控制浏览器全屏踩坑记录

    需求 点击以下按钮后,页面进入全屏. 进入全屏后,按钮样式改变为 恢复非全屏时,按钮自动恢复. 难点 需求很简单,但是实际上手发现有几个难点: 1.浏览器在全屏状态下按F11和Esc可以退出全屏,且全 ...

最新文章

  1. 进阶高端,2017年vivo手机用实力说话
  2. 计算机技术停滞,究竟什么原因让科技停滞不前呢?
  3. [斯坦福创业课]Jeff谈LinkedIn的同理心管理
  4. wait 和 sleep 的区别
  5. 数据填充规则之PKCS7
  6. 95-190-642-源码-窗口操作符-EvictingWindowOperator
  7. 企业信息安全管理建设(3)——安全管理体系
  8. 关闭QQ弹出的腾讯网迷你版
  9. 【图论-二分图】中山纪念中学暑期游Day15——【NOIP2013模拟联考3】沙耶的玩偶(doll)
  10. 数学分析_Tom Apostol_定理7.48:黎曼可积的充要条件
  11. 工作处境不好的时候,学会三思(三种思考)
  12. 图片文字识别OCR调研-中文
  13. 思科模拟器出现Translating XXXX...domain server (255.255.255.255) 解决办法
  14. 数据库插入微信表情错误
  15. php错误排查 写入文档,php error_log 错误信息写入文件
  16. 浙江大学计算机科学排名,2017浙江大学专业排名结果
  17. 计算机视觉相关学习项目(上)——附MATLAB源代码
  18. BN/Batch Norm中的滑动平均/移动平均/Moving Average
  19. 即学即会---简单易学模拟时钟 (html +css +js)
  20. 苹果服务器怎样推送消息,ios消息推送

热门文章

  1. 利用ISA2006封杀QQ2010
  2. ArcGIS Server .Net Web ADF体系结构
  3. 菜鸟也学DW做ASP
  4. 《图解HTTP》读书笔记--第8章 确认访问用户身份的认证
  5. php怎么实现缓存,PHP怎么实现缓存功能_后端开发
  6. 修改登录密码html代码,修改密码.html · yuanxing_one/yuanxing - Gitee.com
  7. python打印自动换行如何解决_解决python DataFrame 打印结果不换行问题
  8. python aes_python AES 加密
  9. python安装不了bs4_怎么在python安装bs4
  10. ospf hello时间和dead_深入理解OSPF协议----第二讲:OSPF报文类型