1、监控原则

  • 监控是基础设施,目的是为了解决问题,不要只朝着大而全去做,尤其是不必要的指标采集,浪费人力和存储资源(To B商业产品例外)。
  • 需要处理的告警才发出来,发出来的告警必须得到处理。
  • 简单的架构就是最好的架构,业务系统都挂了,监控也不能挂。Google Sre 里面也说避免使用Magic 系统,例如机器学习报警阈值、自动修复之类。这一点见仁见智吧,感觉很多公司都在搞智能 AI 运维。

2、Zabbix有哪些组件

  1. Zabbix Server:负责接收agent发送的报告信息的核心组件,所有配置、统计数据及操作数据均由其组织进行
  2. Database Storage:专用于存储所有配置信息,以及有zabbix收集的数据
  3. Web interface(frontend):zabbix的GUI接口,通常与server运行在同一台机器上
  4. Proxy:可选组件,常用于分布式监控环境中,代理Server收集部分被监控数据并统一发往Server端
  5. Agent:部署在被监控主机上,负责收集本地数据并发往Server端或者Proxy端

3、Zabbix的两种监控模式

Zabbix agent检测分为两种模式:主动模式和被动模式

被动模式,也是默认的Zabbix监控模式,被动模式是相对于proxy来说的。proxy主动发送数据就是主动模式,proxy等待server的请求再发送数据就是被动模式。
 
使用zabbix主动模式的好处:可以监控不可达的远程设备;监控本地网络不稳定区域;当监控项

大厂经典运维监控(Zabbix+Prometheus)面试题整理汇总相关推荐

  1. fabric运维监控:prometheus配置热更新

    在上一篇fabric运维监控:prometheus+grafana框架搭建中搭建了prometheus+grafana监控框架,但这里存在一个问题,所有监控job都提前写好在配置文件prometheu ...

  2. 运维监控-Zabbix Server 使用微信 WeChat 告警

    运维监控-Zabbix Server 使用微信 WeChat 告警 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 微信公众号告警每个一天只支持1000次告警,如果超出这个次数了就不 ...

  3. 【大数据运维监控】Prometheus水平扩展Cortex的架构分析

    Cortex由Weaveworks创建,是一个开放源码的时间序列数据库和监视系统,用于应用程序和微服务.基于Prometheus,Cortex增加了水平缩放和几乎无限的数据保留. Cortex的架构图 ...

  4. 运维监控软件的选择对比----Zabbix vs Prometheus

    近期遇到项目需要定制开发运维监控软件,考虑到监控的规模比较大,数量比较多,所以不能随随便便找个开源的监控软件就能应付了事的,还是要认真对待. N年以前笔者曾经使用过Nagios,catti以及MRTG ...

  5. Lnmp搭建zabbix运维监控系统

    使用目的? 在公司项目中需要做一个日志监控,最开始选择的是efk,但是efk的资料相对较少并且之前对这几个产品都没接触过,使用起来难度.于是选择了zabbix作为项目的运维监控系统. zabbix能做 ...

  6. grafana的+按钮_基于 Prometheus、Grafana 的 EMQ X 物联网 MQTT 服务器可视化运维监控...

    Prometheus 是由 SoundCloud 开源监控告警解决方案,支持多维 数据模型(时序由 metric 名字和 k/v 的 labels 构成),具备灵活的查询语句(PromQL),支持多种 ...

  7. 建设DevOps统一运维监控平台,全面的系统监控你做好了吗?

    本文转自微信号EAWorld.扫描下方二维码,关注成功后,回复"普元方法+",将会获得热门课堂免费学习机会! 前言 随着Devops.云计算.微服务.容器等理念的逐步落地和大力发展 ...

  8. 运维监控系统实战笔记(day1)

    第一次课 监控需求直接的是为了出现问题时能及时感知到.新的需求: 通过监控了解数据趋势,知道系统在未来的某个时刻可能出问题,预知问题. 通过监控了解系统的水位情况,为服务扩缩容提供数据支撑. 通过监控 ...

  9. 运维技能定级标准第3篇——关于运维工程师岗位的运维监控与MySQL数据库技能级别设计

    运维工程师岗位工作技能的评定类别(3)和(4) 3.运维监控技术 级别0,什么都不懂 级别1,常见监控工具或软件系统的基本安装.配置.使用,照猫画虎会使用而已. 级别2,熟悉监控系统的基本原理和常用配 ...

最新文章

  1. 金融业加速智能化,解析360金融AI基础架构和应用
  2. Oracle数据库链Database links
  3. Java_异常_05_ OutOfMemoryError: Java heap space
  4. python的sorted函数用法_Python sorted函数及用法
  5. 全球及中国七氟二甲基辛二酸铜(II)行业竞争策略与投资前景研究报告2022版
  6. 一篇文章让你真正了解Java
  7. Cortex系列ARM内核介绍
  8. 史蒂夫乔布斯6月斯坦佛大学演讲: 必须找到你所钟爱的东西
  9. ubuntu16.04 编译出错:fatal error: SDL/SDL.h: No such file or directory
  10. Android之解决卸载app后再次安装提示room数据库错误
  11. java oca_OCA的Java拼图游戏第3部分
  12. Visual Studio 2019 16.2.2 发布
  13. Linux中的docker top命令
  14. 基线_Origin入门教程(九):扣除基线常用小妙招
  15. jsp页面中使用javascript获取后台放在request或session中的值
  16. python查询当前路径_python获取当前目录路径和上级路径的实例
  17. VSS 2005 配置(含录像)
  18. 【2016Esri全球用户大会主题亮点】GIS is Getting Smarter——JACK主题演讲权威解读
  19. 高分辨率扫描出来的图片有摩尔纹_文档扫描仪选购指南:扫描仪哪个牌子比较好?...
  20. IPX 、 IPEX 、 UFL连接器

热门文章

  1. 基于51单片机的智能电子秤
  2. 总结OnOK()、OnCancel()、OnClose()、OnDestroy()之间的区别(转)
  3. 神州数码DCWS-6028命令总结(二)
  4. java中浅蓝色代表的代码_淡蓝色的帆
  5. 【学习总结】项目中用到的caffeine缓存
  6. 哈希表(Hash Table)及散列法(Hashing)
  7. mysql的压缩包安装
  8. 软件测试周刊(第77期):只要放弃一次,就会滋生放弃的习性, 原本可以解决的问题也会变得无法解决。
  9. 全球与中国高压泵市场现状及未来发展趋势
  10. sd卡数据怎么恢复?