从0开始解决线上Zabbix监控平台故障

(1)学习Linux技术,后期从事Linux运维方面的工作,作为运维人员最主要的工作职责之一:保障企业门户网站、业务系统、数据库、服务器高效稳定的运行,一旦有异常或者故障能够第一时间去解决。

(2)作为运维人员是如何第一时间去获取门户网站、业务系统、数据库、服务器等运行状态呢?是通过手工7x24x365去刷新和访问吗?可以通过开源的监控软件平台7x24x365实时自动的去检测其运行的状态。

(3)互联网IT企业中,主流的开源监控软件有哪些种类呢?

MRTG;

Cacti;

Nagios;

Ganglia;

Zabbix;

Prometheus;

(4)通过线上云服务器构建了一套Zabbix监控平台,发现监控平台无法运行了,而且报错信息如图所示:

Zabbix server is running No localhost:10051

#根据上图的提示,表示Zabbix Server的运行状态是:No,没有监听本地localhost主机地址+10051端口,解决方法:

检测一下Zabbix Server服务进程和端口是否存在;

ps -ef|grep zabbix_server

netstat -tnlp|grep -w 10051

通过手工方式启动一下Zabbix server独立服务即可;

/etc/init.d/zabbix_server start

(5)启动Zabbix Server服务时,报错信息二如下所示:

Can't find file /usr/local/sbin/zabbix_server.

Zabbix server NOT started.

#根据如上的错误提示,表示启动Zabbix Server服务时,启动脚本文件会读取Zabbix Server主程序文件:/usr/local/sbin/zabbix_server,该文件提示不能找到,所以Zabbix Server服务不能启动。

解决方法:

检测Zabbix Server主程序文件/usr/local/sbin/zabbix_server是否存在;

if [ -f /usr/local/sbin/zabbix_server ];then echo ok ;fi

ls -l /usr/local/sbin/zabbix_server

可以通过find|locate工具查找zabbix_server主程序文件的路径;

find / -name "zabbix_server"

find / -name "zabbix_server"|grep -vE "init|bak"

ln -s /usr/local/zabbix/sbin/zabbix_server /usr/local/sbin/

find / -name "zabbix_server"|grep -vE "init|bak" -exec ln -s {} /usr/local/sbin/ ;

(6)启动Zabbix Server服务时,报错信息三如下所示:

Zabbix_server [10775]: user zabbix does not exist

Zabbix_server [10775]: cannot run as root!

#根据如上的错误提示,表示启动Zabbix Server服务时,需要使用zabbix用户去启动,而Linux系统没有检测到该用户,该用户是不存在的,不能使用root用户直接启动。

解决方法:

检测一下Linux系统是否存在zabbix用户;

id zabbix

grep -w zabbix /etc/passwd

通过手工useradd命令创建zabbix用户即可;

useradd -s /sbin/nologin zabbix -M

(7)启动Zabbix Server服务时,报错信息四如下所示:

Connection to database 'zabbix' failed: [1045] Access denied for user 'zabbix'@'localhost' (using password: NO)

#根据如上的错误提示,表示启动Zabbix Server服务时,Zabbix Sever服务组件需要连接后端MYSQL数据库服务,要往数据库中持久化存储客户端监控数据,错误提示使用zabbix用户和空密码,通过localhost登陆数据库服务,访问zabbix库被拒绝。

解决方法:

检测一下后端MYSQL数据库是否授权&创建zabbix库

show databases;

select user,host,password from mysql.user;

检测zabbix server配置文件,数据库连接信息是否填写密码或者密码是否正确

基于Zabbix监控线上阿里云服务器

(1)根据如上的Zabbix故障排错,Zabbix监控平台可以正常使用了,作为运维人员能够利用Zabbix监控平台去监控哪些数据呢?监控哪些指标呢?能够给企业带来哪些好处呢?

(2)在企业中,可以使用Zabbix来监控四个层面的数据指标,哪四个层面呢?

硬件层面

Zabbix可以监控硬件服务器设备,例如监控硬件设备的CPU温度、硬盘异常情况、风扇转速、电源异常情况、机箱是否被黑客入侵等。

软件层面

Zabbix可以监控软件服务,例如监控Nginx、Tomcat、MQ、ZK、ELK、Redis、MYSQL、LVS、Keepalived等服务的运行状态、PID、端口号,可以监控服务的返回值、状态码等。

系统层面

Zabbix可以监控Windows/Linux操作系统,监控指标:CPU、MEM、DISK、NET、I/O、Open files、Process、User、Port等。

网络层面

Zabbix可以监控网络设备,例如监控交换机、路由器、防火墙设备,监控其出口和入口的带宽,监控设备之间的网络连通性等。

往期文章精选:

官方调研重磅发布,Pandas或将重构?

想学python看这里!送给小白的六个建议

欢迎大家关注我的头条号,私信“python",学习资料包免费分享给需要的朋友,另有python学习交流群,可以交流学习拓展人脉。

php调取 zabbix实时数据_Linux运维必知的Zabbix故障排错实战相关推荐

  1. 运维必看,zabbix详细攻略,监控原理、监控流程、部署流程

    Zabbix简介 zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案. zabbix能监视各种网络参数,保证服务器系统的安全运营:并提供灵活的通知机制以让系统管 ...

  2. 运维必知必会的监控知识体系全梳理

    公众号回复:干货,领取价值58元/套IT管理体系文档 公众号回复:ITIL教材,领取最新ITIL4中文教材 正文 监控是整个运维乃至整个产品生命周期中最重要的一环,事前及时预警发现故障,事后提供详实的 ...

  3. 运维必知的23个经验教训,值得收藏!

    今天小编给大家分享一下运维人员必知的23个经验教训,值得读一读! 一.线上操作规范 1. 测试使用 当初学习Linux的使用,从基础到服务到集群,都是在虚拟机做的,虽然老师告诉我们跟真机没有什么差别, ...

  4. redis高效运维必知必会

    目录 一.内存统计 二.内存划分 2.1 对象内存 2.2内存碎片 三.内存消耗 四.缓冲内存 普通客户端缓冲区 slave客户端缓冲区 pubsub客户端缓冲区 复制缓冲区 AOF缓冲区 五.对象内 ...

  5. 面试题mysql环境搭建_Linux运维必会的100道MySql面试题之(四)

    020:如何开启从库的binlog功能? 修改配置文件加上下面的配置 log_bin=slave-bin log_bin_index=slave-bin.index 需要重启服务 021:MySQL如 ...

  6. MySQL和Linux试题_Linux运维必会的MySql题之(一)

    如何启动MySql服务 /etc/init.d/mysqld start service mysqld start Centos7.x 系统 systemctl start mysqld 检测端口是否 ...

  7. mysql 建表语句 及完整案例_Linux运维必会的100道MySql面试题之(一)

    01 如何启动MySql服务 /etc/init.d/mysqld start service mysqld start Centos 7.x 系统 sysctl start mysqld02 检测端 ...

  8. 运维必知的网络基础知识!

    网络基础知识 一.OSI七层模型 1.1应用层 1.2表示层 1.3会话层 1.4传输层 1.5网络层 1.6数据链路层 1.7物理层 二.TCP/IP五层参考模型解封装 三.TCP/IP协议簇 四. ...

  9. 【Linux】Linux运维必知必会的网络基础一

    文章目录 网络常见的设备 如何衡量网络的好坏 网络中的物理拓扑和逻辑拓扑 a. 物理拓扑 b. 逻辑拓扑 c. 逻辑拓扑的图示解释 网络常见的设备 网络探讨的就是终端到终端的数据传输 终端设备(PC, ...

最新文章

  1. SQL Server-流程控制 5,Goto 语句
  2. android 程序安装路径选择
  3. js仿QQ中对联系人向左滑动、滑出删除按钮的操作
  4. 五种常见粗粮的最佳养生吃法
  5. python 运算符重载_《fluent python》第 13 章 正确重载运算符
  6. SAP License:如何预防企业“癌症”
  7. centos mysql5.7.17_在centos 7下安装mysql 5.7.17
  8. jbd2 mysql_jbd2 BUG · xiewen/xiewen.github.io Wiki · GitHub
  9. ubuntu_linux命令TX2学习总结
  10. 硬件工程师需要掌握什么基础知识
  11. 计算机类sci一区是什么水平,计算机类高质量SCI分区高水平期刊投稿建议汇总
  12. easyExcel工具类使用
  13. NET开发邮件发送功能的全面教程(含邮件组件源码)(
  14. 【数据压缩】实验:H.264文件分析
  15. 机器学习实操的7个步骤
  16. WinRAR 7z压缩包处理溢出分析和利用(转)
  17. 作文提升~老师整理的优美排比句太实用
  18. h5py is running against HDF5 1.10.5 when it was built against 1.10.4
  19. 最大子串和【浙江工商大学oj】【详细注释版】
  20. 2022校招已开启,学生党必备之什么是秋招和春招!

热门文章

  1. VTK修炼之道36:图像平滑_均值滤波器
  2. 关于子对话框的创建与销毁
  3. 静态成员变量的初始化,vector类型变量初始化
  4. 有时候明明没有问题的程序为什么通不过?
  5. 结构体:求最高分和最低分
  6. 链表之CIRCLEQ
  7. nginx中js修改不生效的问题
  8. 使用c:foreach时链接失效
  9. 操作系统(三十)避免死锁
  10. 新浪是如何分析处理32亿条实时日志的?