nagios的实时监控
nagios只能监控服务器1分钟,5分钟和15分钟的情况。但我们无法通过nagios了解当发生状况那一瞬间我们的服务器运行了哪些服务。这无法帮助我们找出导致出问题的原因。因为需要记录发生状况一瞬间的服务。
1. 编辑主机文件linhost.cfg
define service{
use generic-service
host_name linhost
service_description Load_Average_RES
check_command check_nrpe!check_load
event_handler processes_snapshot_RES!linhost
contact_groups admins
}
define service{
use generic-service
host_name linhost
service_description Load_Average_CPU
check_command check_nrpe!check_load
event_handler processes_snapshot_CPU!linhost
contact_groups admins
}
2. 编辑命令文件command.cfg
define command{
command_name processes_snapshot_RES
command_line $USER1$/eventhandlers/processes_snapshot_RES.sh $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$ $HOSTADDRESS$
}
define command{
command_name processes_snapshot_CPU
command_line $USER1$/eventhandlers/processes_snapshot_CPU.sh $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$ $HOSTADDRESS$
}
3. 编辑脚本processes_snapshot_CPU.sh和processes_snapshot_RES.sh
processes_snapshot_CPU.sh
#!/bin/bash
case "$1" in
OK)
;;
WARNING)
/usr/local/nagios/libexec/check_nrpe -H $4 -c processes_snapshot_CPU
;;
UNKNOWN)
;;
CRITICAL)
/usr/local/nagios/libexec/check_nrpe -H $4 -c processes_snapshot_CPU
;;
esac
exit 0
processes_snapshot_RES.sh
#!/bin/bash
case "$1" in
OK)
;;
WARNING)
/usr/local/nagios/libexec/check_nrpe -H $4 -c processes_snapshot_RES
;;
UNKNOWN)
;;
CRITICAL)
/usr/local/nagios/libexec/check_nrpe -H $4 -c processes_snapshot_RES
;;
esac
exit 0
4. 编辑被监控端的配置文件nrpe.cfg
command[processes_snapshot_RES]=top -cSbn 1 | tail -n +8 | sort -rn -k6 | head -n 20 > /tmp/proc_snap_RES_`date +%y%m%d-%H:%H:%S`.txt
command[processes_snapshot_CPU]=top -cSbn 1 | tail -n +8 | sort -rn -k9 | head -n 20 > /tmp/proc_snap_CPU_`date +%y%m%d-%H:%H:%S`.txt
5. 在被监控端创建目录
#cd /usr/local/nagios
#mkdir log
#chmod 777 log
#chown nagios:nagios log
6. nagios具有缓存功能,我们需要关掉nagios的缓存功能。编辑nagios主配置文件nagios.cfg。
cached_host_check_horizon=0
cached_service_check_horizon=0
到此就配置好了,当我们的服务器负载过高时,就会在被监控服务器的/usr/local/nagios/log目录下生成文件记录那一瞬间运成的服务。
转载于:https://blog.51cto.com/yyyummy/1554483
nagios的实时监控相关推荐
- 看大众点评如何通过实时监控系统CAT打造7*24服务
为什么80%的码农都做不了架构师?>>> 看大众点评如何通过实时监控系统CAT打造7*24服务 2015-06-08 尤勇 高可用架构 https://github.com ...
- 利用saltstack的api接口和modules实现实时监控
前言: 其实一说起实时监控,我就有很多的感想 ~ 以前也做过几个类似的全网流量监控的项目,用过websocket的模式的,还有就是redis pubsub模式,还有就是从同事的nagios获取流量数 ...
- 浅谈Telegraf+InfluxDB+Grafana快速搭建简易实时监控系统
监控从来都是一个很宽泛的问题,任何可能出问题的地方都需要加入监控.全量监控的确是监控的终极目标.在搭建一套监控系统前,需要结合实际的系统情况和发展趋势进行考量.在作者看来,一套监控系统应主要由数据采集 ...
- java监听mysql_java实时监控mysql数据库变化
对于二次开发来说,很大一部分就找找文件和找数据库的变化情况 对于数据库变化.还没有发现比较好用的监控数据库变化监控软件. 今天,我就给大家介绍一个如何使用mysql自带的功能监控数据库变化 1.打开数 ...
- 自动驾驶车路测法规出台,车辆需支持远程实时监控
作者 | DavidZh 出品 | AI科技大本营(公众号ID:rgznai100) 4 月 12 日,工信部联合公安部.交通运输部公布了适用于全国范围的自动驾驶车辆道路测试规范. 相比之前北京 ...
- SpringBoot+WebSocket实时监控异常
欢迎关注方志朋的博客,回复"666"获面试宝典 写在前面 此异常非彼异常,标题所说的异常是业务上的异常. 最近做了一个需求,消防的设备巡检,如果巡检发现异常,通过手机端提交,后台的 ...
- Android(Linux)实时监控串口数据
之前在做WinCE车载方案时,曾做过一个小工具TraceMonitor,用于显示WinCE系统上应用程序的调试信息,特别是在实车调试时,用于监控和显示CAN盒与主机之间的串口数据.因为需要抢占市场先机 ...
- 基于大数据的Uber数据实时监控(Part 1:Spark机器学习)
导言 据Gartner称:到2020年,25亿辆联网汽车将成为物联网的主要对象.联网车辆预计每小时可以生成25GB的数据,对这些数据进行分析实现实时监控.大数据目前是10个主要领域之一,利用它可以使城 ...
- linux下使用inotify实时监控文件变更,做完整性检查
完整性检查是HIDS的重要组成部分之一,linux下做完整性检查的思路有3个 1.哈希对比 2.签名校验 3.inotify 方法有2个: A.定期检测,例如通过cron或程序内置计时器 B.实时检测 ...
最新文章
- 用原生 js jquery 实现知乎收起答案功能
- 浏览器加载本地html页面,在浏览器字段中加载本地HTML文件时是否显示白屏?
- 计算机组成原理中lad什么意思,计算机组成原理的大神们能不能帮忙做几道题啊...
- NOIP信息奥赛--1995“同创杯”初中复赛题题解(一)
- python六角形的绘制
- 错误ORA-04091: table is mutating, trigger/function may not see it的原因以及解决办法
- 升级安装linux ssh 升级安装
- 报错:TypeError: can‘t pickle _thread.RLock objects
- antd 表格树如何展开_ant-design-pro protable 树形表格默认展开
- 为什么计算机有信息记忆功能,为什么计算机有记忆能力
- springcloud 之 路由网关 zuul
- 最小错误率贝叶斯决策的基本思想_太赞了!机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)...
- 欢乐纪中A组周六赛【2019.3.30】
- “小朋友”们节日快乐呀~
- 实验教学管理系统 c语言程序代写源码下载
- PHP复习第三天-文件上传
- 网易2019校招笔试题-瞌睡
- 2019东北四省 H. Skyscraper (树状数组)
- 驱动开发之五 --- TDI之一(飞雪楚狂人)
- Android EditText 监听回车键