nagios只能监控服务器1分钟,5分钟和15分钟的情况。但我们无法通过nagios了解当发生状况那一瞬间我们的服务器运行了哪些服务。这无法帮助我们找出导致出问题的原因。因为需要记录发生状况一瞬间的服务。

1. 编辑主机文件linhost.cfg

define service{

use                     generic-service

host_name               linhost

service_description     Load_Average_RES

check_command           check_nrpe!check_load

event_handler           processes_snapshot_RES!linhost

contact_groups          admins

}

define service{

use                     generic-service

host_name               linhost

service_description     Load_Average_CPU

check_command           check_nrpe!check_load

event_handler           processes_snapshot_CPU!linhost

contact_groups          admins

}

2. 编辑命令文件command.cfg

define command{

command_name    processes_snapshot_RES

command_line   $USER1$/eventhandlers/processes_snapshot_RES.sh $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$ $HOSTADDRESS$

}

define command{

command_name    processes_snapshot_CPU

command_line    $USER1$/eventhandlers/processes_snapshot_CPU.sh $SERVICESTATE$ $SERVICESTATETYPE$ $SERVICEATTEMPT$ $HOSTADDRESS$

}

3. 编辑脚本processes_snapshot_CPU.sh和processes_snapshot_RES.sh

processes_snapshot_CPU.sh

#!/bin/bash

case "$1" in

OK)

;;

WARNING)

/usr/local/nagios/libexec/check_nrpe -H $4 -c processes_snapshot_CPU

;;

UNKNOWN)

;;

CRITICAL)

/usr/local/nagios/libexec/check_nrpe -H $4 -c processes_snapshot_CPU

;;

esac

exit 0

processes_snapshot_RES.sh

#!/bin/bash

case "$1" in

OK)

;;

WARNING)

/usr/local/nagios/libexec/check_nrpe -H $4 -c processes_snapshot_RES

;;

UNKNOWN)

;;

CRITICAL)

/usr/local/nagios/libexec/check_nrpe -H $4 -c processes_snapshot_RES

;;

esac

exit 0

4. 编辑被监控端的配置文件nrpe.cfg

command[processes_snapshot_RES]=top -cSbn 1 | tail -n +8 | sort -rn -k6 | head -n 20 > /tmp/proc_snap_RES_`date +%y%m%d-%H:%H:%S`.txt

command[processes_snapshot_CPU]=top -cSbn 1 | tail -n +8 | sort -rn -k9 | head -n 20 > /tmp/proc_snap_CPU_`date +%y%m%d-%H:%H:%S`.txt

5. 在被监控端创建目录

#cd /usr/local/nagios

#mkdir log

#chmod 777 log

#chown nagios:nagios log

6. nagios具有缓存功能,我们需要关掉nagios的缓存功能。编辑nagios主配置文件nagios.cfg。

cached_host_check_horizon=0

cached_service_check_horizon=0

到此就配置好了,当我们的服务器负载过高时,就会在被监控服务器的/usr/local/nagios/log目录下生成文件记录那一瞬间运成的服务。

转载于:https://blog.51cto.com/yyyummy/1554483

nagios的实时监控相关推荐

  1. 看大众点评如何通过实时监控系统CAT打造7*24服务

    为什么80%的码农都做不了架构师?>>>    看大众点评如何通过实时监控系统CAT打造7*24服务 2015-06-08  尤勇  高可用架构 https://github.com ...

  2. 利用saltstack的api接口和modules实现实时监控

    前言: 其实一说起实时监控,我就有很多的感想 ~  以前也做过几个类似的全网流量监控的项目,用过websocket的模式的,还有就是redis pubsub模式,还有就是从同事的nagios获取流量数 ...

  3. 浅谈Telegraf+InfluxDB+Grafana快速搭建简易实时监控系统

    监控从来都是一个很宽泛的问题,任何可能出问题的地方都需要加入监控.全量监控的确是监控的终极目标.在搭建一套监控系统前,需要结合实际的系统情况和发展趋势进行考量.在作者看来,一套监控系统应主要由数据采集 ...

  4. java监听mysql_java实时监控mysql数据库变化

    对于二次开发来说,很大一部分就找找文件和找数据库的变化情况 对于数据库变化.还没有发现比较好用的监控数据库变化监控软件. 今天,我就给大家介绍一个如何使用mysql自带的功能监控数据库变化 1.打开数 ...

  5. 自动驾驶车路测法规出台,车辆需支持远程实时监控

     作者 | DavidZh 出品 | AI科技大本营(公众号ID:rgznai100) 4 月 12 日,工信部联合公安部.交通运输部公布了适用于全国范围的自动驾驶车辆道路测试规范. 相比之前北京 ...

  6. SpringBoot+WebSocket实时监控异常

    欢迎关注方志朋的博客,回复"666"获面试宝典 写在前面 此异常非彼异常,标题所说的异常是业务上的异常. 最近做了一个需求,消防的设备巡检,如果巡检发现异常,通过手机端提交,后台的 ...

  7. Android(Linux)实时监控串口数据

    之前在做WinCE车载方案时,曾做过一个小工具TraceMonitor,用于显示WinCE系统上应用程序的调试信息,特别是在实车调试时,用于监控和显示CAN盒与主机之间的串口数据.因为需要抢占市场先机 ...

  8. 基于大数据的Uber数据实时监控(Part 1:Spark机器学习)

    导言 据Gartner称:到2020年,25亿辆联网汽车将成为物联网的主要对象.联网车辆预计每小时可以生成25GB的数据,对这些数据进行分析实现实时监控.大数据目前是10个主要领域之一,利用它可以使城 ...

  9. linux下使用inotify实时监控文件变更,做完整性检查

    完整性检查是HIDS的重要组成部分之一,linux下做完整性检查的思路有3个 1.哈希对比 2.签名校验 3.inotify 方法有2个: A.定期检测,例如通过cron或程序内置计时器 B.实时检测 ...

最新文章

  1. 用原生 js jquery 实现知乎收起答案功能
  2. 浏览器加载本地html页面,在浏览器字段中加载本地HTML文件时是否显示白屏?
  3. 计算机组成原理中lad什么意思,计算机组成原理的大神们能不能帮忙做几道题啊...
  4. NOIP信息奥赛--1995“同创杯”初中复赛题题解(一)
  5. python六角形的绘制
  6. 错误ORA-04091: table is mutating, trigger/function may not see it的原因以及解决办法
  7. 升级安装linux ssh 升级安装
  8. 报错:TypeError: can‘t pickle _thread.RLock objects
  9. antd 表格树如何展开_ant-design-pro protable 树形表格默认展开
  10. 为什么计算机有信息记忆功能,为什么计算机有记忆能力
  11. springcloud 之 路由网关 zuul
  12. 最小错误率贝叶斯决策的基本思想_太赞了!机器学习基础核心算法:贝叶斯分类!(附西瓜书案例及代码实现)...
  13. 欢乐纪中A组周六赛【2019.3.30】
  14. “小朋友”们节日快乐呀~
  15. 实验教学管理系统 c语言程序代写源码下载
  16. PHP复习第三天-文件上传
  17. 网易2019校招笔试题-瞌睡
  18. 2019东北四省 H. Skyscraper (树状数组)
  19. 驱动开发之五 --- TDI之一(飞雪楚狂人)
  20. Android EditText 监听回车键

热门文章

  1. 亚马逊AI又遭抗议:一个好端端的美国官员,怎么就成罪犯了?
  2. 朱佳俊的无人车公司Nuro又有新进展:要给全美最大生鲜超市Kroger送货
  3. 程序员社区骂战:不满政治正确,LLVM元老宣布退出
  4. 谷歌这个大杀器要让英伟达慌了,实战评测:TPU相比GPU简直又快又省
  5. 《C语言编程初学者指南》一导读
  6. 查看cics 运行状态
  7. Java学习笔记——面向对象 1
  8. 利用SCCM 2007 软件分发
  9. 企业CRM项目实施调研内容有那些?
  10. 运用大数据分析开展主动服务