7.      Nagios每日健康检查报警短信

对于没有移动短信网关通道来说,让监控平台每天下午4:00发一条短信,不管有没有故障都发,这样以便管理员能够知道短信报警及nagios服务是否正常。

检查报警的方法如下:

7.1.      编写检查脚本

# cat /root/sh/nagios_check.sh

#!/bin/bash

#auther by Kevin@cmcc.com.cn

#check nagios service

nid=/usr/local/nagios/var/nagios.lock

if [ -f $nid ]

then

/usr/local/nagios/libexec/sms/sendsms.sh 13800000000 "Nagios service is OK, Don't worry it!"

echo -e "nagios service is ok"

else

/etc/init.d/nagios start

/usr/local/nagios/libexec/sms/sendsms.sh 13800000000 " nagios service is restart,It's ok "

fi

7.2.      添加crond计划

# crontab –e 添加如下内容:

00 16 * * *      /root/sh/nagios_check.sh > /root/sh/nagios_check.log /dev/null 2>&1

7.3.      配置飞信机器人报警 7.3.1.      Commands.cfg配置文件添加如下内容:

#host-notify-by-sms

define command {

command_name host-notify-by-sms

command_line /usr/local/nagios/libexec/sms/sendsms.sh 13800000000 " ** $NOTIFICATIONTYPE$ Host Alert: $HOSTNAME$ is AT: $DATE$ $HOSTSTATE$ ** "

}

#service-notify-by-sms

define command {

command_name service-notify-by-sms

command_line /usr/local/nagios/libexec/sms/sendsms.sh 13800000000 " *** $NOTIFICATIONTYPE$ $HOSTNAME$   $DATE$ $TIME$ $SERVICEDESC$ is $SERVICESTATE$ info:$SERVICEOUTPUT$ *** "

}

7.3.2.      Contacts.cfg配置添加:

define contact{

contact_name sms-members

use sms-mail-contact

alias Nagios Admin SMS

email admin@139.com

pager   13800000000

}

define contactgroup{

contactgroup_name admins

alias Nagios Administrators

members sms-members

}

7.3.3.      Templates.cfg

define contact{

name                            sms-contact

service_notification_period     24x7

host_notification_period        24x7

service_notification_options    w,u,c,r,f,s

host_notification_options       d,u,r,f,s

service_notification_commands   notify-service-by-sms

host_notification_commands      notify-host-by-sms

register                        0

}

7.3.4.      修改展示页面监控图片大小:        /usr/local/nagios/etc/pnp/config.php

# vim /usr/local/nagios/etc/pnp/config.php

$conf['graph_width'] = "500";

$conf['graph_height'] = "100";

这两行是定义监控页面大小比例的。RRDTool graph Image Size

8.      Troubleshooting

8.1.      web界面修改某个服务时报错

例如对某个服务进行临时安排其执行时间,或者不让它发警告,web页面上都有这样的设置.但是常常会有错误信息如下:

Could not open command file '/usr/local/nagios/var/rw/nagios.cmd' for update!

The permissions on the external command file and/or directory may be incorrect. Read the FAQs on how to setup proper permissions.

An error occurred while attempting to commit your command for processing.

关于这部分在nagios.cfg中有下面的内容

# EXTERNAL COMMAND FILE

# This is the file that Nagios checks for external command requests.

# It is also where the command CGI will write commands that are submitted

# by users, so it must be writeable by the user that the web server

# is running as (usually 'nobody'). Permissions should be set at the

# directory level instead of on the file, as the file is deleted every

# time its contents are processed.

这段话的核心意思是apache的运行用户要有对文件写的权限.权限应该设置在目录上,因为每次文件的内容被处理后文件就会被删掉

command_file=/usr/local/nagios/var/rw/nagios.cmd

本来将apache2运行的用户apache加到nagios组就应该可以了的

但是这个却不行,就将rw这个目录及其子文件的权限改了777,这样就可以了.

8.2.      点击host,service选项时,结果无法显示

安装nagios后,访问页面可以,点击host,service选项时,都是无法显示。后台日志

报错:

[Wed Sep 01 17:31:32 2010] [error] [client 222.128.103.52] Premature end of script headers: status.cgi, referer: http://public.ipaddr/nagios/side.php

[Wed Sep 01 17:31:33 2010] [error] [client 222.128.103.52] (13)Permission denied: exec of '/usr/local/nagios/sbin/status.cgi' failed, referer: http://public.ipaddr/nagios/side.php

解决方法:原因是因为开启了selinux,getenforce

令SELinux处于容许模式

setenforce 0

如果要永久性更变它,需要更改/etc/selinux/config里的设置并重启系统。

不关闭SELinux或是永久性变更它的方法是让CGI模块在SELinux下指定强制目标模式:

chcon -R -t httpd_sys_content_t /usr/local/nagios/sbin/

chcon -R -t httpd_sys_content_t /usr/local/nagios/share/

关闭即可。

8.3.   nagios3.2.0以后,安装nagios在访问http://ip/nagios时出现如下错误提示:

解决方法如下:nagios3.2.0将页面从之前的html换成了php,首次安装需要先决条件php 

yum install php即可

8.4.      出现pnp小太阳图标,点击报错如下:

Initalising

Using /usr/local/nagios/share/perfdata/

RRDTool /usr/bin/rrdtool found.

RRDTool /usr/bin/rrdtool is executable

PHP Function proc_open is enabled

PHP Function fpassthru is enabled

PHP Function xml_parser_create is enabled

PHP zlib Support found.

PHP GD Support can’t found.

解决方法: yum –y   install    php-gd

# service httpd restart

再次点击小太阳图标时,出现如下页面,则表示正常:

8.5.      安装NAGIOS时发现有Status Map、Alert Histogram打不开链接,提示找不到statusmap.cgi和histogram.cgi.

解决办法:

原因一:因为gd-devel没有安装的问题,造成NAGIOS在编译时不生成这statusmap.cgi

原因二:NAGIOS在编译在前, gd-devel安装在后,造成不生成这statusmap.cgi

8.6.      后台apache日志报错如下:

# tail -f /etc/httpd/logs/error_log

[Fri Feb 18 19:07:18 2011] [notice] suEXEC mechanism enabled (wrapper: /usr/sbin/suexec)

[Fri Feb 18 19:07:18 2011] [notice] Digest: generating secret for digest authentication ...

[Fri Feb 18 19:07:18 2011] [notice] Digest: done

[Fri Feb 18 19:07:18 2011] [notice] Apache/2.2.3 (CentOS) configured -- resuming normal operations

[Fri Feb 18 19:07:20 2011] [error] [client 127.0.0.1] Directory index forbidden by Options directive: /var/www/html/

[Fri Feb 18 19:07:42 2011] [error] [client 127.0.0.1] Directory index forbidden by Options directive: /var/www/html/

[Fri Feb 18 19:07:55 2011] [error] [client 127.0.0.1] Directory index forbidden by Options directive: /var/www/html/

监控http服务出现响应超时的情况,如下所示:

# /usr/local/nagios/libexec/check_http -I localhost -w 15 -c 20 -t 30

HTTP WARNING: HTTP/1.1 403 Forbidden - 5240 bytes in 0.003 second response time |time=0.002991s;15.000000;20.000000;0.000000 size=5240B;;;0

解决方法:

# echo -n none > /var/www/html/index.html

8.7.      进行编译安装ndoutils-1.4b7时,报错如下:

#./db/installdb -ucacti -pcacti -d cacti

DBD::mysql::db do failed: Table 'cacti.nagios_dbversion' doesn't exist at ./db/installdb line 51.

命令使用错误,解决方法如下:

# ./installdb -ucacti -pcacti -h localhost -d cacti    //加上 –h localhost参数

DBD::mysql::db do failed: Table 'cacti.nagios_dbversion' doesn't exist at ./installdb line 51.

** Creating tables for version 1.4b7

Using mysql.sql for installation...

** Updating table nagios_dbversion

Done!

8.8.      安装后,查看/usr/local/nagios/var/nagios.log日志,报错如下:

#tail –f /usr/local/nagios/var/nagios.log

[1298198680] Error: Could not safely copy module '/usr/local/nagios/bin/ndomod.o'. The module will not be loaded: No such file or directory

[1298202280] Auto-save of retention data completed successfully.

原因为:前面安装ndoutils-1.4b7,少了一个操作步骤。解决办法如下:

# mv /usr/local/nagios/bin/ndomod-3x.o /usr/local/nagios/bin/ndomod.o //新添加

正确的日志如下:

# tail -f /usr/local/nagios/var/nagios.log

[1298346735] Event broker module '/usr/local/nagios/bin/ndomod.o' deinitialized successfully.

[1298346735] Nagios 3.2.1 starting... (PID=13489)

[1298346735] Local time is Tue Feb 22 11:52:15 CST 2011

[1298346735] LOG VERSION: 2.0

[1298346735] ndomod: NDOMOD 1.4b9 (10-27-2009) Copyright (c) 2009 Nagios Core Development Team and Community Contributors

[1298346735] ndomod: Successfully connected to data sink. 0 queued items to flush.

[1298346735] Event broker module '/usr/local/nagios/bin/ndomod.o' initialized successfully.

[1298350335] Auto-save of retention data completed successfully.

[1298353935] Auto-save of retention data completed successfully.

[1298357535] Auto-save of retention data completed successfully.

8.9.      有时开机后,后台报错如下:

# tail -f /usr/local/nagios/var/nagios.log

[1298439477] ndomod: Still unable to connect to data sink. 23512 items lost, 5000 queued items to flush.

[1298439493] ndomod: Still unable to connect to data sink. 23590 items lost, 5000 queued items to flush.

以上报错一般是由于ndo2db没有启动,手动启动即可:

#/usr/local/nagios/bin/ndo2db -c /usr/local/nagios/etc/ndo2db.cfg    启动ndo2db

8.10.访问npc插件页面时,主机图标为红色叉号:

解决办法如下:

# cp -r /usr/local/nagios/share/p_w_picpaths/logos/logo.gif /var/www/html/cacti/plugins/npc/logo.gif

重新刷新页面即可解决问题。正常页面为:

8.11.访问点击小太阳后,报错如下:

Hostnane is not set:是pnp的提示,pnp需要以以下方式访问index.php?host=$HOSTNAME$&srv=$SERVICEDESC$ 或者index.php?host=$HOSTNAME;

而通过脚本推送时,变量发生了变化,生成的文件如下:

#define_host

define host {

name       host-pnp

register   0

process_perf_data 1

action_url /nagios/pnp/index.php?host=nagios.com.cn$   这样不正确的

action_url /nagios/pnp/index.php?host=$HOSTNAME$    //这是正确格式

}

#define_service

define service {

name       srv-pnp

register   0

process_perf_data 1

action_url /nagios/pnp/index.php?host=nagios.com.cn$&srv=$ 这样是不正确的

action_url /nagios/pnp/index.php?host=$HOSTNAME$&srv=$SERVICEDESC$ //正确格式

}

转载于:https://blog.51cto.com/2358205/1092890

整合nagios+cacti遇到问题及解决办法相关推荐

  1. cacti 整合nagios,以及总是off处理办法!

    主要步骤: 1.安装ndoutils,把nagios数据写到mysql. 2.在cacti安装npc插件,查看nagios的数据. 一.安装 1.安装ndoutils的依赖包 (1)安装DBI wge ...

  2. 整合nagios+cacti+微信、飞信实现网络监控系统报警

    系统环境:rhel6.4 selinux disabled  和 iptables 整合cacti和nagios是利用了cacti的一个插件nagios for cacti,它的原理是将nagios的 ...

  3. Nagios+Cacti+Nconf配置

    生产环境开源监控系统整合Nagios+Cacti+Nconf 原始出处:http://www.weiyan.me/2012/05/130根据该文增加注释 软件打包的下载地址如下http://down. ...

  4. 合租服务器禁用 fsockopen 函数,部分程序不正常的解决办法。

    近期黑客利用程序漏洞注入后使用 fsockopen 进行PHPDDOS 攻击,导致部分服务器不稳定,现在将危险函数 fsockopen 暂时禁用,部分程序功能可能有问题,以下列出已知问题及通用解决方法 ...

  5. Nagios+Cacti模块——Nagios+Cacti 搭建及整合(一)

    注意:这里默认关闭了Selinux(生产环境也是关的)以及关闭了iptables.如有开启的需要,请根据网络酌情添加相关内容. 遇到问题:公司服务器需实现监控及报警等功能 解决问题:使用nagios+ ...

  6. [DiscuzNt]整合DiscuzNt论坛目前所发现的小BUG及个人简单解决办法

    前段时间因为公司项目需要,需要在网站中整合BBS论坛,主要实现会员信息同步,经过目前市面上开源的BBS项目,最终认为还是DiscuzNt比较好,原因有以下几点: 1.符合国人习惯,DiscuzNt是由 ...

  7. SpirngBoot整合MyBatis出现“SAXParseException”和“文件提前结束”异常解决办法

    故障现象: 程序是使用 SpringBoot 整合 MyBatis 的,在idea下运行的时候没有任何问题,但是打包成 jar 包单独运行就出问题,不论是在 Windows 环境下还是在 Linux ...

  8. 也谈cacti整合nagios(centos)

    花了近一天的时间整合了cacti和nagios,cacti用来检测运行状态nagios主要用来预警.期间参考了很多网友的文章,在此感谢下!在这里记录一下配置过程,以备后忘..说整合其实只是表面的,ca ...

  9. 齐博php百度编辑器上传图片_齐博CMS整合百度编辑器上传附件的BUG以及解决办法...

    齐博CMS作为目前PHP类CMS中最草根的CMS,能够及时的为站长们着想,将开源的百度编辑器整合进程序,这是值得广大站长欢呼雀跃的事情.但就目前来说,齐博CMS与百度编辑器的整合还是存在一些细小的问题 ...

  10. 【SpringBoot整合Mybatis】数据库某字段值为空时,接口未返回该字段 解决办法

    [SpringBoot整合Mybatis]数据库字段为空时,接口不返回该字段 解决办法 问题描述: 排查问题: 解决问题: 测试: 参考资料: 今天整合项目的时候,发现了SpringBoot整合Myb ...

最新文章

  1. 2009 Competition Highlights by ICPC Live
  2. mplayer-php,jQuery MPlayer网站音乐播放器插件
  3. 零基础实践深度学习之数学基础
  4. linux下tomcat服务器的启动和关闭以及查看实时打印日志
  5. 算法积分0042算法笔记——【随机化算法】计算π值和计算定积分
  6. linux嵌入式贪吃蛇
  7. java 设计模式 示例_Java中的中介器设计模式-示例教程
  8. 转载Silverlight AutoCompleteBox 增强key/value 拼音头检索
  9. 容器的进程与namespace、rootfs
  10. c# 封装“度分秒”与弧度之间的转换 以及datagridview控件的应用
  11. linux 驱动器发送信号,Linux设备驱动并发控制详解(自旋锁,信号量)
  12. windows下release模式调试某行代码无法中断
  13. gan网络损失函数_生成对抗网络的最新研究进展
  14. paip.discuz x2.5 用户及积分账户的接口attilax总结
  15. 网易云音乐批量下载工具编写过程
  16. U盘中毒变成exe快捷键文件不见问题
  17. Web前端满屋花案例框架
  18. 张三思评博客:常见的并发网络服务程序设计方案
  19. 微机原理之8255和8253的初始化
  20. LaTex 制作简历

热门文章

  1. 【Boost】boost库的随机数的例子
  2. “按字典序输出方案” 解决方法
  3. 快速突破面试算法之动态规划篇
  4. 使用_thread多线程模块ping主机代码
  5. mysql5.7 开启重连_MySQL5.7.9,怎样永久设置client、connection、results这三项为utf8?...
  6. MyCat - 使用篇(5)
  7. element ui 1.4 升级到 2.0.11
  8. centos 7 升级python2.7 到3.5
  9. tab选项卡不同样式的效果
  10. 自卑都是自己不踏实做事的表现