服务器宕机监控、检测、报警程序(139绑定手机短信报警)monitor_down.sh
宕机监控报警程序
一. 需求来源
宕机对运维人员来说,最痛苦了。如何检测一台服务器是否还在正常运行,如果该服务器宕机,如何在第一时间监测到并通知一线运维人员进行维护,最大化减少损失。
二. 程序功能
对指定服务器进行宕机监测,如果确实宕机,则发送email到139邮箱(绑定手机,实现短信报警)
三.源程序
#!/bin/bash
#author longxibendi
#blog http://blog.csdn.net/longxibendi
#function ping a host and output to file ping_longxibendi.log
#ping destination
function_ping ()
{ping -c 3 172.29.141.115 > ping_longxibendi.log
}
#downtime detection and send email to SA
function_downtime_detection_AND_sendemail ()
{if [ "`cat ping_longxibendi.log | grep Unreachable`" != "" ] ; then/usr/local/bin/sendEmail -f monitor_sys@163.com -t longxibendi@139.com -s smtp.163.com -u "Server downtime" -xu monitor_sys -xp 123456789 -m "`date;echo "172.29.141.115" ` "fi
}
#main function
function_main ()
{
while true
dofunction_ping ;sleep 2function_downtime_detection_AND_sendemail ;sleep 2done
}
function_main ;
四.程序说明
1.通过 function_ping ,每隔4秒对 主机 172.29.141.115 进行ping 操作,(当然,如果主机172.29.141.115的防火墙,或者内过滤ICMP包,那么这个程序显然不能用)将输出重定向到ping_longxibendi.log 文件中
2.通过 function_downtime_detection_AND_sendemail ,每隔4秒,通过ping_longxibendi.log判断是否有没有ping通的迹象,如果有,则调用 sendEmail 邮件(手机短信)报警。
3.监控间隔时间说明 ,可以将 第一个 sleep 改为 150 ,第二个 sleep 改为 150 ,这样每隔5分钟监控一次。
四.使用环境说明
1.主机 A(172.29.141.112) 主机B (172.29.141.115) ,
在A上部署该监控程序(monitor_down.sh),用于监控B
2.正常情况下A能ping通B
因为用的ping命令,所以如果使用该程序,需要在正常情况下A ping 通 B 。对企业来说,这可能就需要防火墙和Linux内核参数(当然,如果之前没有修改net.ipv4.icmp_echo_ignore_all,则不需要调整)
3.安装了 sendEmail 并 在139邮箱注册(绑定手机),方可有邮件(短信)报警提示
五.程序测试
[root@localhost monitor]# sh monitor_down.sh
May 21 20:33:46 localhost sendEmail[9175]: Email was sent successfully!
May 21 20:33:56 localhost sendEmail[9204]: Email was sent successfully!
Terminated
[root@localhost monitor]#
六.程序扩展
这个程序,只是实现宕机监控并报警,但没有实现故障转移,自动切换功能。其实,只要稍微修改一下程序就可以实现故障转移,自动切换。故障转移,比如可以通过在热备机A上部署该程序,监控B,一旦B宕机,则A执行浮动改IP和更新下层服务器arp列表即可。可以参考
http://blog.csdn.net/longxibendi/archive/2011/05/21/6436606.aspx
声明:本文档可以随意更改,但必须署名原作者
作者:凤凰舞者 qq:578989855
服务器宕机监控、检测、报警程序(139绑定手机短信报警)monitor_down.sh相关推荐
- nagios整合ganglia实现hadoop、Hbase监控及手机短信报警
预计该博文篇幅较长,这里不再废话,对ganglia不太了解的去问谷老师,直接看环境: hadoop1.updb.com 192.168.0.101 hadoop2.updb.com 192 ...
- 程序主动进行电话短信报警,自定义电话、短信、钉钉报警通知
程序主动进行电话短信报警,自定义电话.短信.钉钉报警通知 一. 规则说明 这里我们要利用到阿里云的云监控的手段,有一个叫做事件监控的东西,可以通过自定义事件上传来进行监控报警. 流程: 程序发现错误 ...
- stm32/esp32/cam智能安防系统远程视频监控物联网远程传输视频图像GSM短信报警
系统实现了智能安防报警系统设计,人体感应报警,烟雾报警,GSM短信报警,同时支持远程视频监控功能,安卓端app端远程查看视频流.实物展示视频 基于stm32单片机ESP32智能安防系统远程 ...
- 139邮箱短信报警实现
一.问题的提出 如何在最短的时间,让非在线运维人员得到服务器运行情况?如何在服务器宕机后,在第一时间能通知非在线运维人员 ? 二.问题的初步解决 移动办公(移动终端运维支持)很重要,通过手机短信报警, ...
- 小程序实现手机短信验证功能
小程序实现手机短信验证功能 废话不多说,直接把项目写的手机短信验证功能发出来 .wxml <form bindsubmit="phone"> <input typ ...
- linux服务器宕机分析/性能瓶颈分析
linux服务器宕机分析/性能瓶颈分析 服务器宕机原因很多,资源不足.应用.硬件.系统内核bug等,以下一个小例子 服务器宕机了,首先得知道服务器宕机的时间点,然后分析日志查找原因 1.last re ...
- keep老是显示服务器开小差,nginx+keepalived高可用服务器宕机解决方案
原标题:nginx+keepalived高可用服务器宕机解决方案 1.基本服务器宕机的主从切换配置 两台nginx服务器,分别安装keepalived,配置/etc/keepalived/keepal ...
- 网站服务器宕机怎么办,服务器宕机了该怎么办?
原标题:服务器宕机了该怎么办? 导读 如果Web服务器已经虚拟化,试着ping物理服务器自己的真实IP.这样可以帮助你进一步隔离问题.如果完全无法ping同服务器,而且也已经确定完全检查了网络连接,那 ...
- 保证服务器宕机业务不中断,备特佳CDP容灾备份系统——服务器端数据备份软件 - 和力记易--CDP容灾备份专家...
软件介绍: 备特佳CDP容灾备份系统是和力记易自主研发适用于服务器端数据备份的CDP容灾备份软件,是一款主要面向Windows.Linux.Unix平台下集数据库备份.文件备份.操作系统备份于一体的C ...
- 服务器占用cpu启动就死机,造成服务器宕机(死机)的原因和解决方法
原标题:造成服务器宕机(死机)的原因和解决方法 随着如今互联网信息化时代的不断发展,网络数据服务器.IDC数据存储和传输在各种网络科技面前也显得越来越重要,那么选择一款好用的服务器愈发重要.当然,不管 ...
最新文章
- 五大洲30国在华留学生千年古城欢度中国年
- AndroidStudio更换黑色主题方法
- Centos7.3 安装Mysql5.7并修改初始密码
- 为何大多数人做出来的图表只是一坨屎?
- shiro 的session持久化
- nod32可以限制软件安装么_玻璃钢法兰安装时可以别劲么 玻璃钢法兰安装视频
- android 广播 7.0变化,安卓7.0到底带来了那些变化?
- 乱码问题产生的原因与解决方案---UTF-8
- axure选中后横线切换_Axure8.0|动态面板内容简单切换技巧
- MySQL管理利器 MySQL Utilities---mysqlreplicate
- uds帧格式_如何看懂UDS诊断报文
- php自动采集入库,Phpcms v9自动采集入库自动发布组件
- S5PV210裸机之SD卡
- 算法训练营 重编码_关于如何在没有训练营的情况下学习编码的10条提示
- CSDN,我!王睿,回来了!!!
- Xmind 2022精彩体验---什么叫流程图
- js 实现单击、双击事件
- 计算机系统u盘判断,U盘真实容量检测工具
- 想自己搭建服务器,永久运行网站?一个U盘大小的树莓派就够了!
- windows服务器双网卡链路聚合_[分享]Windows 8 及以上版本 开启多网卡链路聚合 | 霸王硬上弓's Blog...