宕机监控报警程序

一.  需求来源

宕机对运维人员来说,最痛苦了。如何检测一台服务器是否还在正常运行,如果该服务器宕机,如何在第一时间监测到并通知一线运维人员进行维护,最大化减少损失。

二.  程序功能

对指定服务器进行宕机监测,如果确实宕机,则发送email到139邮箱(绑定手机,实现短信报警)

三.源程序

#!/bin/bash
#author         longxibendi
#blog           http://blog.csdn.net/longxibendi
#function       ping  a  host   and   output  to  file     ping_longxibendi.log
#ping  destination
function_ping ()
{ping  -c 3     172.29.141.115  >  ping_longxibendi.log
}
#downtime detection and  send email to   SA
function_downtime_detection_AND_sendemail ()
{if  [ "`cat ping_longxibendi.log | grep Unreachable`"  !=  ""    ] ; then/usr/local/bin/sendEmail -f monitor_sys@163.com -t longxibendi@139.com -s smtp.163.com -u "Server downtime" -xu monitor_sys -xp 123456789 -m "`date;echo "172.29.141.115" ` "fi
}
#main function
function_main ()
{
while    true
dofunction_ping ;sleep   2function_downtime_detection_AND_sendemail ;sleep  2done
}
function_main ;

四.程序说明

1.通过  function_ping    ,每隔4秒对 主机 172.29.141.115 进行ping 操作,(当然,如果主机172.29.141.115的防火墙,或者内过滤ICMP包,那么这个程序显然不能用)将输出重定向到ping_longxibendi.log 文件中

2.通过 function_downtime_detection_AND_sendemail  ,每隔4秒,通过ping_longxibendi.log判断是否有没有ping通的迹象,如果有,则调用 sendEmail 邮件(手机短信)报警。

3.监控间隔时间说明  ,可以将 第一个 sleep 改为   150   ,第二个 sleep 改为  150  ,这样每隔5分钟监控一次。

四.使用环境说明

1.主机 A(172.29.141.112)   主机B (172.29.141.115)    ,

在A上部署该监控程序(monitor_down.sh),用于监控B

2.正常情况下A能ping通B

因为用的ping命令,所以如果使用该程序,需要在正常情况下A ping 通 B  。对企业来说,这可能就需要防火墙和Linux内核参数(当然,如果之前没有修改net.ipv4.icmp_echo_ignore_all,则不需要调整)

3.安装了 sendEmail  并 在139邮箱注册(绑定手机),方可有邮件(短信)报警提示

五.程序测试

[root@localhost monitor]# sh  monitor_down.sh

May 21 20:33:46 localhost sendEmail[9175]: Email was sent successfully!

May 21 20:33:56 localhost sendEmail[9204]: Email was sent successfully!

Terminated

[root@localhost monitor]#

六.程序扩展

这个程序,只是实现宕机监控并报警,但没有实现故障转移,自动切换功能。其实,只要稍微修改一下程序就可以实现故障转移,自动切换。故障转移,比如可以通过在热备机A上部署该程序,监控B,一旦B宕机,则A执行浮动改IP和更新下层服务器arp列表即可。可以参考

http://blog.csdn.net/longxibendi/archive/2011/05/21/6436606.aspx

声明:本文档可以随意更改,但必须署名原作者

作者:凤凰舞者 qq:578989855

服务器宕机监控、检测、报警程序(139绑定手机短信报警)monitor_down.sh相关推荐

  1. nagios整合ganglia实现hadoop、Hbase监控及手机短信报警

    预计该博文篇幅较长,这里不再废话,对ganglia不太了解的去问谷老师,直接看环境: hadoop1.updb.com    192.168.0.101 hadoop2.updb.com    192 ...

  2. 程序主动进行电话短信报警,自定义电话、短信、钉钉报警通知

    程序主动进行电话短信报警,自定义电话.短信.钉钉报警通知 一. 规则说明 这里我们要利用到阿里云的云监控的手段,有一个叫做事件监控的东西,可以通过自定义事件上传来进行监控报警. 流程: 程序发现错误 ...

  3. stm32/esp32/cam智能安防系统远程视频监控物联网远程传输视频图像GSM短信报警

    系统实现了智能安防报警系统设计,人体感应报警,烟雾报警,GSM短信报警,同时支持远程视频监控功能,安卓端app端远程查看视频流.实物展示视频 ​​​​​​基于stm32单片机ESP32智能安防系统远程 ...

  4. 139邮箱短信报警实现

    一.问题的提出 如何在最短的时间,让非在线运维人员得到服务器运行情况?如何在服务器宕机后,在第一时间能通知非在线运维人员 ? 二.问题的初步解决 移动办公(移动终端运维支持)很重要,通过手机短信报警, ...

  5. 小程序实现手机短信验证功能

    小程序实现手机短信验证功能 废话不多说,直接把项目写的手机短信验证功能发出来 .wxml <form bindsubmit="phone"> <input typ ...

  6. linux服务器宕机分析/性能瓶颈分析

    linux服务器宕机分析/性能瓶颈分析 服务器宕机原因很多,资源不足.应用.硬件.系统内核bug等,以下一个小例子 服务器宕机了,首先得知道服务器宕机的时间点,然后分析日志查找原因 1.last re ...

  7. keep老是显示服务器开小差,nginx+keepalived高可用服务器宕机解决方案

    原标题:nginx+keepalived高可用服务器宕机解决方案 1.基本服务器宕机的主从切换配置 两台nginx服务器,分别安装keepalived,配置/etc/keepalived/keepal ...

  8. 网站服务器宕机怎么办,服务器宕机了该怎么办?

    原标题:服务器宕机了该怎么办? 导读 如果Web服务器已经虚拟化,试着ping物理服务器自己的真实IP.这样可以帮助你进一步隔离问题.如果完全无法ping同服务器,而且也已经确定完全检查了网络连接,那 ...

  9. 保证服务器宕机业务不中断,备特佳CDP容灾备份系统——服务器端数据备份软件 - 和力记易--CDP容灾备份专家...

    软件介绍: 备特佳CDP容灾备份系统是和力记易自主研发适用于服务器端数据备份的CDP容灾备份软件,是一款主要面向Windows.Linux.Unix平台下集数据库备份.文件备份.操作系统备份于一体的C ...

  10. 服务器占用cpu启动就死机,造成服务器宕机(死机)的原因和解决方法

    原标题:造成服务器宕机(死机)的原因和解决方法 随着如今互联网信息化时代的不断发展,网络数据服务器.IDC数据存储和传输在各种网络科技面前也显得越来越重要,那么选择一款好用的服务器愈发重要.当然,不管 ...

最新文章

  1. 五大洲30国在华留学生千年古城欢度中国年
  2. AndroidStudio更换黑色主题方法
  3. Centos7.3 安装Mysql5.7并修改初始密码
  4. 为何大多数人做出来的图表只是一坨屎?
  5. shiro 的session持久化
  6. nod32可以限制软件安装么_玻璃钢法兰安装时可以别劲么 玻璃钢法兰安装视频
  7. android 广播 7.0变化,安卓7.0到底带来了那些变化?
  8. 乱码问题产生的原因与解决方案---UTF-8
  9. axure选中后横线切换_Axure8.0|动态面板内容简单切换技巧
  10. MySQL管理利器 MySQL Utilities---mysqlreplicate
  11. uds帧格式_如何看懂UDS诊断报文
  12. php自动采集入库,Phpcms v9自动采集入库自动发布组件
  13. S5PV210裸机之SD卡
  14. 算法训练营 重编码_关于如何在没有训练营的情况下学习编码的10条提示
  15. CSDN,我!王睿,回来了!!!
  16. Xmind 2022精彩体验---什么叫流程图
  17. js 实现单击、双击事件
  18. 计算机系统u盘判断,U盘真实容量检测工具
  19. 想自己搭建服务器,永久运行网站?一个U盘大小的树莓派就够了!
  20. windows服务器双网卡链路聚合_[分享]Windows 8 及以上版本 开启多网卡链路聚合 | 霸王硬上弓's Blog...

热门文章

  1. 基于HAL库使用cubemx配置,驱动MAX30102血氧传感器基础历程
  2. MAX30102 高灵敏度脉搏氧器和心率传感器说明书
  3. LTE-OA系统架构图
  4. redis指定配置文件启动不生效_redis配置文件不生效
  5. ROS时钟--支持时间倒计时小工具
  6. MAML代码学习记录
  7. 前端技术文档及工具汇总
  8. 短视频源码APP开发,短视频的功能
  9. 5, Swift tableView点击收起展开的效果
  10. 进程通信方式总结与盘点