利用DELL的OMSA监控服务器的温度
利用DELL的OMSA监控服务器的温度
服务器换机房以后就涉及到需要对服务器做完整的监控,对服务器温度的监控是一个重要的监控,由服务器的温度可以得知服务器的散热情况是否有问题以及机房的空调是否OK。比如服务器风扇坏了会导致服务器的温度升高,那么我们就可以很快地发现并解决。
在网上找到一个工具lm_sensors,很多网友用这个工具来做监控,但是因为我的linux内核版本为2.6.18-194.el5,lm_sensors在该内核版本不支持我的E5504的CPU。总是报Unknown CPU model。只能升级内核版本,对于线上服务器危险系数比较高,因此只有另辟蹊径,咨询DELL的技术人员以后获悉DELL的OMSA(Dell OpenManage Server Administrator)能获得机箱的温度,OMSA是DELL提供的一组集成管理服务,可以对本地和远程的服务器进行管理和监控。
接下来就来描述如何通过OMSA获取服务器的温度,并通过cacti和nagios来进行监控。
1. 安装和使用OMSA 6.5 (centos5.5_64bit)
A. 安装OMSA 6.5
wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
yum install -y srvadmin-base
yum install -y srvadmin-storageservices
B. 禁用OMSA自带的snmp功能
/opt/dell/srvadmin/sbin/dcecfg command=disablesnmp
C. 启动OMSA
/opt/dell/srvadmin/sbin/srvadmin-services.sh start
D. 获取温度的命令
/opt/dell/srvadmin/sbin/omreport chassis temps
2. 使用cacti监控系统温度
下面是使用cacti来调用OMSA监控系统温度的脚本
cat /etc/snmp/monitor_tem_cacti.sh
点击(此处)折叠或打开
- #!/bin/bash
- #Purpose: Monitor the classis's temperature -----cacti
- #Author: 飞鸿无痕
- #Date: 2012-09-07
- #define the path for the executable file
- TEMPPATH='/opt/dell/srvadmin/sbin'
- #use del omreport tool to get the classis's temperature
- TEMP=`$TEMPPATH/omreport chassis temps | grep "Reading" | awk '{print $3}'`
- echo $TEMP
脚本内容保存以后还需要更改/etc/snmp/snmpd.conf配置文件,添加如下一行:
extend .1.3.6.1.4.1.2021.25 monitor_temperature /bin/bash /etc/snmp/monitor_tem_cacti.sh
然后重启snmp服务
/etc/rc.d/init.d/snmpd restart
然后直接在cacti端添加数据模板、图形模板然后添加到主机中就可以了,附件附上自己监控的cacti图形模板。
3. 使用Nagios监控系统温度
下面是使用nagios调用OMSA监控系统温度的脚本
cat /usr/local/nagios/libexec/monitor_tem_nagios.sh
点击(此处)折叠或打开
- #!/bin/bash
- #Purpose: Monitor the classis's temperature -----nagios
- #Author: 飞鸿无痕
- #Date: 2012-09-07
- #Status OK: the temperature greater than or equal 8 and less than or equal 42
- #define the exist status
- STATE_OK=0
- STATE_WARNING=1
- STATE_CRITICAL=2
- STATE_UNKNOWN=3
- #define the path for the executable file
- TEMPPATH='/opt/dell/srvadmin/sbin'
- #use del omreport tool to get the classis's temperature
- TEMP=`$TEMPPATH/omreport chassis temps | grep "Reading" |awk -F'[ .]+' '{print $3}'`
- if [ $? -ne 0 ];then
- echo "Please Check the temperature Plugins"
- exit $STATE_UNKNOWN
- fi
- if [ "$TEMP" -ge 8 -a "$TEMP" -le 42 ];then
- echo "Check OK,The classis's temperature is: $TEMP"
- exit $STATE_OK
- elif [ "$TEMP" -ge 3 -a "$TEMP" -lt 8 -o "$TEMP" -gt 42 -a "$TEMP" -lt 47 ];then
- echo "Check WARNING,The classis's temperature is: $TEMP"
- exit $STATE_WARNING
- else
- echo "Check Critical,The classis's temperature is: $TEMP"
- exit $STATE_CRITICAL
- fi
这个脚本会在系统的温度小于8度或者高于47度的时候自动通过nagios报警。设置完这个脚本还需要更改/usr/local/nagios/etc/nrpe.cfg配置文件,添加如下内容:
command[check_temperature]=/usr/local/nagios/libexec/monitor_tem_nagios.sh
然后在nagios服务器端添加check_temperature的监控即可。
4. 自动配置cacti和nagios使用OMSA监控系统温度脚本
将上面的cacti和nagio监控的脚本保存到和下面的脚本在一个目录下,不要更改脚本的名字。使用下面的脚本安装完成OMSA后会自动配置cacti和nagios。
cat monitor_tem_install.sh
点击(此处)折叠或打开
- #!/bin/bash
- #Purpose: install Dell OpenManage Server Administrator tool(OMSA) and configure cacti and nagios client
- #Author: 飞鸿无痕
- #Date: 2012-09-07
- #download the file and install
- wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi | bash
- yum install -y srvadmin-base srvadmin-storageservices
- #disable the omsa's snmp
- /opt/dell/srvadmin/sbin/dcecfg command=disablesnmp
- #start amsa
- /opt/dell/srvadmin/sbin/srvadmin-services.sh start
- #add monitor script to snmp directory
- cp monitor_tem_cacti.sh /etc/snmp/
- chmod +x /etc/snmp/monitor_tem_cacti.sh
- echo "extend .1.3.6.1.4.1.2021.25 monitor_temperature /bin/bash /etc/snmp/monitor_tem_cacti.sh" >> /etc/snmp/snmpd.conf
- /etc/rc.d/init.d/snmpd restart
- #add monitor script to nagios directory
- cp monitor_tem_nagios.sh /usr/local/nagios/libexec/
- echo "command[check_temperature]=/usr/local/nagios/libexec/monitor_tem_nagios.sh" >> /usr/local/nagios/etc/nrpe.cfg
- kill -9 $(ps -ef | grep nrpe | grep -v grep | awk '{print $2}')
- /usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg -d
监控系统温度的cacti模板:
cacti_graph_template_monitor_temperature.rar
安装和部署OMSA监控温度的脚本:
monitor_tem.rar
转载于:https://www.cnblogs.com/feihongwuhen/archive/2012/09/07/7169787.html
利用DELL的OMSA监控服务器的温度相关推荐
- sensors监控服务器cpu温度
监控服务器cpu温度 #安装 sudo apt-get install lm-sensors 安装成功后运行 #运行 sensors 安装首次sensors可能不起作用,启动服务 root@roots ...
- r420服务器故障维修,DELL R420 OMSA IPMI 服务器启动失败
DELL R420 OMSA IPMI 服务器启动失败. /opt/dell/srvadmin/sbin/srvadmin-services.sh start Starting Systems Man ...
- Centos下利用lm_sensors监控服务器CPU温度
centos6.5下添加lm_sensor监控cpu温度 关于服务器基础监控这块,需要加上对CPU温度的监控,这样可以在机房温度有异常或者是服务器CPU负载较高温度上升的情况下,可以及早发现问题. 因 ...
- Zabbix基于Dell系统管理OMSA监控物理服务器硬件
OMSA介绍:(OpenManageServerAdministrator) Server Administrator通过一组全面的集成式管理服务,提供易于使用的.本地和远程系统监管; Server ...
- 【Proteus仿真】数字温度计,利用 Mega16 控制 DS18B20 ,若温度达到设定阈值,即可报警提醒(用串口控制停止报警、用键盘输入改变报警阈值)
(代码在文末) 工程文件和代码下载链接如下(求求下载前点个赞支持一下吧QAQ,博主自己做出来这个也hin累的) 链接: https://pan.baidu.com/s/1-aRZjyRZodzLcw8 ...
- 利用ENVI实现landsat 5地表温度反演
1:将landsat 5数据进行大气校正 2:计算NDVI, 3:利用混合相元法计算植被覆盖度 fv= 代表裸地的NDVI值,代表全部植被覆盖的NDVI值 根据自己的实际情况确定上述两个值,比如为-0 ...
- zabbix监控服务器cpu温度,通过钉钉来报警
做这个的目的是因为有一次办公室机房空调故障,温度升高,导致机房的服务器全部被热死,为了必免再次出现此情况,所以就想到用zabbix来监控服务器的cpu温度,然后通过钉钉来报警,这样就能及时发现了.其实 ...
- 树莓派cpu检测_利用xively监控树莓派的CPU温度
前言 在RaspberryPi搭建博客后发现个问题,就是我如何能够知道RaspberryPi的一些运行信息,比如CPULoad或者温度.初步想法是利用图表形式汇总信息,然后 通过网页图表展示.该方案主 ...
- python监控服务器cpu温度实例_监控HP服务器CPU温度的脚本
监控HP服务器CPU温度的脚本: #!/bin/bash Name=`hostname` IP=`/sbin/ifconfig eth0 | grep "inet addr" | ...
- 利用AIDA64查看CPU,GPU,RAM温度,使用率等
1. 打开AIDA64 , 找到左上角的"文件" - "设置" 2. 找到 "硬件监视工具" - "OSD" - &qu ...
最新文章
- 周洪立:一个外交官眼里的盛大文化
- 【Win7下Android native code的编译和调试】
- 微信公众号的分享功能
- 洛谷——P1012 拼数
- CSS3 - 清除浮动
- iQOO Neo5游戏评测,配置独显的手机表现如何?
- 将ShaderToy中的Shader搬运到Unity
- 深入浅出---unix多进程编程之wait()和waitpid()函数
- matplotlib--python的数据可视化入门
- Piggydb 6.2 发布,个人知识库管理
- 谈谈研发PLM项目管理
- 协议森林1——小喇叭开始广播:以太网与WiFi
- 快速排序实验报告 c语言,快速排序算法的C语言实现
- Unity 2D图像识别 动态添加相片到图像库 AR Tracked Image
- alpine日志中文乱码的问题解决方案
- Vue v-modle理解
- 09-一篇带你熟练使用多线程与原理「Thread」
- 【产品面试】经典的一些面试题回顾
- mac版本的visual studio的快捷键修改_几款高效率的mac软件
- 编程语言排行榜2021年3月
热门文章
- JavaEE(26) - {TODO}
- VMware vSphere 5.1 群集深入解析(三)
- 实例集群状态为Fail导致的集群混乱排查和复现
- html5鼠标载入弹出信息框,js实现自定义弹出对话框(弹窗)可拖拽
- 疫情再次严峻没地蹲坑,无聊在家做单片机点亮一个发光二极管实验
- echarts迁徙图 vue_vue中echarts引入中国地图的案例
- python的基本语法while true_Python正课15 —— 流程控制之while循环
- 【渝粤教育】电大中专市场营销管理 (2)_1作业 题库
- 【渝粤教育】广东开放大学 社会学概论 形成性考核 (50)
- 强化学习实战(四)基于强化学习的倒立摆控制策略Matlab实现(附代码) 二刷