为了改变传统机房环境监控的现状,需要引入三大新理念加以改善。

  1、对设备内部进行监控

  机房监控的目的在于保护机房内IT系统的正常、有效运行,在事故发生之前侦测出潜在危机,并通过各种方式将警情信息发送给相关人员及时进行处理。因此,机房监控的核心应该是对IT系统运行状态的监控,而最直接有效的监控应该是直接对IT设备运行状态进行监控。

  IT设备内部的运行环境,例如服务器内风扇转速与CPU温度等是最直接、最迅速影响IT设备正常运行的因素。有时候即使机房内空调运转正常,机房整体环境参数值也在预设范围内,但某服务器却因为某种原因出现服务器内风扇的转速不正常、CPU过热。如果只监控机房整体环境,此时机房的管理人员是不会得到这种危险信息的,整个系统就会因为该服务器潜在危机没有得到及时处理而意外瘫痪。

  2、多层次的机房监控

  完善的机房监控系统应该是能够实现对从设备运行情况到机柜微环境再到机房整体环境这样多层次的监控,并能重点实现对设备内部的监控。

  我们都知道,机柜内的微环境是设备正常运行所需要的物理环境。机柜微环境参数最能体现设备所处的实际运行物理环境的情况,所以实现对机柜内微环境的监控也相当重要。机房各个点的环境参数值是不同的,因此机房内整体环境监测的参数不能体现各机柜微环境参数,更不能体现重要设备内部的环境。也就是说,即使机房整体环境参数正常,IT设备所在处的环境也不一定正常。所以说机房的整体环境监控的重要性次于对设备的监控和对机柜内微环境的监控。

  空调机的运行是为了降低机房内的温度,使机房内的整体温湿度保持在一个合适的范围内,机房各个点的温度参数值是不同的。空调机出风口的温度值不能说明机房的整体温度和机柜微环境温度,空调的正常运行不能说明设备就能正常运行。因此对空调的监控不能代表甚至取代对设备的监控。

  漏水监测系统是为了监测机房内是否有漏水,以防止因漏水影响设备的正常运行。线式探测器是成线型布置在机房可能漏水的最低处,而实际上点式漏水探测器同样可以反映机房的漏水情况且比线式探测器经济实惠、安装方便、维护简单。

  机房内设备由于非常重要,一般都是采用UPS供电,并且UPS是双供电,只要对UPS进行监控就能确保设备正常供电并且能反映市电的情况。因此,对电源的有效监控是在不增加任何投资的情况下通过协议实现对UPS的监控,通过监控其电压、电流、电池使用情况、市电情况来确保设备的正常运行。

  3、机房监控的预警功能

  报警(alarm)是报告事件的发生,是在故障或危害发生之后向管理人员发送警讯,及时地发送警讯可以缩短故障修复时间(MTTR),最大程度地保障系统运行。但故障还是不可避免地发生了,影响了系统的正常运行。

  预警(alert)则是在故障或危害发生之前向管理人员报告潜在危机,提示相关人员进行处理,是事前的,可以防止事故的发生。有效的预警可以增加系统平均无故障工作时间(MTBF),并可以根据危机情况自动延伸到报警。

  预警与报警的区别就在于它是事前预防性报警,机房监控系统只有具有良好的预警功能才能侦测出潜在危机并分层次逐步扩大警讯发送范围,有效地防止事故的发生,将损失降低到最小。越来越多的机房管理人员也开始意识到预警的重要性,因此机房监控系统必须有预警功能。

  那么,机房监控该如何实现预警功能呢?首先,可以通过灵活的阈值设置多种侦测方式,确保能及时地发现潜在危机;其次,通过设置多种预警的方式,确保所有相关人员无论在何时何地都能收到警讯;再次,设置多个预警流程,确保不同的相关人员在不同时间接收到不同程度的警讯。

  这样,一旦有危机出现,立刻将信息发送给相关人员直至危机得到有效处理,实现真正意义的预警功能,最大程度地保护系统的运行。

  这种将网络运维和机房的配电电源监控、环境监控、和安全视频监控结合在一起监控,基于TCP/IP及SNMP,就能够高度的集中管理,不仅能够将单个机房内各种动力设备与环境设备的各种状态信息、报警信息、控制命令与历史数据等进行完整的集中监控,并且能够将分布在全国各地的多个机房实现跨区域的集中监控。用户只需登录一套系统就完成对整个资源的管理,免去了登录多套系统的麻烦。

  为防止外人非法闯入实施破坏和盗窃行为,可根据机房现场环境合理配置门禁和红外等探测器实现防盗报警。如果生后报警会将联动打开辅助摄像灯光,摄像机会自动切换到相应位置并开始录像,同时通过短信,邮件等多种发生向用户发出报警。真正实现无人值守、集中化、自动化的机房维护管理。

(来源:希赛网)

转载于:https://blog.51cto.com/9068393/1433153

新概念机房运维监控三大新理念相关推荐

  1. 服务器机房运维监控,新概念机房运维监控三大新理念

    为了改变传统机房环境监控的现状,需要引入三大新理念加以改善. 1.对设备内部进行监控 机房监控的目的在于保护机房内IT系统的正常.有效运行,在事故发生之前侦测出潜在危机,并通过各种方式将警情信息发送给 ...

  2. idc机房运维的相关介绍以及发展方向

    IDC机房运维探讨和心得 一.        什么是IDC机房运维? IDC机房运维涉及到方方面面的问题,它不同于其他运维,处理的问题都是比较低沉的问题.在很多公司可能都是将服务器托管的到专门的IDC ...

  3. IDC机房运维经验浅谈

    一.        什么是IDC机房运维? IDC机房运维涉及到方方面面的问题,它不同于其他运维,处理的问题都是比较低沉的问题.在很多公司可能都是将服务器托管的到专门的IDC机房让专业的人士进行维护, ...

  4. IT机房运维技术五大体系

    在机房中我们要面对各种各样的事情,如服务器上架,服务器下架,处理问题服务器等等.在机房运维中也应该建立起我们的技术体系,从这几方面入手使得我们的机房运营的更加平稳健康. 1.监控体系,一个健壮的身体离 ...

  5. 智能运维案例系列 | 新网银行 X 袋鼠云:银行核心业务系统日志监控平台建设实践...

    在聊今天的案例之前,我想首先和大家聊聊当前最热的词汇之一:"数据驱动". 双11就要到了,当你打开手淘页面,你会收到平台推荐给你的优惠活动信息,你可能感兴趣的商家或者商品, 你随意 ...

  6. 2018python培训-2018年5月python自动化运维开发课程新班正式开课!

    2018年5月python自动化运维开发课程新班正式开课! 作者: 更新时间::2018-05-16 新推出的ansible是新出现的 自动化 运维工具 , 基于Python研发 . 糅合了众多老牌运 ...

  7. 机房运维神器之远程监控网络设备

    在机房运维工作中,存在很多网络设备,这些网络设备经常会出现各种异常导致损失. 下面分享一款机房运维神器,可以远程监控网络设备的异常状况,自动报警以及远程重启. 别看它小巧,但是功能强大,非常适合智慧城 ...

  8. Kafka教程(一)基础入门:基本概念、安装部署、运维监控、命令行使用

    Kafka教程(一)基础入门 1.基本概念 背景 领英->Apache 分布式.消息发布订阅系统 角色 存储系统 消息系统 流处理平台-Kafka Streaming 特点 高吞吐.低延迟 cg ...

  9. python 运维管理架构_企业运维监控平台架构设计与实现(ganglia篇)

    一.Cacti/Nagios/Zabbix/centreon/Ganglia之抉择 1.cacti Cacti是一套基于PHP,MySQL,SNMP及RRDTool开发的网络流量监测图形分析工具. 简 ...

最新文章

  1. 网络嗅探与欺骗(FTP部分)
  2. 小数在内存中的存储表示
  3. Oracle里silent,静默方式(silent)安装Oracle软件
  4. 关于“xxx”object is not callable的异常
  5. C++ 类的定义、作用域及大小计算,限定访问符,this指针
  6. 解决url中特殊字符截断参数的问题
  7. Linux性能及调优指南(翻译)
  8. 自称世界上最权威监控软件FlexiSpy被黑删库,怎么做到的?
  9. 【好刊】中科院2区,CCF推荐,SCIEI双检
  10. HFSS 3D LAYOUT TDR仿真
  11. 深入浅出解析变分法——一种常用的数学方法
  12. java计算机毕业设计公立医院绩效考核系统源码+mysql数据库+系统+lw文档+部署
  13. 12306APP找回密码操作后账户被注销BUG
  14. css 语音,CSS3新特性一览-- 语音
  15. OpenCV中使用Eigenfaces 或 Fisherfaces进行人脸识别
  16. Linux-CPU篇
  17. 望京,承包了帝都码农圈的魔幻
  18. c语言驱动显卡,佳能 Tesla C2050 驱动程序下载-更新佳能软件(显卡)
  19. 基于java的商城后台管理系统计算机毕业设计源码+系统+lw文档+mysql数据库+调试部署
  20. AutoHotKey的那些事儿:(一)、AutoHotkey常用命令

热门文章

  1. 关于 CPU 的一些基本知识总结
  2. 聊一聊Java 泛型中的通配符 T,E,K,V,?
  3. 工作发狂:Mybatis 中$和#千万不要乱用!
  4. PyTorch 1.7发布,支持CUDA 11、Windows分布式训练
  5. 精选SpringBoot+Vue开发的开源系统(前端+后端+小程序)
  6. 百度某员工抱怨:前人代码写得像坨*,颠覆了对大厂的认知
  7. 工作9年开发面试华为要薪1W,华为员工:我司没有这么低工资的岗.....
  8. 70、80后、90后,小时候开学的场景!你还记得吗?
  9. 数据统计之月增用户统计
  10. Java的左移和右移的含义!