“萧何是谁?”单纯的问我们一般老百姓,还真不知道。但是说到俗语“成也萧何,败也萧何。”“萧何月下追韩信”等等,似乎一下子清楚了:他呀,推荐给刘邦打败西楚霸王项羽的那个韩信的人啊。至于萧何其他事迹,则是知之甚少了。《史记·高祖本纪》中高祖曰:“……镇国家,抚百姓,给馈饷,不绝粮道,吾不如萧何……。连百万之军,战必胜,攻必取,吾不如韩信……”从高祖的结论来看,萧何本身的工作很大一部分就是刘邦的后勤部长。看历史得知萧何尤其是在楚汉战争期间,使刘邦在关中站稳脚跟,为刘邦屡败屡战,最后打败项羽提供了源源不断的物质和兵力支持。

为IT系统设备提供稳定运行平台的数据中心,好比是为战场前线提供支持的大后方,相关的运维人员的工作和萧何的本职工作何其相似。古今中外,赫赫有名的将帅不可胜数,太多了。而在战争期间,对于负责“兵马未动,粮草先行”的后勤部队而言,他们的长官的名字在史书的记载中,可是凤毛麟角。而萧何作为大后勤部长,似乎也没有做出什么出名的成绩,假如他为了突出自己的成绩,这样写自己的总结:“······本年度为前线提供粮草X万石,提供兵源十万······”;前方将领看到后一定骂死他:“你的意思是我们损兵折将起码十万了?······”刘邦为了全局出发,也会斥责萧何的。在《三国演义》中出了一个有名的“后勤部长”—王垕:在曹操和袁绍的官渡之战中,曹操缺粮,为了稳定军心,争取时间的主动性,杀了运粮官王垕,使王垕成为替罪羊,为整个战争的胜利提供了一定的保障。在战争期间,一线最重要,所有的工作都是为战胜敌人服务的,以大局为重。我们一般认为萧何的出名很大程度沾了前线名将韩信的光,毕竟在以后的传承中似乎萧何没有韩信的名气大。虽然如此,西汉建立后,刘邦在分封大臣时,萧何位列众卿之首,被称为“开国第一侯”;“汉初三杰”之首。

一般而言,每个人都想在自己的工作中做出成绩,受到表扬,扬名立万,但是由于每个人所从事的工作不同,有的工作正常来说是很难出名的,比如数据中心运维相关工作:数据中心基础设施的运维工作,从来没有走到前台,一般人们看不到他们的身影,甚至不知道他们的存在,相关的设施设备的巡检、检修、维护等都是在立足于影响最小的情况下完成。随时当前信息技术(IT)的发展,使得对整个系统运行安全、运行效率的要求也越来越高,这就对为信息系统平稳运行提供平台的数据中心机房等基础设备的稳定性、安全性、可靠性等提出了更高的要求。相应的其安全性等也越发的重要。所以一旦基础设施出了问题,大到甚至或者影响到了相关业务的正常,无论从经济效益,还是社会影响等各方面,负面影响都是巨大的。这样的出名后果是可想而知的。这其中最大的出名就是火灾。

看到上面的图片,许多人都会嗤之以鼻:这不是PS的吗,这是假的等等类似的评论:确实,这图片不是真的。试想一下,真要是机房失火,相关人员不是忙着逃生,就是忙着灭火,谁还有工夫或者时间去找相机、调试焦距等认真的拍摄失火的现场呢?一般人总认为数据中心都配有完善的消防器材、设施,并备有温感、烟感等报警器。防火纯粹是小题大做。殊不知,一旦数据中心失火,到了灭火的程度,意味着事发地点的所有的设备都要受到牵连,后面的影响将是巨大的。下图为例(这个绝对不是PS的!)

这可是真实的火灾后的现场照片,触目惊心。

防火贯穿数据中心整个生命周期。为此对于数据中心的火灾一定要有“隐患险于明火,防范胜于救灾,责任重于泰山。”的思想意识,时刻牢记“安全第一”这根弦。在数据中心的生命周期中,测试验证是数据中心运维的起点,如果没有意识到测试验证的重要性,可能因为各种缘由把这个重要的步骤省略掉,这样疏漏很容易导致后期运维的重大隐患,魏徵在《谏太宗十思疏》中的首句“臣闻求木之长者,必固其根本”就是这个道理。数据中心主要服务的对象是IT系统。在其几十年的生命周期中,IT系统的变动却非常大。IT技术的变革同时也带动了关键基础设施技术的不断变化,所以还要关注一些关键基础设施的生命周期。这些关键基础设施的生命周期由多方面的因素所决定的。其中新技术的发展是数据中心关键基础设施更新换代、周期缩短的主要原因。这就要求运维人员也要紧跟时代潮流,不断了解、学习业界最新的动态、技术,与时俱进。在保证安全的前提下,采用新的技术来处理和解决问题,以减少处理的时间和风险。为相关设施的更新换代提供参考或者技术支持。安全性、可靠性是数据中心运维最基本的要求,因此日常的检查、维护、保养计划等一定做精做细做全,做到可预防性维护。同时根据各类设备的特点还要“具体问题具体分析”,如IT设备上架,要提前查看空开的容量等;夏季多关注空调的冷凝系统,防止高压报警等;冬季多关注空调加湿系统,防止加湿故障报警等。虽然各种新的绿色的或者先进的技术层出不穷,但是采用相关技术或者设备一定要采用成熟、稳定的—安全第一

总之,数据中心基础设施的运维是一项非常关键的、又是一项枯燥的、重复性很高的工作,其工作的特性就是运维正常是应当的、必须的,出现问题绝对是禁止的;数据中心基础设施推行的是风险管理和预防性维护策略,风险一定要及早控制或消除,因此必须做到:

一、建立完善的巡查和维护、保养、应急处理等机制。

二、采用与时俱进的动环监控、报警系统。以减少误报、漏报的发生。

三、相关人员的责任心、行动力至关重要。毕竟人才是最重要的因素:才是解决、处理问题的关键。扁鹊大哥擅长的是“事前控制”、“治未病”、防患于未然、无为而治才是解决问题的最好方式或者最高境界。借用一位老运维人士的话:宁可默默无闻,不当救灾英雄。

资料免费送(点击链接下载)

史上最全,数据中心机房标准及规范汇总(下载)

数据中心运维管理 | 资料汇总(2017.7.2版本)

加入运维管理VIP群(点击链接查看)

《数据中心运维管理》VIP技术交流群会员招募说明

加入学习群扫描以下二维码或者添加微信:

wang2017bj

由萧何出名想到的……数据中心运维思考相关推荐

  1. 数据中心运维从零开始

    运维是数据中心里最为重要的工作部分,不过如果和朋友说起自己是干运维的,总会让人听起来感觉有点低级,很多人会想到专科技校.蓝翔电脑培训出来的都是搞这个的.不错,数据中心运维也需要大量这方面的初级人才,完 ...

  2. 电厂运维的cis数据_数据中心运维,太难难难了

    建设数据中心难,数据中心运维是难上加难,十年运维老师傅,将给你讲述数据中心核心资产设备运维的难.难.难. 一.监管难 老师傅:监管难,难在IT设备物理安全管理粗放. ①设备随意堆放 ②设备进出无记录 ...

  3. 数据中心运维认证中的管理要求

    在整个数据中心生命周期中,数据中心运维管理是历时最长的一个阶段.数据中心运维管理主要目的是为提供符合要求的系统服务,而对与有关的数据中心各项管理对象进行系统的计划.组织.协调与控制,是数据中心运行服务 ...

  4. 如何成为一名数据中心运维工程师?

    与人类的发展历史相比,数据中心的历史很短暂,第一座数据中心设施建于20世纪50年代.最初的数据中心采用性能强大的大型机,只需要少数专业人员运行维护.而随着不断的进步和发展,采用越来越多的新技术,数据中 ...

  5. 科技推动时代发展,浅谈IT技术如何改善数据中心运维管理

    伴随现代化社会不断发展,众多企业逐渐扩大规模,业务剧增,数据中心的重要性由此可见,同时数据中心设施.规模都逐渐丰富起来,企业核心数据也更加集中.此时,对于数据中心的管理者职责和压力更是加剧,这也就要求 ...

  6. 问答|数据中心运维管理VIP学习群

    今天在数据中心运维管理VIP学习群里有群友提问现在北京的数据中心是否可以申请降低基础电费?群里的张总已经回答:三个月可以申请一次调整基础容量. 数据中心一旦运行,永不停歇,所以数据中心是用电大户也被称 ...

  7. 数据中心运维总监应具备哪些技能

    数据中心运维人员的工作虽然比较枯燥,压力也比较大,但是收入尚可,尤其是在一些互联网的数据中心里做运维,这类工作的重要性很高,所以收入也非常有竞争力.当然,不想当将军的士兵不是好士兵,运维人员的职业发展 ...

  8. 电费竟然占了数据中心运维总成本的7成?

    作为企业IT运维工作人员,我们最关心的往往是数据中心各项服务是否稳定运行,系统是否安全.然而,数据中心的运维人员.甚至公司领导和业务部门都几乎很少关心数据中心的能耗. 据相关单位统计,中国数据中心的电 ...

  9. “数据中心运维管理VIP学习群”问题汇总(一)

    针对群友提出问题以及回答作了汇总,方便大家交流与学习,另外,一些未得到解答的问题或者是答案不够准确地也希望同行们能够献策献计,把自己的运维经验分享出来,共同进步. Q1:WDZA和WDZN电缆有什么区 ...

最新文章

  1. HDU - 6486 Flower(思维)
  2. 错误:请求“ ..”中的成员“ ..”属于非类类型
  3. 【RK3399Pro学习笔记】四、ROS 创建工作空间与功能包
  4. 2015春计算机应用技术基础,计算机应用技术基础.doc
  5. 通过HTTP的HEADER完成各种骚操作
  6. 查询相关股票十档行情的方法
  7. .NET 正则验证邮箱
  8. 2020-12-08
  9. 随机森林-科比生涯数据集分析与预测
  10. Linux中安装VIM命令
  11. 怎样彻底删除 mac 上的 Adobe 相关文件?
  12. DataGrid 动态绑定URL地址,在WebConfig中配置
  13. 6. 【containerd】containerd已经停止,containerd-shim还存在?
  14. 2.4G模块及SPI通讯
  15. rabbitmq的启停与异常
  16. 基础篇:Linux 常用命令总结
  17. 找不到 Web 地址对应的网页:_Web服务器的配置与管理
  18. windows下directShow音视频采集
  19. 「老域名案例」老域名做网站快速上排名及老域名选择方法
  20. 索骥馆-科普常识之《漫话哲学》全彩版[PDF]

热门文章

  1. COM与.NET调用DCOM组件
  2. 论文笔记:MobileNet v1
  3. Zedboard学习(三):PL下流水灯实验
  4. 定位插件_微创新 | 开发PL/SQL插件,快速定位所需字段
  5. 排查链接是否失效_Linux服务器入侵检测排查方法
  6. makefile 基础用法
  7. 80386的各种寄存器一览
  8. 【正则表达式】之Possessive Quantifiers
  9. 主成分分析(PCA)和独立成分分析(ICA)相关资料
  10. Mybatis报错 TooManyResultsException