机器学习工具在数据中心的应用与发展
在互联网诞生之初,数据中心规模很小并且很简单。一个大型电子商务服务数据中心仅用几个19英寸机架来部署所需的服务器,存储器,以及网络设备。如今,超大型数据中心成千上万的硬件设备部署在数千个机架上。随着数据中心设计的变化,这些大型数据中心或建在靠近大型人口中心,或建在电力廉价的偏远的地区。
随着数据中心运营的自动化的发展,像AWS或微软 Azure这样的公共云供应商所雇用的高级数据中心工程师越来越少,数量通常比安全人员和普通技术工人更少。更少的人员管理更多服务器,这意味着监控数据中心电力和冷却基础架构需要更多依赖传感器,这些现在都被称为物联网硬件。这些硬件有助于在一定程度上识别问题,但是在很多情况下,传感器并不能代替经验丰富的设施工程师。例如,通过声音辨别设备运行的情况,通过声音还可以了解哪个个风扇将出现故障或通过水滴的声音来定位泄漏的地方等等。
谷歌公司为机器学习而定制的采用张量处理器(TPU)的服务器机架
数据中心管理人员需要更多的传感器来监控现代数据中心基础设施,新一代应用程序旨在通过将机器学习应用于物联网传感器网络来来填补这一空白。这个想法是将经验转变成规则来帮助传感器辨析声音和影像,例如,为数据中心增加一个新的自动化管理层,可以预测和防止数据中心基础架构的故障。 451 Research公司分析师Rhonda Ascierto表示:“快速的恢复时间和有效的容量配置也可以降低数据中心风险。”
结合DCIM和多样性的数据
第一步是利用数据中心基础设施管理或DCIM软件中的预测分析。以位于加利福尼亚州奥克兰的一家名为Vigilent公司的软件为例。“控制系统基于机器学习软件,用于确定变量之间的关系,如机架温度,冷却单元设置,冷却能力,冷却冗余,功耗和故障风险。它通过打开和关闭各相关单元来调节冷却单元,包括变频器(VFD),上下调节变频器,以及调节单元的温度设定值。”Ascierto说。它使用无线温度传感器,并预测如果操作员采取某些措施会发生什么,例如关闭冷却单元或增加设定点温度。
另一个例子是英国Oneserve Infinite公司,该公司将传感器与多种数据点相结合,例如使用天气条件,以提供称之为“预测性现场服务管理”的Exeter.其目的是预测维护要求,避免故障停机,并将停机时间降至最低。 Oneserve公司首席执行官Chris Proctor表示,通过应用这些技术,可以同时处理战略规划和采购。“数据中心将能够更准确,有效地管理资产和资源。”(据悉这种功能尚未在任何数据中心中使用。)
Oneserve公司更关注的是维护问题,跟踪了解过去维护中的问题,允许用户详细地说明每次出现问题的地方。在现在,这依然是一种非常费时费力的人工操作方法,但是将来工作人员会利用这种数据来训练机器学习系统。
挖掘人类的知识
将传感器数据与运维经验相结合的例子是圣荷西的LitBit公司。根据该公司创始人兼首席执行官Scott Noteboom的说法,他们曾经为雅虎和苹果公司提供数据中心战略,LitBit公司的数据中心人工智能或DAC(数字模拟转换器),允许运营商对机器进行培训和调整,向工作人员学习可以获得响应数据中心的事件的能力,从而提醒操作人员或最终自动执行操作。LitBit公司方法的关键是采用一种辅助学习形式,当系统检测到新的异常事件时,系统会向操作人员发出警报,然后运营商将来制定一套对这些事件做出反应的规则。为了收集数据,LitBit公司有一个移动应用程序,可以接受视频,然后将其转换成数千个图像进行培训。
这家初创公司提供了一个托管云服务,可以利用许多用户的匿名数据来构建更复杂和更准确的模型。一些客户会将他们的训练模式进行保密,而另外一些客户可能会将其作为额外的收入来源对外出售。正如Ascierto所指出的那样,“数据中心管理数据的价值在大规模聚合和分析时会倍增。通过将算法应用于许多客户聚集的大型数据集,包括不同类型的数据中心和不同的位置,供应商可以预测设备何时出现故障,以及何时会出现冷却阈值。
当具有知识经验的操作人员不在身边时,一些隐含的知识可以帮助系统在操作中来识别问题并做出更快的反应。数据中心人工智能可能不会完全替代数据中心工作人员,但它可以不断地增强技能帮助运维人员解决问题。
这个领域还不成熟,但发展速度很快。对传感器进行机器学习正在迅速发展,并被广泛应用于各行各业。微软研究部门一直在与Sierra 系统公司合作,开发基于机器学习的油气管道缺陷的音频分析,利用其认知工具包来帮助对出现的异常进行分类。
基于人工智能的数据中心管理服务是新兴技术,目前还在发展中,还需要进行大量的培训。 Ascierto指出,企业的DCIM软件可能需要更多的传感器。 “如果企业想利用人工智能进行端到端冷水机组到机架的决策,那么其设备以及环境传感器和电气仪表将需要安装声学和振动传感器。如果目标是优化和自动化冷却单元的设定点温度,则可能每个机架(顶部,中间,底部)需要多个环境传感器。
人工智能系统正式交付使用还将需要一定的时间,就像数据中心招募的新的工作人员一样,不过类似的机器学习工具终将可以真正的帮助您运营数据中心。
作者:李超
来源:51CTO
机器学习工具在数据中心的应用与发展相关推荐
- 机器学习如何推动数据中心发展?
作者 | CDA数据分析师 1.前言 大数据革命引发了数据中心的爆炸式增长,这些中心正在以越来越高的速率消耗能源.本文回顾了两种提高数据中心效率的标准方法,并认为第三种方法-机器学习-是最佳解决方案. ...
- 2018银行数据中心建设及云计算发展论坛
2018第二届中国金融数据中心建设及云计算发展论坛 同期举办2018国际数据中心及云计算产业展览会 时间:2018年10月16日 地点:北京•中国国际展览中心 主办单位: GDCT数据中心节能技术委员 ...
- STT GDC公司关注数据中心市场的进一步发展
总部位于新加坡的ST通信全球数据中心(STT GDC)在过去几年中一直致力于在全球主要市场的扩张.例如,STT GDC与GDS服务公司合作,进一步扩大和发展其在中国的数据中心组合,并与英国的Virtu ...
- 国内数据中心制冷系统设计与发展
数据中心概要 与传统建筑空间相比,数据中心散热密度大,单位面积散热量可达传统办公区域的40倍以上,且越来越呈现集中化.大型化的趋势:同时,设备的安全性需求提高了对内部空调温湿度和洁净度的要求,数据中心 ...
- 微型数据中心正在向边缘发展
随着云计算和边缘计算的持续发展,数据中心正在迅速发展.云基础设施极大地影响了现代数据中心的需求,基础设施即服务(IaaS)业务模型和提供商允许企业方便地访问远程服务器. 边缘计算使计算过程和数据更接近 ...
- 2020年中国医疗数据中心市场规模及发展趋势预测分析
数据中心是将医院内的管理.临床等信息数据进行统一收集存储,并完整.及时的提供给使用者,实现院内的信息共享和互联互通.数据中心的建设能极大的减轻医院HIS系统的压力,提高医疗数据整合利用能力.在数据收集 ...
- MACOM面向CWDM4推出L-PIC™技术方案,助力云数据中心和5G光学连接发展
MACOM近期宣布推出 MAOT-025402 CWDM4发射器光学组件,这款组件是MACOM面向100Gbps CWDM4的L-PIC™(集成有激光器的硅光子集成电路)解决方案的一部分,凭借获得专利 ...
- 数据中心100G连接的发展驱动400G解决方案需求增长
网络中100G连接的广泛部署正在驱动400G解决方案需求增长,并为400G器件开发提供资金来源.那些已经成功开发出具有竞争力的100G光模块和组件的供应商,在扩充100G产能的同时,也在开发更低成本1 ...
- 未来数据中心运营将靠人工智能和机器学习
机器学习和人工智能是当今IT专业人员的热门话题,而在企业的数据中心,它们拥有真正的前景. 机器学习软件可比你或你的团队更快预测情况,甚至可能更快地解决它们.这些系统是当今混合数据中心环境的合理扩展,是 ...
最新文章
- recv java_用于TCP套接字编程的Recv函数
- 一次有意义的51CTO沙龙归来
- AttributeError:module 'numbers' has no attribute 'Integral'.
- 农用地包括哪些地类_征用土地公告应当包括哪些内容?|楹庭拆迁律师
- torch.stack(), torch.cat()用法详解
- Go语言web框架beego:脚手架bee的安装及创建beego项目
- matlab两个图共用一个x轴_如何在Matlab中插入两个X轴图
- 小知识汇总----不断更新中...
- LVS(10)——实现多集群功能
- MATLAB图片的保存与导出
- Fibonacci数列第n项的第7种计算方法:Python列表
- 查看windows所有exe的启动参数。
- 云卓遥控器+DIY高清摄像机的方案(完美接入原系统)
- parceljs 中文文档24小时诞生记
- CCF NOI1050 矩阵乘法
- Tomcat5.5链接Oracle、DB2、MySQL数据源实现JSP下拉框的填充
- MVC应用程序JsonResult()的练习
- 用人话讲明白AHP层次分析法(非常详细原理+简单工具实现)
- 电商实训三:网店经营
- ndows phone,Windows Phone 7