刀片服务器运行环境的功率密度实际上超过了以往任何数据中心的功率和散热能力。在现有的数据中心中安装刀片服务器无疑将会带来一系列的挑战,也会出现多种安装方案,令你难以抉择。如何对这些方案进行评估,择取最佳的功率和散热方案,成功地应用刀片服务器。

        在现有数据中心安装刀片服务器会使现有的供电和散热系统承担很大的压力。在每个机柜中,刀片服务器的耗电量将达到普通数据中心机柜耗电量的20倍,而产生的热量也将高达一般机柜的20倍。要想应用刀片服务器,必须对数据中心的电源和散热设备进行升级,否则这些本可以安装在一个机柜中的刀片服务器必须得分散在多个机柜中。而通常人们不可能关闭在用的数据中心来进行这些安装和升级操作,这也使问题更加复杂化。
        本文根据用户具体的需求和限制条件为用户确定最适合的供电和散热策略提供了指导。
核心问题
    对于目前大部分数据中心来说,与安装刀片服务器相关的核心问题都与供电和散热分配有关。大部分数据中心都具有初步的供电和散热能力,但不具备把这些能力带到高密度区域的设备。糟糕的是,许多用户直到他们打算应用刀片服务器时才意识到这些问题。出现这种情况是因为任何一个数据中心都没有专门为使用人员提供有关数据中心的功率密度能力的信息。有关这些问题的技术原因在本文和文章最后的应用参考中有详细说明,这里只做一下概要说明:
  • 冷却气流不足: 刀片服务器每千瓦的额定功率每分钟大约需要120立方英尺的冷空气。大部分数据中心只能为每个机柜提供200-300立方英尺/分钟的冷空气――相当于一个满配置的刀片服务器机柜所需冷却气体的十分之一,这就把每个机柜的功率限定在2kW以下。如果冷空气不足,刀片服务器只能吸入自身排出的热空气,最后导致机器过热。这是目前刀片服务器应用中存在的最大问题,也是几乎所有刀片服务器应用中存在的问题。
  • 电力分配不足:目前一般的数据中心的配电系统远远不能满足刀片服务器的电力需求。这个问题有三种表现形式:1)从地板下或机柜顶部引入的电源线数据不够或型号不对;2)附近的配电单元(PDU)负载能力不足;3)断路器位置的数量不够。任何上述问题都会妨碍数据中心提供高密度电源供应的.
 
        需要说明一下,上述两个关键问题中,散热分配问题是主要制约因素。因此,本材料讨论的焦点问题就是选择冷却架构。电力结构将在选定的冷却架构后进行说明,而且要根据具体的刀片服务器品牌的不同而有所不同。
应用刀片服务器的五种不同方法
       为刀片服务器散热有五种基本方法。一旦选中了其中一种方法,可以用多种不同产品和方法来具体实施。这些方法在APC白皮书46――“超高密度机柜和刀片服务器冷却策略”中有详细说明,表1中进行了概述。
 
1 五种冷却高密度机柜的方法的应用

要应用刀片服务器,必须选择其中一种方法。这种选择要基于目前设施的制约因素以及用户的需求和喜好。
刀片服务器应用流程
应用刀片服务器的物理环境的准备过程分为以下几个步骤:
  • 识别现有设施的制约因素
  • 确定用户的需求和喜好
  • 确定合格的供电和冷却方案
  • 设计和实施方案
        图1为这一流程的示意图。本流程图显示了工作流程的不同步骤以及每个步骤的结果。这个流程包括两个主要的循环过程,在这两个循环流程中,现有机房的制约和用户的需求及喜好通过一次次的反复而确定。这对于做适当的调整和进行恰当的折衷是非常必要的。通常情况下,经过机房状况的审视和相关的折衷之后,最初的制约因素和用户的优先选择会有所变化。最常见的是,当用户完全理解这种方法的结果后,他们对于高密度地放置刀片服务器的选择或要求往往会动摇。这一分析发生在流程图的循环2中。
        另一种觉的情况是对目前的设施进行评估时发现的问题很容易得到解决,提高了数据中心应付刀片服务器对于电源和散热的需求。这些调整发生在流程图的循环1中。
下一节中更详细地介绍了选择设计方案的各个不同流程。
1 确定刀片服务器正确应用到现有数据中心的方法的流程图

确定现有设施的制约因素
        现有的数据中心有多种无法改变的硬性制约因素。这些制约条件可能会影响某些刀片服务器应用方案的选择,具体表现为以下几种:
  • l   精确制冷能力。数据中心可能没有足够的剩余精确制冷能力,无法为推荐的刀片服务器安装方案提供足够的散热能力。这一限制条件是指机房空调原有制冷能力,而不是空气分配系统的能力。
  • 地面空间限制。数据中心的地面空间可能有限,或者可用于安装刀片服务器的地面空间非常有限。如果地面空间严重不足,用户在方案的选择上可能没有太多的选择余地。
  • 天花板没有压力通风系统。机房天花板可能没有压力通过装置。房间可能高度有限,没有安装压力通风系统的可能。这一制约条件可能让你无法选择某些设计方案。
  • 地板垫起高度的限制。地板现在垫起的高度可能不足2英尺,而且/或者部分空间被导线或管线占用。这可能会限制垫起的地板的空气分配能力,影响你对某些设计方案的选择。
  • 重量限制。数据中心的地板可能有地面负荷限重,特别是有地板垫高的情况下。这可能会让你无法选用某些设计方案。
        在现有的数据中心中,这些限制条件通常没有相关的文件说明,而且也不是显而易见,因此,必须对这些条件进行评估。
现有条件的评估
   对数据中心现有条件进行评估对于应用刀片服务器非常重要。如果需要安装的刀片服务器数量仅为一个机柜或者更少,这项评估工作可能不需要做得太细致。但是,如果要安装的刀片服务器数据较多,就必须大大提高这项评估的深度和细致程度。
        如果应用刀片服务器的复杂程度较高,那么用电脑模型来对数据中心进行模拟是很有必要的,这样做一方面可以确定一下目前状况,更重要的是可以对设计方案进行验证。图2中展示了这样的模型实例。
三维计算流体力学模型显示数据中心的气流和温度(APC专业服务部提供)

   所有的数据中心管理人员掌握一些数据中心评估方面的基本知识是很有必要的。对于复杂的、高成本或高风险的安装,建议由专业人员进行这些评估。APC以及其它一些厂商提供专业的数据中心评估服务。
确定改进措施-基本的数据中心卫生环境
  • 数据中心目前的状况常常包含许多弱点,在采取下一步的措施之前必须首先找到并纠正这些弱点,因为它们会影响与刀片服务器安装相关的数据。这些问题包括: 缺少备用面板。
  • 垫起的地板有渗漏或供气系统有泄露。
  • 空气回流设置不当。
  • 地面砖通风设置不正确。
  • 地板下有没用的线缆。
  • 空调设定不当。
确定用户的需求和偏好
       除了设施的硬性制约条件外,用户往往有一些软性限制因素或者说偏好。这些限制条件可能是无法改变的,或者考虑到屈从这些限制需要付出的代价太高,用户可能会有所动摇。用户的这些需求或偏好可能会把一些刀片服务器应用排队在外。这些需求包括:
不间断运行。用户最重要的需求可能是安装过程中要尽可能不干扰现有数据中心的正常运行,将对运行中的IT设备带来的风险降低至最低。例如,没有可利用的计划中的宕机时间。
系统完成安装后具有高可用性。用户另一个重要的需求可能是要求系统完成安装后要具有尽可能调质可用性。这就要求供电和散热系统具有冗余性,而且系统要经过测试确保冗余性。
高密度放置。用户可能会强烈要求最大密度地堆放刀片服务器。其中的原因包括:
  • 系统是一套示范系统
  • 希望尽可能地节约占地空间
  • 有规章或法定条文要求所有服务器放置在一个小区域内
  • 简化数据线路
  • 想把IT设备进行合理的分组(如把所有的Wed服务器放置在一起)
  • 数据中心的不同区域归不同的人所有
  • 简化设备管理(如升级)
  • 感觉这样会省钱(通常是错误的)
        请注意,以饱和的密度进行安装费用可能会很高,而且需要对现有的数据中心进行改造,影响数据中心的正常运行。强烈建议在决定采用高密度方案前考虑一下其它方案,包括分散负载,为接下来的安装做准备。这可能是一系列刀片服务器安装程序的第一步,目前的安装应为未来的安装奠定基础,而且不应妨碍到将来的安装和应用。
 
时间。用户可能要求刀片服务器尽快安装到位。如果是这种情况,那么规划、签约和设施修建可能都不太现实。
成本。尽可能地降低成本可以是用户安装刀片服务器时的首选。这也为安装工作指出了明确方向。
 
应用方法的选择
       了解了现有设施的制约并且在用户的各种需求和偏好间进行了适当取舍之后,就可以从前面所述的5种基本方法中做出选择了。刀片服务器的应用方法的选择是基于散热问题的,因为这些问题是实际系统中最主要制约因素。确定应用方式后,电力供应问题也就随之确定了。
        影响应用方式的最主要的不确定因素就是刀片服务器的密度问题。许多用户更愿意将刀片服务器以最大密度安装。在现有的数据中心环境中这往往不是一个恰当的选择。实际上大部分刀片服务器都采用模块化的机架结构,可以以较低的密度在机柜中安装。虽然降低安装密度看上去没有充分发挥刀片服务器的优势,但实际上系统的成本、可用性和安装速度都有所提升,特别是在现有的数据中心环境中安装刀片服务器的情况。
        目前的许多数据中心设计的功率密度为每个机柜2KW甚至更低。在这样的环境中按每个机柜10-30KW的功率安装刀片服务器时,这些刀片服务器需要消耗大量的电力和散热功能,这与机房最初的设计不成比例。正因为这个原因,在现有数据中心中安装刀片服务器时节省空间通常是没有实际好处的。因此,在现有数据中心分散放置刀片服务器既实用又划算。以饱和密度安装刀片服务器通常只是在专为支持高密度方案新建的机房设施中比较划算——安装规模极大或者空间极其狭小
        因此,刀片服务器安装的核心选择就是刀片服务器安装的分散程度——即每个机柜中安装多少个刀片。用户选择的刀片服务器的品牌和型号可能会制约刀片的分散程度,例如,一些刀片服务器采用独立的机架,这种设备就易于分散安装。而另外一些刀片服务器采用一种底板系统,这种系统使得分散安装不切实际。按照前面所述的五种主要刀片服务器应用方法规划好刀片服务器的应用密度后,其结果如 2
 
表2-各应用方法中不同中刀片服务器密度下的刀片服务器应用标准

   表2表明,在30种不同的功率密度和应用方法组合中,有大约11种首选组合和7种临界的组合――共18种比较切合实际的应用方式组合。要选择最佳方案,必须把数千种用户的偏好、制约因素和现有的条件等数据与这18种应用方式组合进行比对。这种比对需要进行广泛的分析,遵循许多规则,这一过程可以象软件运算一样进行。
  • 在开发式具进行这种分析的过程中,APC提供了在实际工作中经过长期观察得出的一些关键的经验:如果在房间中需要安装的刀片服务器机柜超过总机柜数量的25%,那么现有的数据中心的电力和散热系统可能需要进行全面改造。这说明如果安装数量达到这个限度,用户就需要重建一个机房,否则就得把数据中心关闭一段时间进行系统改造。
  • 如果现有数据中心计划安装1至5个刀片服务器机柜,那么为了将对数据中心正常运转的影响降到最低,同时降低安装成本,以饱和密度的25%或50%的数量(如每个机柜中最多放置3个机架)进行安装最合适。对大多数数据中心来说,实现非常高的功率密度所需的成本比增加几个机柜位置所需的空间成本要高得多。
  • 现在的数据中心一般都是为系统设备整体提供散热和电力供应,辅助散热方案能够以较低的成本提高应用密度,同时达到预测的散热效果。
不推荐的方法
        下面列举了数据中心管理人员平时经常会采用的一些方法和做法,但这些方法都是有缺陷的,对解决问题帮助不大,而且往往会使情况更糟。
降低空气温度。用户通常会通过调低机房空调的温度设定来降低机房的空气温度,以解决数据中心出现的一些热点。这是用户操作最容易也是最差的做法。采取这种做法会降低空调系统的能力,大大增加增湿器的水消耗量,大大降低数据中心的运行效率(结果还会让你帐单上的电费增加)。所有这些都会发生,而问题根本得不到解决,因为这是气流的问题,而不是空气湿度的问题。
地板格栅。另外一个看似合理的措施就是把垫高地板的通风地砖换成气孔更大的格栅。这种格栅的样子不是我们所熟悉的带孔的地砖,而是有点象火炉篱子。这种方法对于孤立的机柜会有帮助,但会有严重的副作用——特别是大量使用这种地砖的情况下。在数据中心使用这种地砖通常会导致其它区域的气流减少,但更重要的是这些格栅会引起地砖间的气流发生重大的不可预测的变化。
机柜顶部风扇。在机柜顶部安装风扇的情况非常普遍——尽管这些风扇对于一个设计完好的IT机柜中一点好处也没有。服务器过热的原因并不在于机柜内部,而是在于服务器前部进入口处的热空气。这些风扇只能是产生更多的热量,甚至会降低一个设计优良的数据中心的散热能力。许多用户在目的不明确的情况下按照传统的规格确定风扇的规格。也有一些与机柜配套的有效的风扇辅助设备。
孤立机柜。有时候用户会把机柜从整排机柜中单列出来,试图在一定范围内降低机械密度,让通风地砖的气流能够更多地接触到机柜。但是这种方法使得设备排出来的热气在机柜周围回流到服务器的进气口。整体效果并不是很好。更好的方法是让机柜处于热通道和冷通道的安排中,在刀片服务器机柜之间用带隔板的不加负载的机械隔开,加宽冷通道,使用辅助散热设备和/或热通道密封系统来增强散热性能。
结论
在现有数据中心中应用刀片服务器会给数据中心的电力和散热系统带来压力,这种压力不容忽视。有多种方法可以用来给刀片服务器提供电力或散热功能。针对某一具体安装的最好的方法要根据现有设计的制约和数据中心管理人员的需求和喜好而定。本方案概要阐述了涉及刀片服务器应用的相关事宜和选择。根据现有数据中心的制约因素和用户需求来选择应用方法的流程。大多数用户不了解高密度放置刀片服务器的后果。当他们考虑到这些方案以及优势后,在现有设施中分散安装刀片服务器会更有吸引力,因为这样节省成本和时间,能够减少对现有数据中心正常运转的干扰。

转载于:https://blog.51cto.com/3450223/661199

刀片服务器在现有数据中心的应用策略相关推荐

  1. 数据中心服务器冷却技术,数据中心各种冷却技术的应用与发展

    为了满足各种类型和规模数据中心的冷却需求,冷却技术仍在不断发展,例如托管数据中心.云平台.企业内部部署数据中心以及边缘数据中心正在采用各种冷却技术--冷冻水.泵送制冷剂.遏制通道.行和机架级空气.液体 ...

  2. 有限服务器延时计算_新建三座超级数据中心,增超百万台服务器 阿里云数据中心选址有何逻辑?...

    每经记者:刘春山 每经编辑:梁枭 今日(7月31日),阿里云正式宣布,其位于南通.杭州和乌兰察布的三座超级数据中心正式落成,陆续开服,新增超100万台服务器的计算力.加上之前的张北.河源,阿里云已经建 ...

  3. 服务器虚拟化架构设计,服务器虚拟化与数据中心I/O网络架构设计

    这是关于网络架构设计两部分系列中的第一篇.想了解关于在网络架构中整合I/O虚拟化方面的知识,请点击第二篇:如何将I/O虚拟化整合到网络体系架构中. 服务器虚拟化对于数据中心I/O网络架构的需求非常强烈 ...

  4. 机房服务器虚拟化,服务器虚拟化在数据中心机房中的应用

    随着高校数字化校园的逐步推进,校园网各种应用服务越来越多,每个应用服务都要配置独立的服务器,致使数据中心机房服务器的数量逐年攀升.众多的应用服务器不仅系统资源的利用率低,数据备份困难,而且管理成本也在 ...

  5. 阿里云服务器18个数据中心测试IP地址以及测试方法

    阿里云服务器18个数据中心测试IP地址以及测试方法 2018-09-27 分类:阿里云应用 阅读(3710) 评论(0) 我们用户在选择阿里云服务器的时候是不是感觉阿里云的数据中心太多太多,确实阿里云 ...

  6. “挖空三座山、装了几万台服务器”的绿色数据中心

    富士康在贵安新区的数据中心造在了山洞里."他们挖空了三座山,装了几万台服务器!" 数据中心主体竣工后,经实际测试年pue值小于1.1,居于世界先进水平. 当时,富士康规划园区中有一 ...

  7. 服务器pcie性能最大,首款PCIe 4.0服务器处理器为数据中心加速

    ​随着第三季度的临近,AMD第二代EYPC处理器即将正式发布,携先进的7nm制程工艺.64核心.PCIe 4.0等一系列创新领先特性,代号为"Rome"的新一代霄龙处理器将为数据中 ...

  8. 信息上传服务器加速cpu处理,业界首款PCIe 4.0服务器处理器为数据中心加速

    曾经,在服务器CPU市场Intel一家独大,但过去两年,AMD凭借空前成功的"Zen"核心,以代号为Naples的EPYC(霄龙)处理器强势杀入,从最大的云环境到AI应用领域,再到 ...

  9. 数据中心服务器冷却技术,数据中心高效液体冷却系统一

    多年来,由于增加服务器的密度并减少其体积的大小,服务器的密度变得越来越高,数据中心正日益产生更多的热量.因此,每平方英尺产生热量的瓦数正在不断上升,这种功率密度的增加严重制约了传统的冷却方法和技术.液 ...

最新文章

  1. ReSimNet: drug response similarity prediction using Siamese neural networks
  2. echarts柱状图x轴文字换行_深入 echarts 如何设置 Label / axisLabel 换行及自定义格式 / 自定义样式? 结合 canvas 如何实现文字换行来理解...
  3. C#基础-类成员(Day7)
  4. Windows Server 2008 SVN 配置
  5. 配置MYSQL远程连接
  6. AI+时代,谈谈产品经理对图像识别技术的阈值控制
  7. java 可重入读写锁 ReentrantReadWriteLock 详解
  8. (原创)网吧桌面背景添加文字,转载注明出处!
  9. Springboot 后台管理框架halo.kotlin
  10. next.js 无法导出及导出图片无法加载等问题
  11. 画图必备numpy函数
  12. 这才是设计 React 的万金油!
  13. flutter text 左对齐_【Flutter学习】基本组件之文本组件Text
  14. 模糊评价模型-以2018美赛为例
  15. android 微信小程序 唤起app,Android 微信小程序打不开app方案解决
  16. android程序员简历模板
  17. EXCEL中的MID函数查询身份证年龄
  18. AES加密算法和原理
  19. 评说于国富律师的“免费正版化”
  20. 第14/15周作业---郭志康

热门文章

  1. python运维实战--跨堡垒机连接二级服务器上传文件
  2. shell编程基础之基本文本工具集合
  3. SpringMVC之使用Validator接口进行验证
  4. 解决mysql-5.5导入数据报错
  5. SQL SERVER 2008 创建,删除,添加表的主键
  6. PHP中不被注意但是比较重要的函数用法集合
  7. FPGA等效门数的计算方法
  8. 《Linux From Scratch》第二部分:准备构建 第五章:构建临时文件系统- 5.11. Tcl-8.6.3...
  9. 把软件架构演进体现在栈上
  10. HDU 4035 Maze(树形概率DP)