作者 | 马超

责编 | 伍杏玲

出品 | CSDN(ID:CSDNnews)

今年的新冠疫情让不少人认识到云计算的战略意义:今年5月,IBM 新 CEO 克里希纳在上任伊始就表示,IBM将专注于AI和混合云,将它们视为未来的关键技术。谷歌云计算部门负责人托马斯·库里安表示将全力追赶云计算领头羊亚马逊和微软。

在我国,随着新基建政策的下发,国内各科技巨头开始强势布局:阿里云宣布3年 2000 亿入局,腾讯清远数据中心开服。今天,阿里云宣布位于南通、杭州和乌兰察布的三座超级数据中心正式落成,陆续开服。

相比于传统的数据中心,超级数据中心是面向未来设计打造的,比拼的是技术能力。因此我们经常听到有关数据中心的黑科技,比如微软和脸书的海底数据中心,华为和AWS推出基于ARM的服务器,阿里云本次发布的超级数据中心更是应用达摩院、平头哥等最新研究成果,在各方面都有技术升级。

下面笔者带大家揭开超级数据中心神秘的面纱。

揭秘超级数据中心背后的黑科技

云计算边际成本随着规模增大而快速降低的效应愈发明显,比如一个数据中心的土地、电力、制冷等是成本的大头,增加一台服务器或者计算节点新增投入的边际成本很低,超级数据中心恰恰是这种规模集约化运营模式的终极产物,堪称是算力之源,服务底座。

与传统数据中心不同,超级数据中心想通过规模提高效益,必须要解决大规模供电、高带宽数据传输以及高效率制冷这三大难题,以往这些技术的透明度不太高,各厂商往往都对这些黑科技讳莫如深。

阿里云本次揭开了这些黑科技的面纱,着实让笔者对于超级数据中心的认识更进了一步。

巴拿马电源:一般的数据中心尤其是超级数据中心,其供电一般是通过高压电进行配送的,如何将10kV的AC供电转为240V的DC供电,并且控制相应损耗一直都是摆在数据中心强电工程师面前的难题。

阿里重新定义10kV---240V供电链路,对磁路和电路进行联合设计,提出最高2.5MW、一体化、模块化、高效、高可靠直流不间断电源,省去传统低压配电环节,采用第三代半导体技术大幅度优化电源内部结构,实现了高可靠和低成本的目标。

只需一台巴拿马电源,可以从中压10kV AC直转240V DC(或336V DC),让供电传输一步到位,更加高效而可靠。正如1914年开凿完成的巴拿马运河极大地缩短了太平洋和大西洋之间的航程,巴拿巴电源大幅降低了供电系统的转换损耗。

400G光模块:内部网络高速稳定的数据传输,是业界对于新一代数据中心的基本要求,这依赖于光模块的技术水准。

去年末阿里推出了基于硅光技术的400G DR4光模块,其带宽密度提高4倍,网速提升4倍,设备体积与成本基本没有增加,目前400G光模块已在阿里的各大超级数据中心全面投入使用。

液冷服务器集群:说实话液冷技术的确令笔者非常震撼,阿里将这种液冷技术命名为“麒麟”,这是一种将服务器被浸泡在特殊的绝缘冷却液里的制冷方案,由于运算产生热量可被直接吸收进入外循环冷却,全程用于散热的能耗几乎为零,因此这种形式的热传导效率比传统的风冷要高百倍,节能效果超过70%。

“麒麟”系统真正推广开却不容易,如果全部使用液冷,那么服务器硬件故障该如何快速维修,如何快速布线等等,这都是革命性变化,目前全球范围内仅有阿里的一个数据中心大规模采用了“麒麟”技术。

未来3到5年,阿里计划将所有数据中心全面使用液冷。想想看,如果全国的数据中心都采用液冷技术,一年可节省上千亿度电,逐步实现低碳数据中心的目标。

分散布署的逻辑:不把鸡蛋放在一个篮子里

云计算市场最大的特点是胜者通吃,谁占据市场第一的位置,谁降低成本,以更低的价格形成挤出效应。因此各大科技巨头都有强烈的规模化、集中化的诉求。

各巨头的数据中心选址却并不集中,比如阿里本次的数据中心布署在了南通、杭州和乌兰察布三地,每个地域都采用了3AZ设计。笔者认为这种情况的出现关键在于“不能把鸡蛋放在同一个篮子里”。这种数据中心布署,一般要满足以下原则。

就近原则:分别接近京津冀、长三角、珠三角经济带

3AZ设计:每个数据中心都采用3AZ设计,一份数据会在一个数据中心的三个AZ里做备份,防止数据丢失。

全球性广泛布署数据中心有一些就近服务规划方面的优势,是集中布署的数据中心所不具备的。

今年年初,联合国在纽约总部宣布腾讯成为全球合作伙伴,为联合国成立75周年提供全面技术方案,其中腾讯会议、企业微信和腾讯同传为这场有史以来最大规模的全球对话提供远程会议服务,支持疫情期间的在线会议活动。

腾讯能脱颖而出,正因为腾讯会议依托腾讯全球的数据中心,实现了在复杂网络环境的高抗性自适应。同时腾讯会议的调度系统综合考虑用户所在位置、运营商、网络和链路质量情况,动态选择最佳接入点,有效地保障“最后一公里”的接入质量。从而支撑全球不同国家不同地点的同时接入服务,这是集中布署的数据中心所不能具备的优点。

异地数据中心:灾备体系之根

前不久,微盟因人为恶意删库,使得其业务自发生中断,直到一周多以后才全面找回数据。纵然业界普遍一般公司有5%左右的概率发生重大信息系统灾难,一旦故障发生,企业损失巨大。异地数据中心的灾备体系建设可以将这类事故的影响降到最低。

在讲灾备体系之前,我们先来明确评价业务连续性的两个重要指标:

RTO(Recovery Time Objective):RTO是指灾难发生后,从IT系统崩溃导致业务停顿开始,到IT系统完全恢复,业务恢复运营为止的这段时间长度。RTO用于衡量业务从停顿到恢复的所需时间。

RPO(Recovery Point Objective):IT系统崩溃后,可以恢复到某个历史时间点,从历史时间点到灾难发生的时间点的这段时间长度就称为RPO。RPO用于衡量业务恢复所允许丢失的数据量。

简单来讲RTO是灾难发生后业务中断的时间,RPO是灾难发生后数据丢失的数量。

一般来说目前比较流行的灾备体系是至少建设三个数据中心:

主中心:正常情况下全面提供业务服务。

同城中心:一般使用同步复制的方式来向同城灾备中心传输数据,保证同城中心数据复本为最新,随时可以接管业务,以保证RTO的指标。但是同城中心无法应对此类删库事件。

异地中心:一般使用延时异步复制(延时时间一般为30分钟左右)的方式向异地灾备中心传输数据,其中同步复制的好处是一旦主中心被人工破坏,那么不会立刻涉及异地中心。以保证RPO的指标。

一句话总结灾备体系的最佳实践就是两地三中心;同城保证业务连续性,优先负责用户体验;异地保证数据连续性,确保企业生存底线。

不少企业尤其是创业型企业在异地中心的建设上投入还不够,一旦发生删库事件就影响是致命的。所以当企业发展到一定规模以后,必须考虑建设跨异地数据中心的灾备体系,以此来应对风险。

十年前,IT界普遍流传着一句话叫做“代码正在吞没世界”,现在人们才真正醒悟原来云计算才是背后的那个大BOSS。如今,随着云原生和无服务器计算模式的普遍应用,云服务模式正在被重新定义。数据中心作为云的底座越来越有成为IT行业的C位的趋势,未来值得期待。

更多推荐阅读

  • 没想到!!Unicode 字符还能这样玩?

  • 程序员必备基础:Git 命令全方位学习

  • MongoDB 计划从“Data Sprawl”中逃脱

  • V神演讲内容曝光!Defi、挖矿、行业应用更多主题大揭秘!

  • Python 还能实现图片去雾?FFA 去雾算法、暗通道去雾算法用起来! | 附代码

IT 实力较量:决战超级数据中心之巅相关推荐

  1. 加码 2000 亿还不够,阿里云再建三座超级数据中心加速新基建

    作者 | 伍杏玲 出品 | 程序人生(ID:coder_life) 今年4月,阿里云宣布将在3年内投入2000亿,用于研发云操作系统.服务器.芯片.网络等技术和面向未来的数据中心建设.在 6 月 9 ...

  2. 有限服务器延时计算_新建三座超级数据中心,增超百万台服务器 阿里云数据中心选址有何逻辑?...

    每经记者:刘春山 每经编辑:梁枭 今日(7月31日),阿里云正式宣布,其位于南通.杭州和乌兰察布的三座超级数据中心正式落成,陆续开服,新增超100万台服务器的计算力.加上之前的张北.河源,阿里云已经建 ...

  3. 打造数据中心的软实力

    在IT领域,整合或者说融合已经形成了一股巨大的洪流,不可逆转.IT厂商会提供融合了计算.存储.网络甚至是软件的整体解决方案,而用户也希望与单一供应商打交道,以减少整体采购和使用成本.在数据中心领域也上 ...

  4. 液冷数据中心如何构建,蓝海大脑液冷技术保驾护航

    随着云计算.大数据.人工智能等技术的发展和应用,"东数西算"政策的落地以及数据中心规模不断扩大,数据中心总体耗能不断增加.传统的散热方式已不能满足当前高密度数据中心的发展需求.液冷 ...

  5. 阿尔法特磁悬浮制冷机组荣获“2016年度中国数据中心优秀节能产品”殊荣

    摘要:3月3日,以"创新,发展,跨越"为主题的"2016年度第八届中国数据中心行业表彰大会"在北京隆重举行,并同期揭晓了"2016年度中国优秀数据中心 ...

  6. 如何有效提高数据中心PUE?

    摘要:数据中心基础设施管理解决方案(DCIM)帮助数据中心实现更高级别的自动化控制,从而简化了数据中心的产能规划与分配工作. 据预测,截至到2020年,全球数据中心的年耗电量总额预计将增加至1400亿 ...

  7. 数据中心加速,一文说清FPGA与GPU、ASIC目前的竞争格局

    超大规模云计算中心.电子商务和社交网络数据中心,正面临着数据类型复杂的工作负载加速之难题. 数据中心加速的主要途径 传统CPU处理能力的需要突破已经成为共识,目前的途径主要有以下几类: 途径一,ASI ...

  8. “双碳”目标下新型数据中心的方向

    摘要:对于新型数据中心的"新型"二字,工信部信息通信发展司政策标准处副处长张寰认为主要体现在几个方面:一是功能变化.过去的数据中心只是存储数据的基础设施,现在已演进为存储数据.处理 ...

  9. 数据中心“泡澡”散热,阿里云启用全球最大液冷数据中心支撑双11

    每年双11火热的不止是购物车,还有阿里巴巴的数据中心.今年双11,阿里工程师们大规模采用了一项黑科技--给数据中心的服务器"泡澡"散热,来给火热的数据中心降温. 11月3日,在阿里 ...

最新文章

  1. unable to contact ip driver
  2. 【Linux 内核 内存管理】RCU 机制 ③ ( RCU 模式下添加链表项 list_add_rcu 函数 | RCU 模式下删除链表项 list_del_rcu 函数 )
  3. 管理序列+序列的伪列+修改序列+删除序列
  4. 什么是分镜头剧本?(分镜头剧本是将文字转换成立体视听形象的中间媒介。主要任务是根据解说词和电视文学脚本来设计相应画面,配置音乐音响,把握片子的节奏和风格等。)
  5. 一个Delphi写的DES算法, 翻译成C#
  6. Oracle12c:安装后新建用户及其默认表空间,并创建表测试
  7. 《java并发编程实践》笔记
  8. typedef 指向函数的指针
  9. python进程池和线程池_Python中的进程池与线程池(包含代码)
  10. python is beautiful_python自动化报告BeautifulReport用法
  11. 如何提高服务器响应的数据速度_提升网站服务器的响应速度的方法
  12. 【python|多进程】打印进度条
  13. 在网页输入框输入角标_这个免费插件能帮我们把Excel内容快速填充到网页表单?...
  14. 升级Cloudera Manager 5 到最新版本(官方文档翻译)
  15. 4k纸是几厘米乘几厘米_4k纸有多大?长宽各多少厘米?
  16. BugKu 你必须让他停下来
  17. defaultdic与dict对比
  18. excel中如何在一列数据的前面统一加上一个符号
  19. 如何通过 AirPlay 镜像您的 Mac 显示器
  20. JESD204B IP核的配置与使用

热门文章

  1. linux用户没有创建文件的权限设置密码,Linux学习第五章用户身份与文件权限
  2. java 写文件filewriter_使用FileWriter写文件
  3. 嵌入式linux python移植过程_嵌入式linux项目开发(一)——BOA移植
  4. itools 不支持缩略图下载_PS插件缩略图3.8.0.96安装教程
  5. c++ 协程_用yield实现协程
  6. 微信时代计算机教学,互联网+时代技工院校计算机教学方式研究
  7. php 匹配关键字,php获取搜索引擎搜索关键词关键字的正则表达式实现方法
  8. 警示!国基金评审过程“打招呼”被通报批评,撤销已资助项目!
  9. 详解凸优化、贝叶斯、MCMC、GCN
  10. 单身狗救星!电子科大校长为理工科男脱单提建议