梦晨 发自 凹非寺
量子位 报道 | 公众号 QbitAI

AI智算中心,如今已成各地必备基建。

放眼全国,已有4个人工智能计算中心建成,西安、许昌等地智算中心也已开工。南京、杭州、广州、大连、青岛、长沙、太原、南宁等地也在规划中。

但任何一次高速扩张,随之而来的当然是概念鱼目混珠,价格乱得天上地下,这问题可得解决。

价格乱象症结:缺乏体系标准

先来具体看看现存的问题。

一份公开资料显示,2020年城市A的智能计算中心,每100P Flops (每秒10亿亿次浮点运算)16位精度的算力建设成本为7500万元

而2021年城市B同等精度下的100P FLops算力建设成本却达到了4.6亿元

明明是定位相同、功能相近的智算中心,建设投入相差达到6.2倍之多,行业价格混乱程度可见一斑。

价格之外还有第二个问题:算力背后运算数据的精度混淆

技术视角看,不同领域对精度需求各不相同。

科学和工程计算对精度的要求最高,需要使用64位双精度。

人工智能训练阶段主要用到32位单精度和16位半精度,在推理阶段可以用16位或者更低一些。

你看,数值同是100P的算力,背后的精度若仅有16位只能算是AI专用算力,若是涵盖64位就能支撑更多通用算法。

两种精度的运算量级不止是单纯差了4倍,但在行业落地中,忽略及混淆的情况不少。

双精度、单精度和半精度格式

很多应用场景都不是单靠AI本身就能完成的。如天气预测、材料设计、药物发现等任务上都需要AI与高精度科学计算相结合。

DeepMind使用AI预测蛋白质结构

相应的,智算中心也要做到以AI算力为主,融合多种算力,才能真正释放算力的价值。

如果以专用算力为噱头,表面上的数值高了就可以哄抬价格。这样修建出来的智算中心就成了“偏科”,往往无法真正适应行业需求。

这两个问题如不解决,修建出的智算中心既在价格上不匹配真实价值,也无法满足相应需求,势必造成资源浪费又阻碍行业发展——

行业亟须有人站出来统一标准

首个智算标杆:专治价格乱象

针对上述问题,中科院人工智能产学研创新联盟联合院内多家院所企业做了相应努力:

在WAIC 2021上发布了新一代人工智能计算平台,要打造智算中心的建设标准。

为什么说是新一代呢?

联盟联合了院内多家院所企业,基于科学院多项重大科技成果,让平台做到“用得上”和“用得好”。

“用得上”,也就是满足产业需求。

一个城市建起智算中心,是要为周边地区的各行各业服务,需要计算平台有通用性。

此次发布的新平台采用开放架构,可以兼容各大AI框架和数据处理平台,还做到了迁移灵活、编译开发难度低。

同时支持CPU、通用GPU、专用AI加速芯片的多元芯片组合,提供覆盖各精度算力,可胜任模拟、训练、推理等AI全链条应用需求。

基于以上两点,新平台成为了国内首个跨模态、通用化的AI公共创新服务平台。

解决了“用得上”,还要做到“用得好”

面对这个问题,新平台基于中科院多项重大科技成果,联合多家院所企业,也有着独特的技术优势。

在硬件设施上,新平台采用浸没式相变液冷技术,节能效果高达30%

配合超高密度立体扩展的建设模式,节省机房面积90%,可以最小化土建上的投入,把基础设施和IT设备打包成模块整体交付,做到快速业务上线

中科院计算所研究员、CCF高性能计算专业委员会秘书长张云泉表示,建设智算中心的成本中有3个重点:

  • 芯片、服务器设备的硬件成本

  • 机房、土建的基础设施成本

  • 建成后持续运营产生大量的电力成本

新平台明确了智算中心需要哪些芯片,给出了服务器、机房的建设方案和节能上的改进。

还给出了具有说服力的算力价格标准方案:

在综合存储、能耗、开发、定制、数据调度等一系列因子,并代入明确的算法标准后,得出在同时具备5P双精度算力(64位)、25P单精度算力(32位)和100P半精度算力(16位)的情况下,智能计算中心的基础设施价格约为1亿-1.5亿

国科控股党委副书记、副董事长、总经理杨建华对此这样评价:

平台集诸多中科院人工智能技术成果于一体,拥有清晰的实施路径,可为区域智算中心建设提供标准的可复制范本。

同时中科院科技战略咨询研究院院长潘教峰表示:

平台依托中科院顶层战略规划,汇聚算力、算法、数据、软件、人才、应用等资源要素,将为AI产业化发展、行业数智化转型和政府智慧化治理提供有力支撑。

价格规范让算力像水电一样,服务全社会

在“算法、数据、算力”人工智能三要素里,目前哪一个是最大的短板?

张云泉这样回答:

现在是算力。大数据已经发展很多年了,算法的演化很快,对算力的需求很大,是在拉着算力往上走。

建设智算中心将过去分散在各企业、研究机构的算力聚合起来去补齐这个短板,推动产业良性健康发展。

在工业时代,城市靠集中供水、供电方便和丰富了千家万户的生活。

在AI时代,城市也要把聚合起来的算力,高效流通和分配出去,促进千行百业的生产。

这就使算力的价格标准与水价、电价标准同样重要。

中科院人工智能产学研创新联盟在做的,就是为智算中心建设提供了一个可复制范本。

用这个范本树起透明的价格标杆,让算力像自来水一样流淌

争建AI算力中心热潮背后:谁在花冤枉钱?相关推荐

  1. @所有城市:想建AI智算中心的看这里!国家认可的那种

    金磊 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 比算力.拼速度,今年火得藏不住. 就这两年,全球明星公司都纷纷开造,自建智算中心. 大洋彼岸特斯拉,马斯克今年重要的成就就是自研AI超 ...

  2. 科技云报道:“吞金兽”ChatGPT背后:AI算力告急!

    科技云报道原创. 近两个月来,全世界的网友们都在兴致勃勃的"调教"ChatGPT,但第一个受不了的却是ChatGPT的所有者. 为了更长远的发展,OpenAI宣布了付费订阅版Cha ...

  3. 东数西算热潮下,云原生如何发挥 AI 算力澎湃动能?

    今年二月,东数西算工程全面启动,在各界掀起了一股热潮,资本.媒体.行业,乃至民众都纷纷加入了话题讨论. 如今,算力不仅仅是数字经济时代的新生产力,更是成为与 "水.电.气" 并驾齐 ...

  4. Imagination推最强多核GPU系列!AI算力达24 TOPS,支持自动驾驶和数据中心

    芯东西(公众号:aichip001)文 | 心缘 芯东西10月13日报道,刚刚,Imagination Technologies宣布推出又一大重磅新品--全新IMG B系列GPU IP. 这是其第一个 ...

  5. 论软件定义GPU对AI数据中心优化的必要性

    作者 | 陈飞 来源 | 趋动科技 摘要: 今天AI数据中心为企业提供了深度学习开发.测试和生产所需的软硬件环境.然而,GPU作为高价值硬件,却并没有做到像SDN网络.分布式存储一样的数据中心级统一运 ...

  6. 新基建下 AI 算力市场崛起,华为凭什么从中分一杯羹?

    2020 年,成为真正意义上的新基建"元年",各种利好政策密集落地,全国各地都开始重视起这个频频出现在国家政策文件上的新概念.近期,国家发改委近期多次强调加快 5G 网络.数据中心 ...

  7. 华为发布AI时代数据中心交换机:让网络瓶颈不再是束缚,AI算力提升一倍

    晓查 发自 凹非寺  量子位 出品 | 公众号 QbitAI 华为正在全面拥抱AI. 在手机上使用AI芯片麒麟980,去年10月还发布了AI计算芯片"昇腾".现在华为要把AI的战略 ...

  8. 却话文心一言(Chatgpt们),存算一体真能突破AI算力“存储墙”|“能耗墙”|“编译墙”?

    文心一言折戟沉沙 作为国内搜索引擎巨头玩家,百度在中文语料领域拥有大量的积累,在算力基础设施等层面也拥有优势. 但是国产化AI芯片的处境其实很难. 这不是危言耸听,也不是崇洋媚外.这不,百度文心一言初 ...

  9. 让客户实现 AI 算力“自由”,博云与趋动科技完成算力调度容器化验证

    背景 近年来,国家对算力的重视程度不断提升.在算力基础设施方面,先后发布<全国数据中心应用发展指引>.<关于加快构建全国一体化大数据中心协同创新体系的指导意见>等:在算力服务方 ...

最新文章

  1. 超级挂载 实现过程-代码
  2. msf rhosts设置文件_聊一聊基于 msf 的免杀项目测试过程
  3. wxWidgets:wxDirPickerCtrl类用法
  4. Eclipse常用插件下载地址
  5. 数乌龟(母牛,兔子....)[打表法]
  6. HTML5 九宫格拼图游戏
  7. 挖矿木马分析之肉鸡竟是我自己
  8. JetPack中的Room
  9. PyTorch的自动求导机制详细解析,PyTorch的核心魔法
  10. 2020-10-19 Nvidia与vGPU
  11. 计蒜客 - 蒜头君的任务
  12. 句法分析-基于CKY的PCFG(概率上下文无法语法)
  13. react学习—ref Hook
  14. RJ TextEd 中文绿色版下载
  15. AutoCAD各版本对应的R版本参数值及其对应注册表中的数值(2002-2023)
  16. 【收藏】十款免费BT下载神器
  17. 深度学习在图像领域的应用
  18. 手把手教学 | YOLOX的部署、优化及训练的实现全过程
  19. 洛谷P4098 [HEOI2013]ALO
  20. 【UE4 第一人称射击游戏】20-添加瞄准十字线

热门文章

  1. 与C#中的typedef等效
  2. 将来自另一个分支的所有更改合并为单个提交
  3. 在HTML5 localStorage中存储对象
  4. Java数据结构与算法之排序
  5. docker process tree
  6. THINKPHP 分页类
  7. 一凌网抢攻在线市场 移动办公引领管理新热潮
  8. Oracle 11G RAC 安装图示(三)
  9. 【转】.NET正则基础之——正则委托
  10. lovely desktop