当地时间12月2日,在加拿大举行的第32届NeurIPS神经信息处理系统大会上,百度正式发布自主研发的超级AI计算平台X-MAN3.0。该平台专为AI深度学习场景优化设计,每秒完成2000万亿次深度神经网络计算,极大的加快了AI深度学习模型的训练速度。

NeurIPS作为机器学习和神经计算领域的顶级会议,吸引了机器学习、人工智能、统计等领域的众多国际专家参与。近年来,在计算机视觉、语音识别、自然语言处理等领域也出现了大量的创新应用,NIPS在AI深度学习领域的学术影响力变得举足轻重。

算法、数据和计算是推动AI深度学习技术快速发展的三大要素。为支持更强的泛化能力,更高的预测精度,算法模型日趋复杂,越来越多的数据需要被及时标注和处理,计算性能成为关键。百度X-MAN超级AI计算平台提供极致的计算性能,支持超大复杂算法模型,能够快速及时处理海量数据。自2016年诞生以来,百度X-MAN超级AI计算平台历经3代发展,3次架构升级,创造6项业界第一,同时期关键技术&性能保持领先,引领行业发展趋势。目前,X-MAN系列产品已在百度大规模应用,正在助力百度AI战略快速落地。

X-MAN解决的3大关键技术挑战
为提供更强的计算性能和最佳的计算效率,X-MAN在系统设计中面临了三大关键技术的挑战:如何有效提升单机计算性能、如何实现多机加速的高可扩展性以及如何均衡CPU与AI加速芯片的配比关系,以避免系统瓶颈。

在有限的单机空间内,集成更多数量、性能更强、互联带宽更高的AI加速卡,是提升单机计算性能的直接手段,但带来了高速互联、结构、散热、供电等硬件技术难题;单机训练方式难以满足超大规模数据集和复杂的模型场景下的计算力需求,大规模分布式训练成为必然,解决多机加速的可扩展性就成了关键技术难题;深度学习模型的负载差异较大,CPU密集型,计算密集型,通信密集型,存在着多种需求场景,为了避免系统性能瓶颈、充分发挥计算效率,如何快速灵活的调整CPU和AI计算芯片的配比并支持独立迭代升级成了关键的技术难题。

X-MAN的3次架构升级和9大技术特征
自2016年首次发布以来,X-MAN的三代产品各自都有着鲜明的设计理念:超高的计算密度、高效散热、兼容多元化AI加速芯片。X-MAN通过3次架构升级,有效攻克了3大技术挑战。

X-MAN1.0发布于2016年Q2,单机可以支持16个AI加速卡,最高扩展到64,实现了超高的计算密度。X-MAN1.0具备4大技术特征:硬件解耦、资源池化、PCIe Fabric技术、100G RDMA高速互联。通过硬件解耦实现了单机计算性能的扩展,支持独立快速升级CPU和AI加速卡;通过硬件解耦和资源池化技术支持快速灵活调整CPU和AI加速卡的配比,从而避免系统瓶颈,保证计算效率;通过PCIe Fabric技术提升单机内部通信带宽降低了通信延迟,且可以在虚拟机环境下支持多卡高速通信实现native performance,从而解决了强大的单机计算性能的挑战;通过100G RDMA高速互联技术提升多机的通信带宽降低通信延迟,从而解决多机加速的可扩展性的技术难题。

X-MAN2.0发布于2017年Q3,通过冷板式液冷散热技术实现了超高的散热效率。和业界主流方案一样,X-MAN2.0可以支持8卡NVLink高速互联,差异化方面,X-MAN2.0具备2大技术特征:液冷散热和灵活的IO支持。随着AI加速卡的功耗增长,散热问题已成为制约AI加速卡计算力提升的关键瓶颈,X-MAN2.0通过冷板式液冷散热技术解决了散热难题,同时又避免了浸没式液冷技术带来的运维、部署、成本等问题。随着AI加速卡的性能进一步提升,通信瓶颈也会进一步暴露,X-MAN2.0通过灵活的IO接口特性,支持按业务场景适配不同数量的100G RDMA网卡,在解决多机加速的可扩展性技术挑战的同时,也有效降低了网络系统设计的复杂度和成本。

随着AI人工智能技术的快速发展,众多AI芯片公司应运而生,AI芯片格局正呈现多元化发展趋势。此次NIPS大会上发布的X-MAN3.0,采用了硬件系统模块化、互联接口标准化、互联拓扑高灵活性的设计思路,既提升了多元化AI加速芯片的兼容性,也促进了AI加速芯片生态健康、快速、可持续的发展。X-MAN3.0具备3大关键技术特征,包括48V供电技术、标准化的AI加速卡接口定义和灵活的互联拓扑。相比传统12V供电技术,48V供电技术可以更好解决AI加速卡在负载急剧变化面临的电流冲击问题;通过灵活的互联拓扑,可以支持单机扩展更多的AI加速卡,从而有效提升单机计算性能,更可以支持专用多机互联通信通道,相比传统的100G RDMA网络,专用通信通道可以进一步提高通信带宽,降低通信延时,有效解决大规模多机计算的高扩展性技术挑战;通过标准化的AI加速卡接口定义和灵活的互联拓扑,可以有效兼容多元化AI加速芯片,促进AI芯片多元化生态格局健康发展。

此次百度快速研发落地X-MAN3.0,得到了浪潮、英业达等服务器系统厂商的积极参与支持; 我们期待有更多的服务器系统合作伙伴、AI加速芯片厂商和同行加入共建开放的生态,促进整个生态圈的良性发展。


X-MAN1.0


X-MAN2.0


X-MAN3.0
X-MAN创造了6项业界第一,引领行业技术发展趋势
凭借着对AI业务模型的深刻理解、扎实的硬件基础架构技术和对行业趋势的准确预判,百度设计了X-MAN AI计算平台系列产品,创造了6项业界第一。其中, 2016年Q2发布的X-MAN1.0创造了5个业界第一:首次实现单机扩展16片AI加速卡;首次实现4/8/16/32/64卡系统级弹性扩展;首次实现AI计算硬件解耦架构(注:Facebook 2017年Q1发布的Big Basin、微软2017年Q1发布的HGX-1等都采用了相似设计理念);首次实现PCIe Fabric技术架构,支持按需求业务动态分配AI计算资源;首次实现虚拟机多卡高速无损通信技术(native performance)。2017年Q3发布的X-MAN2.0业界首创将冷板式液冷散热技术应用到AI计算产品里,有效解决了高性能AI加速卡的散热挑战(注:Google 2018年Q2发布的TPU3.0也采用了相似技术)。

X-MAN大规模部署,助力百度AI战略快速落地
凭借着强大的单机计算性能、业界领先的多机扩展性、灵活的AI计算资源动态分配调整能力,X-MAN系列产品已在百度实现规模化部署,广泛应用于语音识别、计算机视觉、自然语音处理、无人车等基础AI技术的深度学习模型训练,将训练时间从周级别缩短到天级别;服务于百度DuerOS、Apollo、ABC Cloud等核心业务,助力百度AI战略的快速落地。

百度X-MAN超级AI计算平台,人工智能界的超级英雄相关推荐

  1. 美通社企业新闻汇总 | 百度英业达合作研发超级AI计算平台;《2019大中华薪资指南》发布...

    要闻 <2019大中华薪资指南>发布,财会人才需求量依然相当高 拜耳推出索来多驱虫项圈,目标中国大城市养宠物女性 卡西欧发布与红牛二队最新合作的高性能运动手表 百度英业达合作研发超级AI计 ...

  2. 人工智能AI 计算平台介绍

           人工智能AI计算平台介绍        产品及服务:        标准模块开源        核心模块及服务收费        资源齐全        服务支持        产品使用 ...

  3. 工业界常用嵌入式/移动端AI计算平台调研

    引言: 神经网络模型被广泛应用在图像分类.物体检测.目标跟踪等计算机视觉任务中,并取得了巨大成功.随着时代发展,人们更加关注深度神经网络的实际应用性能,人工智能技术的一个趋势是在边缘计算平台上部署高性 ...

  4. 端云协同,打造更易用的AI计算平台

    内容来源:华为开发者大会2021 HMS Core 6 AI技术论坛,主题演讲<端云协同,HUAWEI HiAI Foundation打造更易用的AI计算平台>. 演讲嘉宾:华为海思AI技 ...

  5. vivo AI计算平台 Kubernetes集群Ingress网关实践

    1.背景 vivo 人工智能计算平台小组从 2018 年底开始建设 AI 计算平台至今,已经在 kubernetes 集群.以及离线的深度学习模型训练等方面,积累了众多宝贵的开发.运维经验,并逐步打造 ...

  6. vivo AI 计算平台的 ACK 混合云实践

    作者|刘东阳.吴梓洋 2018 年底,vivo AI 研究院为了解决统一高性能训练环境.大规模分布式训练.计算资源的高效利用调度等痛点,着手建设 AI 计算平台.经过两年多的持续迭代,平台建设和落地取 ...

  7. 华为云发起元宇宙 Web3.0联盟,风口上的 AI 计算平台Deepbrain Chain再次登台亮相...

    这是白话区块链的第1867期原创 作者 | Bob 出品|白话区块链(ID:hellobtc) 近来,亚太地区元宇宙与Web3.0主题相关的政策高频推出,各类活动高潮迭起,看点十足. 继新加坡.香港之 ...

  8. Facebook的「下一代 AI 计算平台」长什么样子?

    雷锋网 AI 科技评论按:作为社交网络巨头,Facebook 的一系列应用和服务每月服务的用户多达 27 亿.随着近几年的 AI 热潮席卷而来,Facebook 也开始把数据中心中的许多通用计算硬件逐 ...

  9. 华为人工智能计算机平台,华为Atlas人工智能计算平台正式上市

    原标题:华为Atlas人工智能计算平台正式上市 2019年4月17日,华为宣布Atlas人工智能计算平台系列产品正式上市,开启了Atlas商用新篇章. 华为智能计算Atlas新品开售 Atlas人工智 ...

最新文章

  1. 客户端安装服务器的路径查找文件,柴少鹏的官方网站-puppet系列(一)之puppet的部署、配置文件以及命令详解...
  2. 【转载】Linux截图工具
  3. php 链接文件名_7、php-fpm进程管理
  4. Kinect深度图与摄像头RGB的标定与配准(转载文章)
  5. ticket进行urlencode是什么意思_request请求中进行url转码,结果意想不到,python爬虫(2)...
  6. 概率论 方差公式_概率论与数理统计课程教学、学习基本要求和教学建议
  7. python简易发红包_学习python:练习5.简单红包程序
  8. 魅族17系列邀请函来了:防爆盾外观实锤 或4月15日亮相
  9. ACCESS模糊查询出现的变态问题,不知道该问题的希望注意,知道内幕的高手还望给小弟一个解释 Thanks...
  10. 好的技术文章应该让读者更自信而不是更自卑
  11. zebra的命令存储原理及使用方法
  12. 如何区分网线是几类的_网线如何区分五类线、超五类线和六类线?
  13. 【读懂Autosar代码】-1-概述
  14. STM32debug模式下可以执行,但是不能单步调试和跳转
  15. 可视化正则表达式教程
  16. 【数字电路基础】CMOS晶体管的延时
  17. 解决scrapy爬虫报错 pymongo.errors.DuplicateKeyError: E11000 duplicate key error collection
  18. R语言ERROR: compilation failed for package ‘****‘
  19. 利用FFmpeg玩转Android视频录制与压缩
  20. 计算机能手数据的计算教学设计,《数据计算》优秀教案

热门文章

  1. Executors快捷创建线程池的潜在问题
  2. Lotus的JAVA与DOMINO通过LDAP集成方法
  3. 安全运维之Resin应用服务器中间件安装使用与安全配置
  4. python开发工具排名-5个最好用的Python编程开发工具(IDE)分享
  5. ARIS流程平台简介(二)
  6. Android 画一个 iPhone 样式的小时钟
  7. 好消息!国产编程语言RPP 1.86 开源发布!
  8. plsql查询数据量过大问题
  9. SIP穿越NAT的几种方式
  10. win11安装eclipse