近日,全球倍受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,其中浪潮AI服务器NF5488A5一举创造18项性能纪录,在数据中心AI推理性能上遥遥领先其他厂商产品。

MLPerf是当前全球最具影响力的AI计算基准评测组织,由图灵奖得主大卫·帕特森(David Patterson)联合谷歌、斯坦福、哈佛大学等单位共同成立,每年组织全球AI训练和AI推理性能测试并发榜。据了解,此次MLPerf的AI推理基准测试有全球23家公司和单位参与,在数据中心及边缘等场景进行AI计算产品的性能比试。今年MLPerf训练榜单已于7月公布。

浪潮NF5488A5获数据中心AI性能绝对优势

此次浪潮NF5488A5一举创造18项MLPerf推理性能纪录,成为创纪录最多的AI服务器。今年的测试中,数据中心AI性能最受关注,全部参与机构提交了507项性能测试数据。

浪潮NF5488A5创下了数据中心22个赛项中的13项性能纪录以绝对优势领先,NVIDIA DGX取得了5项数据中心性能纪录。而在此前的MLPerf训练榜单中,NF5488A5在最核心的Resnet50训练任务中也创下了性能纪录,单机性能高居榜首。

浪潮NF5488A5创造18项MLPerf推理性能纪录

性能大幅提升3倍,全栈AI能力优势凸显

在此次基准测试中,浪潮AI服务器NF5488A5在开放优化(Open)和固定任务(Closed)的ResNet50基准性能测试中,均表现优异,相比2019年MLPerf推理榜单的服务器最好性能提升高达3倍。

MLPerf ResNet50推理性能2019 VS 2020对比

NF5488A5是浪潮自研的新一代AI服务器,是此次MLPerf全球竞赛中唯一可以在4U空间内支持8块安培架构A100芯片实现NVLink高速互联的AI服务器。浪潮NF5488A5在系统拓扑上采用了超低延迟设计,支持PCIe 4.0全链路极致优化,高频通信单元采用一级拓扑最近连接,最大限度提升处理器到AI芯片间的通信性能。同时,通过配置NUMA节点,确保每颗处理器与其直连的GPU之间通信性能最优,最大限度降低通信延迟。此外,NF5488A5通过深度优化系统结构设计,确保设备可在高温环境下稳定运行。

本次基准测试中,浪潮展示了其AI计算软硬件协同优化的强大实力。在硬件层面,通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;在软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合GPU Tensor Core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化,在精度无损的情况下性能提升近2倍。

各服务器MLPerf AI推理性能对比(以浪潮NF5488A5为基准,越高越好)

更多精彩推荐
  • DeepFashion实现服装检测搭配

  • 韩辉:国产操作系统的最大难题在于解决“生产关系”

  • 直播电商都用上 AI 实时翻译了!歪果仁也能听懂李佳琦

  • 区块链赋能供应链金融|应用优势与四类常见模式

  • 蓝色巨人IBM全力奔赴的混合云之旅能顺利吗?

MLPerf基准测试再发榜,浪潮AI服务器刷新18项纪录相关推荐

  1. 全球权威MLPerf基准测试再发榜,浪潮AI服务器创18项AI性能纪录

    美国东部时间10月21日,全球备受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,浪潮AI服务器NF5488A5一举创造18项性能纪录,在数据中心AI推理性能上遥遥领先其他厂商产品. MLP ...

  2. 浪潮ai服务器最新数据,浪潮发布的最新AI服务器,将GPU资源利用率提升至前所未有的水平...

    浪潮在ISC20大会期间发布支持最新NVIDIA® Ampere架构A100 PCIe Gen4的AI服务器NF5468M6和NF5468A5,为AI用户提供兼具超强性能与灵活性的极致AI计算平台. ...

  3. 浪潮国产芯片服务器,国产AI 芯片鲲云CAISA完成浪潮AI服务器认证测试

    原标题:国产AI 芯片鲲云CAISA完成浪潮AI服务器认证测试 近日,国产AI芯片鲲云CAISA已在浪潮AI服务器NF5280M5上完成认证测试,将面向智慧城市.智能制造.智慧油田.智慧工地.智算中心 ...

  4. 云从科技3D人体重建技术刷新3项纪录!仅凭照片即可生成精细模型

    3 月 19 日,根据官方消息,云从科技基于单帧图像的 3D 人体重建技术同时在 Human3.6M.Surreal 和 UP-3D 三大数据集上创造了最新的世界纪录,将原有最低误差记录大幅降低 30 ...

  5. 中国AI服务器,刷新全球18项性能基准测试纪录

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 美国东部时间10月21日,全球倍受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,浪潮AI服务器NF5488A5一举创造18项性能 ...

  6. 浪潮NF5270M3 刷uefi_创18项世界纪录,浪潮打造AI应用最强服务器

    一个小小的工作组会议,来了硅谷AI芯片的一半大佬,还有图灵奖得主坐镇--这可不是某个政府主导的活动,而仅仅是MLPerf组织的一次例会而已. 作为AI性能测试组织,MLPerf的一举一动都会引起整个行 ...

  7. 2021全球权威AI性能竞赛MLPerf最新榜单: 浪潮获18项冠军几近半壁江山

    4月22日,全球权威AI基准评测MLPerf公布2021年最新榜单,在全部有效41个项目中,浪潮获得18项性能第一,斩获几近半数冠军. MLPerf™由图灵奖得主大卫•帕特森 (David Patte ...

  8. 国产AI芯片加速,鲲云携手浪潮推出数据流AI服务器

    近日,鲲云科技携手浪潮基于星空X3加速卡推出新一代的数据流AI服务器,定位高性能图像视频智能分析的AI计算加速,支持智慧城市.智能制造.智慧油田.智慧工地.智算中心等典型AI应用场景,这是双方&quo ...

  9. 浪潮AI的五个关键抉择

    在刚刚结束的双11上,阿里实现了2684亿交易额,全程没有卡顿.宕机等情形,这一成就的基础是基于阿里云构建的强大IT基础设施.这一套基础设施中,成千上万台服务器在飞天系统调度下提供大规模并发计算能力, ...

最新文章

  1. mysql引擎层存储层_MySQL存储底层技术:InnoDB底层原理解读
  2. 机器学习算法(优化)之一:梯度下降算法、随机梯度下降(应用于线性回归、Logistic回归等等)...
  3. 人工智阅读理解能力首超人类,阿里巴巴刷新世界纪录
  4. c语言程序设计江宝钏第九章,C语言程序设计 (江宝钏 著) 清华大学出版社 第9章习题答案1...
  5. Lucene学习总结之二:Lucene的总体架构
  6. 服务器centos怎么部署_我什么都不会,怎么拥有自己的个人博客呢
  7. OpenGL(5)——变换
  8. 并发编程学习之ForkJoinPool分支合并
  9. java写的小米商城_开发”小米商城官网首页”(静态页面)
  10. java基于ssm的房屋租赁管理系统
  11. 剩余寿命与年龄的极限分布
  12. linux 下安装mantis
  13. 关于photonserver的使用心得
  14. 两个免费的文献翻译网站,支持多种专业翻译,多种语言!
  15. 模电知识体系总结-1.1半导体基础器件
  16. PDF编辑_隐私条款
  17. [高项]应急储备VS管理储备
  18. fck编辑器的使用(经典)
  19. 项目管理-5大过程与47小过程关系图解
  20. php 实现ppt转动态swf,如何将ppt转换成swf,ppt转swf的软件,ppt转换flash

热门文章

  1. C# Obsolete(已弃用方法属性)
  2. iOS--优秀博客记录
  3. 淘宝装修:第一日 —— 图片轮播
  4. PL/SQL -- INSTEAD OF 触发器
  5. java项目测试支付异步通知接口
  6. postman发送post请求,用request.getParameter()获取请求参数
  7. 暑期集训4:栈,树,优先队列 例 :  UVA - 514 ​​​​​​​​​​​​​​
  8. 《数据科学家养成手册》--第十一章算法学2---(非监督,监督贝叶斯概率以及损失函数)
  9. C++ transform for_each
  10. TensorFlow 实现分类操作的函数学习