一个小小的工作组会议,来了硅谷AI芯片的一半大佬,还有图灵奖得主坐镇……这可不是某个政府主导的活动,而仅仅是MLPerf组织的一次例会而已。

作为AI性能测试组织,MLPerf的一举一动都会引起整个行业的关注。日前,MLPerf更是公布了最新推理基准测试成绩,其中浪潮NF5488A5 AI服务器一举打破18项基准测试性能记录,成为当之无愧的最强AI服务器。

浪潮NF5488A5创造18项MLPerf推理性能记录

那么,MLPerf组织的价值是什么?浪潮NF5488A5 AI服务器为何有能力打破18项纪录?测试成绩与实际应用的表现有差距吗?AI服务器的场景化能力如何?……要想回答这个问题,先要从MLPerf组织说起。

成立两年美誉无数,MLPerf组织咋就这么强

说起MLPerf组织的名字,许多人可能觉得陌生,但是要提到大名鼎鼎的AI应用测试,不少人就会焕然大悟。没错,自2018年初成立之后, MLPerf组织就一直在稳步实现深度学习的Benchmark测试程序。

虽然成立时间不长,但是MLPerf组织的成员可谓是人才济济,既包括英特尔、NVIDIA、Facebook、腾讯、谷歌等顶级人工智能公司,也有Cerebras、Mythic和Sambanova等创业公司,还包括斯坦福、哈佛、多伦多大学等10多所高校。

面对当下热门的机器学习应用,MLPerf已经形成了一整套相对完备和公平的方法,这也就是业内常说的——MLPerf训练基准测试套件。它是业界推出的首款致力于测量机器学习软硬件性能的通用标准的系统,测试标准涵盖计算机视觉、语言翻译、个性化推荐以及强化学习任务等领域。

如果你关注AI领域发展的话,你会发现近两年涌现出的众多AI芯片都已经将MLPerf测试成绩作为对外传播的黄金标准,特别是对于Training系统的测试与应用来说,MLPerf也已经达到了业界领先。如此一来,谁能够在MLPerf测试中脱颖而出,谁就能够成为AI领域冉冉升起的“超新星”。

那么,一举打破18项MLperf推理性能记录的浪潮NF5488A5服务器在性能上究竟有哪些过人之处,它所经历的测试项目又包括哪些呢?我们下面就来详细的看看。

打破18项纪录,浪潮NF5488A5服务器因何致胜?

破纪录一时爽,一直破纪录一直爽。

浪潮NF5488A5服务器就处于这样的状态。根据MLPerf公开的信息显示,浪潮NF5488A5本次打破的18项记录覆盖图像分类、自然语言理解、智能推荐、语音识别等场景。其中在Resnet50模型推理任务处理达到每秒处理32万多张图片;Bert 自然语言理解推理任务达26675条/秒;DLRM智能推荐每秒推理处理能力达210万条。

这也同样是“了不起的挑战”。我们知道,MLPerf推理基准测试设有六个基准,重点面向图像分类、目标物体识别检测、医学影像分割、机器翻译、自然语言处理和智能推荐等常见机器学习任务,也包括了面向后端数据中心和前端边缘侧的两大系列Benchamrk,覆盖了不同的业务场景。

这其中,数据中心场景设计包括图像分类、物体检测、语言翻译(gmnt)、语义理解、智能推荐等测试,而边缘端场景则包括人脸识别(Sphereface20)、语音识别(DeepSpeech2)、翻译(gmnt)等等。换句话说,浪潮NF5488A5服务器已经证明了自己能够在几乎整个数据中心应用场景中发挥作用——打破数据中心22个赛道中的13项性能记录,以绝对优势领先其他品牌。

各服务器MLPerf AI推理性能对比

一直以来,英伟达NVIDIA都被视为AI应用的鼻祖,几乎所有的AI应用特别是Training应用都是基于英伟达NVIDIA的GPU来实现的。那么DGX系统作为英伟达NVIDIA标志性的AI平台,是否能够在测试中拔得头筹呢?答案是否定的。在官方公布的数据中,DGX系统的表现的确抢眼,但浪潮NF5488A5服务器凭借更胜一筹,更高的测试成绩也超过了包括广达等多家参比的服务器厂商。

不仅是Benchmark,专家团队护航浪潮夺冠

虽然取得了这么多的成就,但是这并不意味着浪潮NF5488A5 AI服务器只能运行Benchmark。事实上,恰恰是考虑到了某些“刷榜”问题,MLPerf推理基准测试被分为了2个分区——封闭模型分区(ClosedModel Division)和开放模型分区(Open Model Division)。这其中,封闭模型要求使用相同模型和优化器,而开放模型放开了对深度学习模型及精度的约束,更侧重于深度学习模型及算法优化的能力。

由此看来,浪潮NF5488A5的获胜不存在半分侥幸,甚至可以说这沉甸甸的荣誉背后,也有很大一部分来自于优化团队的功劳。其实早在多年前,浪潮便组建了AI服务器研发团队,从系统架构层面入手,针对硬件、软件和应用等多个维度进行优化,也凭借永不服输的勇气和精益求精的工匠精神毅然推进AI服务器创新进程,跨越AI训练的“三座大山”——效率、弹性和密度。

别看我们说的轻松,实际的优化工作却是枯燥又精细的,工程师们一次次的尝试,只为获得最佳的性能体验——在硬件层面,通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对深度学习推理最优的状态;在软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展。

Resnet50模型优化性能提升1.8倍

比如我们刚才提到的Resnet50项目就是如此。优化团队的工程师们在硬件层面,通过对CPU、GPU硬件性能的精细校准和全面优化,使CPU性能、GPU性能、CPU与GPU之间的数据通路均处于对AI推理最优状态;在软件层面,结合GPU硬件拓扑对多GPU的轮询调度优化使单卡至多卡性能达到了近似线性扩展;在深度学习算法层面,结合GPU Tensor Core 单元的计算特征,通过自研通道压缩算法成功实现了模型的极致性能优化,在精度无损的情况下性能提升近2倍。

为什么浪潮NF5488A5AI服务器能够如此出色的表现?这当然源于出色的硬件架构、不断的软件与应用优化。为了更好的适应AI应用场景,NF5488A5服务器采用了NUMA绑定策略,显著提升了CPU与GPU的数据传输效率。在能效和散热方面,NF5488A5能够完美满足35摄氏度环境温度下工作,为极端环境下的高性能AI计算提供了可靠保证。

从2015年英伟达NVIDIA再度强调深度学习的概念到如今,AI在GPU的加持下已经成为了IT产业发展的主流之一,而浪潮也是业界首家提出AI服务器概念并且在这一领域进行大规模研发投入的,所以才有了今天耀眼的成就。如今浪潮的AI服务器已经广泛应用于互联网、制造业、新零售等多个领域,也正在打造更多、更强的“智算中心”。

在AI的道路上,浪潮还将义无反顾的走下去。

浪潮NF5270M3 刷uefi_创18项世界纪录,浪潮打造AI应用最强服务器相关推荐

  1. html5第一人,中国高空走钢丝第一人,阿迪力·吾休尔(创5项世界纪录)

    高空走钢丝我们都知道是一项非常难的"杂技运动",要有超强的平衡感和胆量才敢迈出这一步.那你有听说过阿迪力·吾休尔(中国新疆)这个人吗?他号称是中国高空走钢丝第一人,曾经创下过5项高 ...

  2. 浪潮NF5270M3 刷uefi_新零售浪潮中,开为科技利用刷脸支付帮门店“运营”人

    便利店里多了一块刷脸支付的屏幕,这背后是一个正在成长起来的新需求.开为科技是一家主要为零售业提供智慧零售解决方案的公司.其产品应用于便利店.商超等商业场景.在开为科技CEO杨通看来,便利店的数字化趋势 ...

  3. 全球权威MLPerf基准测试再发榜,浪潮AI服务器创18项AI性能纪录

    美国东部时间10月21日,全球备受瞩目的权威AI基准测试MLPerf公布今年的推理测试榜单,浪潮AI服务器NF5488A5一举创造18项性能纪录,在数据中心AI推理性能上遥遥领先其他厂商产品. MLP ...

  4. 菜鸟车辆路径规划创造26项世界纪录 实际可降低10.3%配送成本

    9日,菜鸟方面透露,菜鸟已经在全球权威车辆路径规划(VRP)问题评测系统中创造了26项世界记录.目前,菜鸟是国内首个问鼎该评测系统的研究机构.这意味着在26个物流场景中,菜鸟的算法可以使用最少的车辆, ...

  5. AI一分钟 | 阿里NLP技术连破两项世界纪录,玉泉一号AI试验卫星明年发射

    一分钟AI: 阿里人工智能技术重大突破:连破中.英文语言处理两项世界纪录 内蒙古携手银河航天:明年发射玉泉一号AI试验卫星 百度计划2018年投资逾10家AI创业公司 重庆启动人工智能重大专项 总投入 ...

  6. 史上最大AI芯片诞生:462平方厘米、40万核心、1.2万亿晶体管,创下4项世界纪录...

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 美国一家芯片公司Cerebras推出了史上最大AI芯片,号称"晶圆级引擎"(Cerebras Wafer Scale ...

  7. 刷新三项世界纪录的跨镜追踪(ReID)技术是怎样实现的?进来了解一下

    跨镜追踪(Person Re-Identification,简称 ReID)技术是现在计算机视觉研究的热门方向,主要解决跨摄像头跨场景下行人的识别与检索.该技术能够根据行人的穿着.体态.发型等信息认知 ...

  8. 好多人,微软编程马拉松大赛欲创吉尼斯世界纪录

    微软举办基于Windows的编程马拉松大赛已经有几年了,今天微软宣布想通过今年在印度班加罗尔举办的有史以来最大的编程马拉松大赛进入吉尼斯世界纪录. Windows官方博客中谈到了这次的编程马拉松大赛: ...

  9. 曾刷新两项世界纪录,腾讯优图人脸检测算法 DSFD 正式开源...

    雷锋网(公众号:雷锋网) AI 科技评论按:近年来,卷积神经网络在人脸检测中取得了很大的成功,然而这些方法在处理人脸中多变的尺度,姿态,遮挡,表情,光照等问题时依然比较困难.为此,腾讯优图推出名为 D ...

最新文章

  1. 消除8个关于AI在商业中应用的错误观念
  2. TypeScript基础入门 - 接口 - 继承接口
  3. 《架构漫谈》读书笔记五
  4. 使用sklearn自带公式计算余弦相似度
  5. Java servlet项目里的web.xml
  6. 通往大神之路,百度Java面试题前200页。
  7. 并查集(UnionFindSet)
  8. React Native windows环境安装遇到的坑
  9. 统计csv词频_Python|国家统计局CPI数据动态图表可视化
  10. 计算机二进制怎么转化成十六进制数是,6、计算机进制之二进制、十进制、十六进制之间的转换...
  11. shell取得文件行数6法
  12. FreeMarker标签使用
  13. after、append和appendTo三个函数的区别
  14. linux中安装wine运行windows程序
  15. zabbix安装配置
  16. android studio按键精灵,51模拟器怎么连接按键精灵 51安卓模拟器按键精灵连接教程...
  17. 读李智慧的《大型网站技术架构—核心原理与案例分析》有感
  18. 写一个简单的登录页面!!!(html)
  19. mysql求月平均_mysql求平均值
  20. mysql硬盘最长活动时间100%_win10磁盘活动时间100%,小编告诉你解决方法

热门文章

  1. 缤特力PLANTRONICS耳机改装Cisco-AVAYA
  2. 外星人R7 1080Ti 装ubuntu两个巨坑
  3. CDR插件开发之CPG插件010 - 在CPG插件中实现创建工具栏按钮(下篇,基于X4)
  4. 2-1判断10的倍数
  5. python基础学习笔记-day1
  6. 引用账户锁定无法登录_WIN10引用账户被锁定,且暂时无法登录的解决方法
  7. round()函数在Java和MySQL中的使用
  8. 服务器重装系统后桌面只有鼠标,win10系统下更新后桌面黑屏只有鼠标如何解决...
  9. 数据科学家成长指南(中)
  10. 常用电子方面的网站4(通信电子)