晓查 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

MLPerf推理基准测试第二版(v0.7)近日发布。

在数据中心分类下,英伟达2年前的推理卡T4依然能“大杀特杀”,7月推出的A100毫无意外占据榜单第一名。

英伟达表示A100在数据中心推荐系统测试中,其表现出的性能比英特尔Cooper Lake CPU高237倍,即使是T4也比CPU高出28倍。

 图片来自英伟达官方

英伟达在官方博客中称,英伟达在第二版MLPerf推理榜中赢得了数据中心和边缘计算系统六个应用领域的所有测试。

可以看出,每项任务的前五名都被英伟达的AI加速硬件占据,包括DGX A100、Quadro RTX专业卡以及T4。

 图片来自Tirias Research

然而事情没有那么简单。

参赛厂商明增实减

MLPerf是业内首套衡量机器学习软硬件性能的通用基准,由图灵奖得主David Patterson联合谷歌和几所著名高校于2018年发起。

MLPerf组织去年第一次发布推理基准测试结果,当时的榜单非常混乱,从数据中心到手机的AI推理性能全都在一张表格中,没有做出场景区分。

这一次MLPerf v0.7将榜单分为4个部分:数据中心、边缘、手机、笔记本电脑。

除了之前的ResNet图像分类、SSD-Large目标检测任务,MLPerf v0.7推理还增加了4个基准测试:NLP模型BERT、推荐模型DLRM、医学影响模型3D U-Net以及代表语音识别模型RNN-T。

本次提交的测试数量也大大增加,从43个增加到327个,与之不成比例的是,提交成绩的公司数量仅仅从9个增加到21个。

看似竞争更加激烈,但实际上参与的硬件上游厂商反而更少了。上次提交成绩的阿里平头哥含光谷歌TPU都缺席了本次测试。

这导致英伟达在数据中心分类下的竞争对手只剩下3个:英特尔的CPU、赛灵思和初创公司NEUCHIPS两家的FPGA。

为何厂商不积极跑分

经过一年时间的完善,MLPerf推理基准测试显然更加合理了,作为一个宣传硬件的绝佳窗口,为何各大厂商反而不积极了呢?

机器学习和HPC高级分析师Karl Freund认为,有3个原因导致AI芯片公司参加MLPerf态度冷淡:

  1. 像英特尔Habana和Tenstorrent之类的许多公司都还没有做好运行MLPerf等复杂基准的准备;

  2. 厂商要花费大量精力来运行和优化这些基准测试并参与同行评审过程;

  3. 除了英特尔、英伟达等大公司,大部分公司没有足够精力用在运行MLPerf上,他们主要是把资源花在与客户的合作上。

不过,Karl依然认为英伟达在数据中心AI方面依旧是其他厂商难以比拟的。主要是因为英伟达有着惊人的软硬件优化,凭借其生态系统培养了很多开发人员。

而且英伟达在AI上投入巨大,最近还主导建设了全球第七快的AI超级计算机Selene,投入数千万美元也是其他AI公司难以承受的。

所以在AI跑分这件事上,“钞能力”还是必不可少的。

虽然MLPerf不能完全反应真实情况,但英伟达GPU在榜单中巨大的占比只能说明:在AI生态中,英伟达依然是霸主。

参考链接:

https://blogs.nvidia.com/blog/2020/10/21/inference-mlperf-benchmarks/

https://mlperf.org/inference-results-0-7

https://www.forbes.com/sites/moorinsights/2020/10/21/why-cant-nvidia-be-bested-in-mlperf/

本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见~

英伟达GPU“屠榜”,谷歌TPU“退赛”,MLPerf最新推理榜单出炉相关推荐

  1. 本周AI热点回顾:十四五规划“人工智能第一!”;深度学习漫画第一卷现已开源;英伟达GPU“屠榜”MLPerf

    点击左上方蓝字关注我们 01 人工智能第一!十四五规划建议正式发布 近日,中国共产党第十九届中央委员会第五次全体会议深入分析国际国内形势后,就制定国民经济和社会发展「十四五」规划和2035年远景目标提 ...

  2. 谷歌TPU2代有望取代英伟达GPU?测评结果显示…

    原作:Elmar Haußmann 安妮 Root 编译自 RiseML Blog 量子位 出品 | 公众号 QbitAI 去年5月,谷歌推出了第二代TPU芯片,这是一个自定义开发的深度学习加速芯片, ...

  3. AMD与Intel,挑战英伟达GPU

    AMD与Intel,挑战英伟达GPU 作为CPU界的霸主,英特尔对高性能GPU市场一直没有死心.从1998年和Real3D合作推出的i740独显,到2009年无故流产的Larrabee独显,再到去年公 ...

  4. 5 年提速 500 倍,英伟达 GPU 创纪录突破与技术有哪些?

    作者:诗颖 摘要:日前,英伟达 Developer Blog 上一篇博文详细陈述了英伟达 Volta Tensor Core GPU 在深度学习社群取得的巨大突破,以及种种突破背后的技术细节. 201 ...

  5. 玩深度学习选哪块英伟达 GPU?有性价比排名还不够!

    本文來源地址:https://www.leiphone.com/news/201705/uo3MgYrFxgdyTRGR.html 与"传统" AI 算法相比,深度学习(DL)的计 ...

  6. 薅资本主义羊毛新姿势,英伟达GPU免费用

    作者 | 阿司匹林 出品 | 人工智能头条(公众号ID:AI_Thinker) 在到处都是开源工具和学习资料的今天,深度学习的门槛已经大大降低.然而,学习的门槛降低并不意味着学习的成本降低了,比如说动 ...

  7. 本周AI热点回顾:百度推出全球首个mRNA疫苗不稳定性解决方案、性能提升20倍:英伟达GPU旗舰A100

    01 百度推出全球首个mRNA疫苗不稳定性解决方案LinearDesign 新冠疫情爆发后,RNA设计领域世界知名专家.斯坦福大学生物化学系Rhiju Das教授关注到疫苗研发存在的一个非常棘手的问题 ...

  8. 英伟达GPU中的Tnesor Cores数量多寡与显卡性能有什么关联?

    前言 最近在调研常用显卡的参数,看到Nvidia Tensor Cores常用于其中作为对比,呈现在性能好的显卡比如A100比RTX 3060更多更全面,开始思考Tensor Cores细致的作用是什 ...

  9. 英伟达 GPU显卡计算能力查询表

    近期小白因为项目需要开始在电脑上配置深度学习环境.经过一些列的苦难折磨之后,电脑环境终于配置好了,但是却被我的显卡劝退了. 我是用的是算力2.1的显卡,环境要求算力3以上的显卡,无奈最后只能使用实验室 ...

最新文章

  1. pytorch numpy 数据类型转换
  2. 这可能是最全面的 python 字符串拼接总结!多种方法选最优
  3. HAProxy杂记(1)
  4. html前台检验特殊字符正则,【Qt编程】html特殊字符及正则表达式
  5. dede定义全局变量(include/common.inc.php)及调用方式
  6. nacos 本地测试_本地调试和服务器调试都无法连通-问答-阿里云开发者社区-阿里云...
  7. 【灵修】舍得——有舍有得
  8. Java案例:自动点名程序
  9. 循环执行次数 n(n+1)/2
  10. arcgis运行慢_ArcGIS Pro运行较慢的诊断方法
  11. Android AIDL
  12. binlog 分析及回滚神器Analysisbinlog
  13. SQL查询效率:100万数据查询只需要1秒钟
  14. qt 富文本 html,Qt富文本编辑器QTextDocument
  15. LINUX 用户 及 组
  16. 读书笔记 摘自:《为什么精英都是时间控》
  17. C语言如何做出简易贪食蛇
  18. 加拿大留学计算机专业好移民吗,加拿大最适合留学转移民的热门专业——计算机科学及信息技术...
  19. 2000个软件开发领域的高频特殊词及精选例句
  20. 面试题之你是如何优化你的网站的?

热门文章

  1. 用S60操作系统SDK开发NOKIA手机应用程序(4)- 界面层框架及一些特性
  2. 四月青少年编程组队学习(图形化四级)Task03
  3. 【青少年编程】【二级】货运飞船
  4. 线性代数:第二章 矩阵及其运算
  5. 华为:HarmonyOS 即将开源!
  6. 谷歌提出纯 MLP 构成的视觉架构,无需卷积、注意力 !
  7. Uber提出损失变化分配方法LCA,揭秘神经网络“黑盒”
  8. ​50年来最具影响力的十大编程语言!
  9. TinyMind 汉字书法识别竞赛开启总决赛啦!!
  10. Mysql 宕机引发索引丢失很可怕,文件 IO 中如何保证掉电不丢失数据?