本文已在飞桨公众号发布,查看请戳链接:
共创软硬件协同生态:Graphcore IPU与百度飞桨的“联合提交”亮相MLPerf

AI领域最负盛名的产业级基准测试榜单MLPerf Training 2.0于6月30日正式发布。本次榜单中,百度飞桨与Graphcore合作,在MLPerf中开启了一种创新的“联合提交”模式。

“联合提交”亮相MLPerf

本次MLPerf Training v2.0中,百度飞桨与Graphcore合作了一种创新的结果提交模式:Graphcore与百度使用同样的软硬件配置(Graphcore IPU和飞桨深度学习框架)提交了MLPerf BERT模型的成绩。图1展示了此次Graphcore与百度使用IPU提交的BERT基准测试结果,飞桨的性能与Graphcore高度优化的自研框架PopART性能相当。

图1:MLPerf Training v2.0, Graphcore与百度提交的BERT模型在Graphcore IPU上的训练性能结果。其中,红色代表Graphcore使用原生框架PopART取得的成绩,蓝色代表Graphcore与百度使用飞桨框架取得的成绩。

“联合提交”:飞桨硬件生态共创计划的新尝试

百度飞桨在WAVE SUMMIT 2022深度学习开发者峰会上,携手十余家硬件厂商发布了硬件生态共创计划。飞桨将结合伙伴自有软硬件基础开发栈特色,针对不同应用场景和产品,面向广大开发者共同推出厂商定制版飞桨框架、建设开源模型库、开发课程与培训内容等,更好地服务开发者,实现生态繁荣共赢。

百度飞桨与Graphcore合作的MLPerf联合提交,是飞桨硬件生态共创计划的一次创新尝试。两个公司采用完全一样的软硬件配置进行成绩提交,这种联合提交方式在MLPerf比赛中首次出现。为此,我们在准备阶段跟组织者MLCommons做了细致的沟通,以确定这一提交方式的可行性。这次合作的成果令人欣慰,不仅双方技术合作的成果通过MLPerf介绍给全球开发者,这种软硬合作提交的模式也在MLPerf媒体沟通会上获得其他厂商代表的称赞。

“联合提交”背后的技术合作

针对本次MLPerf联合提交,百度飞桨与Graphcore进行了深度协同优化,主要体现在如下方面:

优化并行度

针对模型切分策略进行优化,从而提高模型并行度,并且通过优化并行读取数据集的策略,将模型在IPU上的吞吐发挥到极致。

提高片上内存使用率

通过降低部分操作的精度压缩片上内存占用,节省片上存储空间,从而支持将优化器状态从片下存储迁移到片上存储,减少片上片下的IO交互,并且也能提高部分算子的片上内存使用比例,提升算子计算效率。

融合collective算子

将数据并行中产生的多个collective算子融合成单个算子,能减少同步开销的同时,也能增加对带宽的使用率,发挥IPU高效的计算性能。

减少不必要的计算资源占用

原本在evaluation的过程中需要进行无效的反向计算,当前通过仅计算前向图的特性,节省evalution过程中无效的计算资源占用,提升整体evalution性能。

硬件优化

Bow-2000相较于M2000具有更高的主频(1.4x), 大幅提升了计算效率。

飞桨与Graphcore的合作历程

飞桨一直积极与硬件厂商合作以优化用户体验与性能。2020年,飞桨携手13家硬件厂商发起“硬件生态圈”,Graphcore即是初始成员之一。2021年,百度飞桨实现了在Graphcore IPU上训练与推理的全面支持,并开源了相关代码。双方团队在IPU-POD16&64上进行数据并行与模型并行,以及在Bert-Base模型上进行精读和吞吐量验证取得了良好的性能效果。Graphcore的Poplar SDK 2.3与百度飞桨框架最新的2.3版本已经完全集成,相关代码已在百度飞桨的GitHub上线供开发者获取。

2022年5月,Graphcore在WAVE SUMMIT 2022深度学习开发者峰会上正式宣布加入由百度飞桨发起的硬件生态共创计划。Graphcore和百度飞桨将基于该共创计划共同研发技术方案,协同定制飞桨框架,建设模型库与场景范例,以“IPU+飞桨”为产业赋能,推动产业AI化转型和升级。

结语

随着人工智能技术在各行业的广泛应用及快速发展,业界已从各自独立的硬件算力驱动和算法创新驱动进入到算法和硬件协同创新阶段。本次MLPerf的联合提交,是百度飞桨与硬件生态共创伙伴Graphcore合作的创新尝试。未来,飞桨将通过硬件生态共创计划,与更多硬件厂商一起,加速人工智能的应用落地,推动AI工业大生产的实现进程。

MLPerf介绍

MLPerf是由AI领域世界知名的学术研究者和产业专家发起的人工智能领域基准测试标杆。MLPerf旨在提供一个公平、实用的基准测试平台,展示业界领先的AI软硬件系统的最佳性能,其测试结果已获得AI领域的普遍认可。世界上几乎所有主流的硬件生产商和软件服务提供商都会参考MLPerf发布的结果构建自己的基准测试系统,以测试其开发的新的AI加速芯片和深度学习框架在MLPerf模型上的性能表现。

更多阅读

  • MLPerf Training v2.0榜单发布,在同等GPU配置下百度飞桨性能世界第一

直播预告

7月6日(星期三)20:00飞桨总架构师于佃海和飞桨资深研发工程师曾锦乐将通过直播,为大家揭秘同等GPU配置下,百度飞桨性能「世界第一」背后的关键技术。

扫描下方二维码,后台回复【学习】进行报名,直播间还有更多好礼等你来拿!

关注【飞桨PaddlePaddle】公众号
获取更多技术内容~

共创软硬件协同生态:Graphcore IPU与百度飞桨的“联合提交”亮相MLPerf相关推荐

  1. 英特尔携手百度飞桨,共创软硬一体人工智能生态

    今日,英特尔出席在线上举办的Wave Summit 2022深度学习开发者峰会,与众多人工智能专家.开发者与架构师,及知名学者等行业从业者一道分享英特尔与百度在人工智能各领域应用的创新突破,并深度展现 ...

  2. 共创RPA发展生态,2019中国RPA应用与发展论坛在北京成功举办

    8月10日,由RPA中国主办的以"AI+RPA助力企业开启数字化之旅"为主题的2019中国RPA应用与发展论坛在北京圆满召开.本着以共创RPA发展生态,AI+RPA赋能企业数字化转 ...

  3. 百度飞桨 如何撑起了AI产业生态?

    4月1日消息,从刷脸打卡上班.收听数字人播报新闻.接听AI语音电话,到春游时用AI识别花花草草种类,甚至工厂都开始用AI识别受损零件了--AI应用在我们身边越来越普遍,也越来越好用. 如果将时间拨回到 ...

  4. 百度飞桨全新升级:重磅推出PaddleHelix平台、开源框架V2.0RC,硬件生态路线图全公开...

    12月20日,WAVE SUMMIT+2020深度学习开发者峰会在北京举办.本届峰会,百度飞桨带来八大全新发布与升级,有支持前沿技术探索和应用的生物计算平台PaddleHelix螺旋桨,开发更加便捷的 ...

  5. 百度飞桨中国行南京站开启!共研AI赋能产业新模式

    面对未来发展,以人工智能为代表的新一代技术逐渐成为产业转型的核心驱动力之一,人工智能的发展离不开创新和人才.在这一大背景下,百度推出"飞桨中国行"活动,计划走入全国多个 AI 重点 ...

  6. 登临科技加入飞桨硬件生态共创计划,共推AI应用规模化落地

    近日,上海登临科技有限公司与飞桨签署硬件生态共创计划合作协议,正式加入由飞桨发起的硬件生态共创计划.当前双方的合作主要基于登临科技自主创新的通用GPU系列产品--GoldwasserTM(高凛TM). ...

  7. WAIC 2022|飞桨与硬件生态伙伴共论软硬协同发展新路径

    9月2日,由深度学习技术及应用国家工程研究中心主办,百度和张江集团承办的2022世界人工智能大会"软硬协同赋能产业未来专题论坛"成功举行.百度飞桨携手硬件生态伙伴和行业资深专家学者 ...

  8. 飞桨 x Graphcore IPU适配方案深度解读与硬件介绍 | 洞见AI硬件

    Graphcore和飞桨联合发布了在Graphcore IPU上支持训练和推理完整流程的开源代码库.在本篇文章中,我们将会介绍飞桨与Graphcore的合作初衷和成果,并为大家解读飞桨与Graphco ...

  9. 象帝先加入硬件生态共创计划,共同打造智算生态

    近日,象帝先计算技术(重庆)有限公司与百度飞桨签署硬件生态共创计划合作协议,正式加入由飞桨发起的硬件生态共创计划.当前双方的合作主要基于Pangu架构系列国产高性能通用GPU产品. 象帝先计算技术(重 ...

最新文章

  1. java 任意多个整数相加_一个整数分为若干个连续整数之和(使用java实现)
  2. 深度访谈Amazon员工与HR:华裔因pip跳楼背后(图)
  3. 实战:基于OpenCV进行长时间曝光
  4. Eclipse配置Maven环境并创建Maven项目,搭建spring环境
  5. SpringMVC学习总结(三)——Controller接口详解(1)
  6. WPF 元素相对另外一个元素的 相对位置
  7. 机器学习课程笔记【十四】- 增强学习和自适应控制控制论
  8. ireport +jasperreport 中文不能显示
  9. Atitit 架构艺术 与架构常见包含的技术 1. 架构的目的是什么??解决的问题 所有的问题都能通过架构解决 2 1.1. 提高可读性 提升可维护性架构 降低技术难度 2 1.2. 提升管理性
  10. 数据库在线自生成ER图
  11. jQuery视频格式的验证
  12. Send函数和Recv函数解析
  13. 蜂巢APP启动优化实践
  14. 软件测试自学毛笔字纹身,254439
  15. 计算机的e盘 f盘找不到,求助:急!我的电脑中D盘和E盘不见了
  16. Python seaborn 条形图
  17. java发送电子邮件
  18. 计算机硬件综合实验六:CPU组成与机器指令执行实验
  19. 孤独是灵魂的而缺口,享受孤独是一种灵修
  20. 王者荣耀交流协会第6次Scrum立会

热门文章

  1. linux系统管理及配置
  2. 排序算法7——归并排序
  3. Login 和 Logout
  4. python可视化46|最常用6个偏差(Deviation)关系图
  5. python凤凰新闻数据分析(四)整合
  6. 操作系统考研复习——第四章(文件管理)
  7. PHP 实现递归处理数据
  8. 最全的Java版本历史
  9. openresty中应用murmurHash
  10. redhat6.3 jfreechar中文乱码解决途径