问耕 发自 凹非寺
量子位 出品 | 公众号 QbitAI

字节跳动开源了通用分布式训练框架BytePS,这个框架支持TensorFlow、Keras、PyTorch、MXNet,可以运行在TCP或RDMA网络中。

官方介绍称,BytePS大大优于现有的开源分布式训练框架。例如,在相同的条件下,BytePS的训练速度是Horovod+NCCL的两倍。

BytePS也登上了GitHub趋势热榜。

性能表现

为了展示BytePS的性能,官方测试了两个模型:VGG16(通信密集型)和Resnet50(计算密集型),两个模型都以fp32精度进行训练。

训练使用了公有云上的虚拟机,每个机器有8个GPU,启用了NVLink。这些GPU都是Tesla V100 16GB型号GPU,batch size设置为64/每GPU。硬件之间以20Gbps的TCP/IP网络连接。

测试表明,与Horovod (NCCL)相比,BytePS在VGG16训练上的速度快100%,Resnet训练速度快44%。

Horovod是Uber开源的深度学习工具,NCCL是英伟达发布的多卡通信框架。

原因解析

BytePS为什么比Horovod更强?

官方解释称,一个主要的原因是BytePS是专门为云和共享集群而设计,并且抛弃了MPI。MPI是一个跨语言的通讯协议,用于编写并行计算机。

MPI是为高性能计算机而生,对于使用同类硬件构建的集群以及运行单一任务更有效。但并不是云(或者内部共享集群)的最佳选择。

因此字节跳动团队重新思考了最佳的通信策略。简而言之,BytePS仅在机器内部使用NCCL,重新构建了机器内部的通信。

BytePS还集成了许多加速技术,例如分层策略、流水线、张量分区、NUMA感知本地通信、基于优先级的调度等等。

传送门

BytePS现已在GitHub上开源,地址如下:

https://github.com/bytedance/byteps

在GitHub上,还详细介绍了如何使用BytePS等相关信息。

目前BytePS还不支持纯CPU训练。

AI社群 | 与优秀的人交流

小程序 | 全类别AI学习教程

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「在看」吧 !

字节跳动开源分布式训练框架BytePS,登上GitHub热榜相关推荐

  1. 腾讯最新开源IoT操作系统登上GitHub热榜,最小体积仅1.8 KB,标星1200+

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 鹅厂又开源,这次是一个操作系统,面向物联网场景,名为TencentOS-tiny. 项目如其名,核心亮点就是tiny--最小体积仅1.8 ...

  2. 谷歌EfficientNet缩放模型,PyTorch实现出炉,登上GitHub热榜丨Demo可用

    郭一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 谷歌上个月底提出的EfficientNet开源缩放模型,在ImageNet的准确率达到了84.1%,超过Gpipe,已经是当前的stat ...

  3. 滴滴开源AI项目登上GitHub热榜,人机对话模型可从论文到产品部署无缝衔接

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 没想到,滴滴开源的自然语言理解(人机对话)模型训练平台,就这样登上了GitHub热榜. 这一项目名为DELTA,是一个深度学习模型训练框架 ...

  4. 李沐《动手学深度学习》PyTorch 实现版开源,瞬间登上 GitHub 热榜!

    点击上方"AI有道",选择"星标"公众号 重磅干货,第一时间送达 李沐,亚马逊 AI 主任科学家,名声在外!半年前,由李沐.Aston Zhang 等人合力打造 ...

  5. 用PyTorch实现的李沐《动手学深度学习》,登上GitHub热榜,获得700+星

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 李沐老师的<动手学深度学习>是一本入门深度学习的优秀教材,也是各大在线书店的计算机类畅销书. 作为MXNet的作者之一,李沐老 ...

  6. PyTorch实现的李沐《动手学深度学习》,登上GitHub热榜,获得1000+星

    点击我爱计算机视觉标星,更快获取CVML新技术 晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI 李沐老师的<动手学深度学习>是一本入门深度学习的优秀教材,也是各大在线书店的计 ...

  7. 刷个B站的功夫就能把Python学了,微软放出短视频入门课,资料登上GitHub热榜第一...

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 微软,正在用力拥抱Python. 继Windows官方商店中加入了Python 3.7,支持一键安装Python之后. 这一不断为开源世界 ...

  8. 腾讯最新开源项目登上GitHub热榜:QQ音乐等18项业务都在用,日均PV过亿

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 腾讯又又又开源.这次是一个跨端框架,名为Hippy. 在GitHub上开源不到一周,便斩获近1200+星,一举登上趋势榜. 腾讯介绍称,H ...

  9. 最佳开发工具大全!前谷歌工程师两年打造“厂外生存指南”,登上GitHub热榜

    晓查 栗子 方驭洋 发自 凹非寺  量子位 报道 | 公众号 QbitAI 一位曾经的谷歌工程师,花费两年时间,辛苦整理了一份清单. 这个名为"xg2xg"的清单,原本是这位前谷歌 ...

最新文章

  1. 如何让Node.js运行在浏览器端
  2. 如何多快好省的建设企业级呼叫中心(一)
  3. C/C++ 读取16进制文件
  4. BZOJ 3434 时空穿梭
  5. 你不知道的RabbitMQ集群架构全解
  6. 利用Referer请求头防止“盗链”
  7. PHP—使用MYSQL来登陆用户
  8. instr和substr函数
  9. 通过 Powershell 来替换 ARM 模式下虚拟机的网络接口
  10. linux 文件读写 加速,MMAP文件加速读写小技俩
  11. Docker最新超详细版教程通俗易懂(基础版)
  12. 在IDEA上配置SonarLint以及代码质量分析报告模板
  13. 挠场的科学丨四、穿梭阴阳的挠场——道家风水、八卦、布阵的解密
  14. 【newCoder】2016校招真题在线编程 风口的猪-中国牛市
  15. Mybatis实现订单案例的五表联合操作
  16. java实现微信企业付款到个人零钱(微信红包)
  17. 汇编中esp和ebp在函数栈空间的保存和变化 call的参数和局部变量的关系详解
  18. 公安销售许可证的申请流程-从检测到拿证
  19. 彻底征服 React.js + Flux + Redux【讲师辅导】-曾亮-专题视频课程
  20. SpringCloud H版 Config 配制中心讲解

热门文章

  1. lvs集群基础及lvs-nat、dr、fwm实践
  2. iOS Swift UISearchController的取消按钮
  3. dubbo学习笔记 第三章简介dubbo的工作原理
  4. 初学 Python(十三)——匿名函数
  5. 怎样导出或导入Cookie
  6. mysql 函数,关键字,特性
  7. iptables对请求的URL作IP访问控制
  8. ***PHP中empty()和isset()的区别
  9. delphi 入门教程
  10. 由“ASP.NET网站限制访问频率”想到的两点问题(转)