卷友们好,我是rumor。

我直接好家伙。

午休摸鱼时打开Arxiv看每日更新,一下就被闪瞎了。

英伟达、斯坦福联合MSR,共同训出了10000亿参数的GPT,比1750亿的GPT3还高出了一个量级

重要的是,这个训练用了3072个A100,一个售价约10万人民币,我都不敢换算。

Anyway,人穷志不穷,训不起,论文我还看不起吗?

题目:Efficient Large-Scale Language Model Training on GPU Clusters
地址:https://arxiv.org/pdf/2104.04473.pdf
代码:https://github.com/nvidia/megatron-lm

这篇论文讲了啥

这篇文章其实很工程,主要延续威震天的一些策略,继续探索了更大模型的分布式训练。

数据并行的方法很多同学都知道,就是每个worker上都加载全量模型,计算完不同数据后汇总更新。但在训练大模型的过程中,因为参数量的增多,不可避免的得进行模型并行,也就是把不同的层或者tensor放在不同机器上,这就需要server、GPU之间进行更多通讯,而由于各种原因,各种成本(比如通信时间、同步时间)都会呈几倍增长,直接影响到训练速度。

所以,如何组合各个分布式训练方法,最大化训练吞吐、同时保持训练效果是训练大模型的难点之一。

经过努力,英伟达成功地让通信速度的增长接近线性,效率比DeepSpeed框架高出不少

遗憾的是,作者并没有展示这个语言模型的效果。

但从GPT3的成功来看,惊喜还是会有的,估计又要等到OpenAI来揭开了。

这样下去会被榨干吗

前段时间我一度觉得做更大更强的模型这条路是不可行的,一是以这种暴力方式训下去总有饱和的时候,二是即使浪费那么多资源训出来的模型在实际场景也用不上。

但我今天又有一些新的思考,虽然预见大transformer模型的表现可能会有饱和的一天,但目前并不知道这个天花板在哪里,说不定我们现在还在山脚或者山腰上,这些资金耗费巨大的预训练去探索上界还是有价值的。另外,GPT-3已经在一些场景上进行落地了,我甚至想能不能直接输入任务描述,让GPT-3给我输出一批训练数据,说不定也可以。

方向不同,各有千秋。不断突破现有模型的天花板是有价值的,做出性价比高的小模型也是有价值的。


往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑温州大学《机器学习课程》视频
本站qq群851320808,加入微信群请扫码:

【NLP】10000亿参数!英伟达用3072块A100训出史上最大最贵GPT!相关推荐

  1. 英伟达最大gpu_英伟达正式发布Ampere架构GPU,完成史上最大性能飞跃

    PingWest品玩5月14日讯,在GTC 2020线上发布会上,英伟达CEO黄仁勋正式推出了安培(Ampere)架构GPU.据其表示,这块芯片采用7nm工艺,540亿晶体管,20倍AI算力,实现5大 ...

  2. 中小学不得在校内设置食品经营场所,量子摩尔定律问世,美团运营摩拜亏45亿,英伟达史上最大手笔收购,这就是今天的大新闻。...

    今天是3月12日 农历二月初六 今天星期二 去吃饭老板问要饭的吗 一兄弟说我要饭的我要饭 怎么觉得这对话 有点怪怪 下面是今天的大新闻 中小学不得在校内设置食品经营场所 (中国新闻网)据教育部网站消息 ...

  3. 重磅译制 | 更新:牛津大学xDeepMind自然语言处理 第6讲(上)NLP硬件和软件-英伟达GPU

    大数据文摘重磅课程汉化<牛津大学xDeepMind自然语言处理>,每周更新中(o゚▽゚)o 本周更新至:Lecture 6 英伟达:NLP硬件和软件(1) 马上试看▼ class=&quo ...

  4. 英伟达RTX 3080值不值得抢?在TensorFlow上训练了卷积网络

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:机器之心 AI博士笔记系列推荐 周志华<机器学习> ...

  5. 破万亿!英伟达的市值

    文章目录 破万亿

  6. powerbuilder TriggerEvent 参数_NLP界“威震天”袭来!英伟达1小时83亿参数打造史上最大语言模型...

    [新智元导读]英伟达一举创造了2个壮举!训练出了世界上最大的语言模型--MegatronLM,包含83亿参数,比BERT大24倍,比GPT-2大5.6倍:还打破了实时对话AI的记录,仅耗时53分钟即可 ...

  7. 入门NLP、实现语音识别和语音合成,用这个开源工具SoEasy | 英伟达NLP公开课

    对话式AI正在改变人机交互方式,在生活和工作中给我们带来很大便利. 然而,对话式AI包含自动语音识别.自然语言处理.语音合成等技术领域,从0开发一个对话式AI需要投入的成本和流程非常之多. 那么,有什 ...

  8. 英伟达 | 深度学习GPU最新情况

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习>手推 ...

  9. 英伟达帝国的一道裂缝

    2012年,AI圈发生了两件大事,按时间顺序,第一件是谷歌组团已久的Google Brain发布"出道作"--一个能够识别猫的深度学习网络"谷歌猫",74.8% ...

最新文章

  1. Android中自定义Dialog外形,去除黑底和白色边框
  2. 微信小程序开发之scroll-view上拉加载数据实现
  3. 【数据结构与算法】之深入解析“自由之路”的求解思路与算法示例
  4. 【机器视觉】 gen_measure_rectangle2算子
  5. 通过Docker或虚拟机快速搭建私有云平台--使用Nextcloud和ONLYOFFICE创建您的WebOffice云办公系统
  6. Modelsim-Altera仿真设置
  7. bzoj 3172: [Tjoi2013]单词 AC自动机
  8. linux fortran 内存不足,[转载]linux 安装fortran 90 --zz
  9. android访问服务器405,android
  10. triggered传递参数
  11. 解决win10计算机管理中没有本地用户和组
  12. 教你如何鉴别iPhone翻新机!
  13. 上海宝付谈谈程序猿的保险黑幕
  14. unity3D数据的本地存储(xml的方式)
  15. Apipost 上手指南
  16. 如何在腾讯地图绘制自己的坐标
  17. 2020-11-7YTUOJ3545: 输出最长单词
  18. 微软专业资历认证有哪些?
  19. LeetCode 771. 宝石与石头(java)
  20. SpringBoot整合tkMapper

热门文章

  1. STL set容器的一点总结
  2. makefile 学习(一)
  3. http压缩方法(IIS 6.0 与IIS 7.0的详解)
  4. [android笔记]常用的Uri例子
  5. 202701算法_冒泡排序
  6. 聊聊架构设计做些什么来谈如何成为架构师
  7. DefaultSingletonBeanRegistry源码解析
  8. dokcer 运行和进入容器
  9. jQuery基础修炼圣典—DOM篇(二)jQuery遍历
  10. C/S端开发问题汇总