晓查 发自 凹非寺
量子位 | 公众号 QbitAI

今天,扎克伯格宣布,Meta要建造全球最快的AI超级计算机,而且就在2022年年中建成。

这台超算被命名为“AI研究超级集群”(RSC),包含16,000个英伟达A100 GPU,算力达5 EFLOPS(混合精度)。

而目前全球最快超算富岳在混合精度下的最高算力为2 EFLOPS。

Meta要这么强的超算干什么?当然是为了公司的元宇宙。

Meta工程师Kevin Lee在官方博客中说:

我们希望RSC将帮助我们构建全新的AI系统,例如可以为大量人提供实时语音翻译,每个人都可以说着不同的语言,这样他们就可以无缝协作研究项目或一起玩AR游戏。

最终,使用RSC完成的工作将为下一个主要计算平台元宇宙发挥重要作用。

要让不同语言的人在元宇宙无障碍交流,背后的自然语言处理训练需要巨大的算力。

虽然超算还未建成,但Meta已经开始了训练超大NLP和CV模型的研究,将用它来训练数万亿参数模型,其规模比现在的GPT-3还高一个数量级。

1.6万个A100核心

超算RSC的组建工作始于一年半以前。

英伟达和数据存储公司Pure Storage、服务器公司Penguin Computing是Meta超算的主要供应商。

RSC的第一阶段已经启动并运行,它由760个Nvidia DGX A100系统组成,总共包含6080个GPU。

等到完全建成时,RSC将总共拥有16,000个GPU,成为使用A100数量最多的超算

Meta(当时还叫Facebook)的第一代AI超算设计于2017年,这台超算集群中拥有22,000个NVIDIA V100 GPU,每天运行35,000个训练作业。

2020年,Meta的工程师开始利用新的GPU和网络结构技术,从头设计新一代超算的冷却、电力、网络和布线等各种系统。

相比第一代超算,RSC运行CV工作流程的速度提高了20倍,运行NVIDIA集体通信库(NCCL)的速度提高了9倍,训练大型NLP模型的速度提高了3倍

现在训练一个具有数百亿参数的模型只需三周,而之前是九周。

16TB/s带宽

除了核心系统本身,Meta还打造一个强大的存储系统,可以提供16TB/s的存储带宽和EB级别的存储容量。

为了满足AI训练日益增长的带宽和容量需求,Meta从头开始开发了一种存储服务,即人工智能研究存储(AIRStore)。

为了优化AI模型,AIRStore利用一个新的数据准备阶段,来预处理用于训练的数据集。经过准备的数据集可用于多次训练运行。

AIRStore还优化了数据传输,从而最大限度地减少了Meta数据中心间主干上的跨区域流量。

最后,在疫情和半导体芯片缺货的情况下,Meta能一次买下这么多GPU,恐怕英伟达才是最大赢家,老黄真的是赚麻了。

参考链接:
[1]https://ai.facebook.com/blog/ai-rsc
[2]https://venturebeat.com/2022/01/24/meta-is-developing-a-record-breaking-supercomputer-to-power-the-metaverse/

Meta为元宇宙建全球最快AI超算,1.6万个A100 GPU,英伟达都赚麻了相关推荐

  1. 中国超级计算机gpu,英伟达(NVIDIA)Tesla GPU为全球最快的超级计算机提供动力支持...

    2010年10月27日-美国加利福尼亚州圣克拉拉市-天河一号A(Tianhe-1A)是今日在2010年中国高性能计算学术年会上所发布的一款新型超级计算机.在LINPACK基准测试中,该计算机性能高达2 ...

  2. 元宇宙大比拼:英伟达Nvidia,Facebook,iwemeta

    还是那个熟悉的黄色厨房,还是那身立领的黑皮衣,在11月9日下午4点,黄仁勋带着他的元宇宙概念开启了英伟达GTC 2021大会. 在长达1小时30分钟的新品发布会中,黄仁勋重磅发布了英伟达最先进的Omn ...

  3. 英伟达两个最新元宇宙布局

    元宇宙就好像一片还没有被开发的"美洲",吸引了许多企业来淘金.当中最积极的莫过于Meta了.实际上除了Meta之外,英伟达也是不遗余力的布局元宇宙,希望成为元宇宙领域的基础设施供应 ...

  4. 英伟达新核弹GPU:4nm制程800亿晶体管,20张即可承载全球互联网流量,全新Hopper架构太炸了...

    丰色 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 他来了他来了,老黄带着英伟达的最新一代GPU来了. 之前大家猜的5nm错了,一手大惊喜,老黄直接上了台积电4nm工艺. 新卡取名H100,采 ...

  5. 老黄狂拼CPU!英伟达掏出800亿晶体管显卡,外加世界最快AI超算Eos

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达   视学算法报道   编辑:编辑部 [新智元导读]「拼装」CPU,4 ...

  6. 比目前世界上最快的超级计算机快 4 倍,英伟达这波玩大了!

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 来自新智元 3 月 22 日晚,备受瞩目的英伟达 GTC 开发者大会,终于开幕了! 虽 ...

  7. 20 个 GPU 可承载相当于全球互联网流量、Grace CPU 超级芯片现世,英伟达这届 GTC 发布了什么?...

    整理 | 苏宓 出品 | CSDN(ID:CSDNnews) 技术的极限在哪里? 想必科技圈给出回答大概率是没有! 这不,在 GTC 2022 Keynote 上,身着黑色夹克「战袍」的黄仁勋挂帅,英 ...

  8. 每秒5百亿亿次!Meta祭出元宇宙巨兽,联手英伟达打造全球最强超算

    来源:新智元 1月25日,Meta联合英伟达正式推出了一个全新的超算--「人工智能研究超级集群」( AI Research SuperCluster,缩写RSC). Meta的计划也很「朴素」,首先把 ...

  9. Meta首份元宇宙白皮书9大看点,瞄准80万亿美元市场

    近日,Meta委托国际经济咨询公司Analysis Group编写了一份元宇宙白皮书,该报告以移动设备的发展为依据,预测了元宇宙技术对全球经济的影响. 该报告主要分为四个部分:元宇宙的应用及挑战.移动 ...

最新文章

  1. java基础面向对象_Java基础面向对象
  2. php 数组存入mysql_PHP将数组存入数据库中的四种方式
  3. linux系统根分区挂载出错 系统无法,用虚拟机安装linux时显示“没有定义根文件系统,请到分区菜单以修正此错误”,是什么意思,肿么弄谢谢各位...
  4. Java培训教程之JDBC URL结构分析
  5. java-jar jvm_使用Java流和In-JVM-Memory的超低延迟查询
  6. Vim的基本操作总结
  7. python中网页关闭再打开_Python Selenium 之关闭窗口close与quit的方法
  8. 2021年00后生活方式洞察报告
  9. linux下vim 选择文本,删除,复制,粘贴
  10. C++之继承探究(十一):多重继承、菱形继承、虚继承、二义性问题及其解决方案
  11. Linux时间子系统之六:高精度定时器(HRTIMER)的原理和实现
  12. poj2485(Kruskal)
  13. 吞吐量、响应时间和 CPU 利用率之间的关系
  14. python英文参考文献格式_英文论文参考文献标准格式
  15. 卡耐基:一个人的成功,只有15%是靠专业技术
  16. php web访问数据库,百宝箱之介绍PHP Web查询数据库基本步骤
  17. 2021-05-12 MongoDB面试题 MongoDB适合应用在那些场景
  18. 微信小程序系列开发(一)
  19. 2022年Web时代猜想
  20. 哦买噶!李佳琦重现淘宝直播间!机器学习工程师的提效神器;『优化导论』神书;『IE521 凸优化』课程资料 | ShowMeAI资讯日报

热门文章

  1. 【登录异常解决】Ubuntu 输入正确的密码后重新返回到登陆界面
  2. 解决pycharm问题:module ‘pip‘ has no attribute ‘main‘
  3. vue的$nextTick使用总结,this.$refs为undefined的解决办法,element Ui的树形控件setCheckedKeys方法无法使用
  4. Pandas中map,applymap和apply方法之间的区别
  5. 测试向量是否包含给定元素
  6. 【转】一个Java程序员应该掌握的10项技能
  7. ZooKeeper学习第二期--ZooKeeper安装配置
  8. Activity传递对象的方法
  9. Data Structures with C++ Using STL Chapter 3算法概述---笔记
  10. 【转】三天学好ADO