雷刚 发自 凹非寺 
量子位 报道 | 公众号 QbitAI

AI超算怎么搞?老黄祭出联谊招。

在国际超算大会上,英伟达宣布正式支持Arm CPU,为高性能计算行业开辟了一条全新途径,以构建具有极高能效水平的百万兆级AI超级计算机。

具体方面,英伟达将在年内为Arm态系统提供全堆栈的AI和HPC软件。

该堆栈为600多个HPC应用程序和所有AI框架提供加速。

其中包括了所有英伟达CUDA-X AI和HPC库、GPU加速的AI框架和软件开发工具,如支持OpenACC的PGI编译器和性能分析器。

堆栈优化完成后,英伟达将为所有主要CPU架构提供加速,包括x86、POWER和ARM。

英伟达创始人黄仁勋说,英伟达CUDA加速和ARM的高效能CPU架构结合,一定可以推动超算的大幅提升,目标是百万兆级。

据称英伟达和ARM CPU联手的超算,将率先在预测气候变化和核武器系统建模等领域展开试水。

英伟达官方还专门提到了节能,Arm CPU的开放性之外,节能也是这次联手的题中之义。

在最新发布的Green500排行榜,全球最节能的25款超级计算机中,有22款都得益于英伟达的支持。

需要说明的是,这也不是英伟达和Arm首次联手。

之前英伟达用于便携式游戏、自动驾驶汽车、机器人和嵌入式AI计算的系统级芯片产品,其实都采用了ARM。

One more thing

最后,也还是在法兰克福超算大会。

英伟达还发布了一款专为自动驾驶汽车打造的超算:DGX SuperPOD。

全球最新排名第22.

整个系统搭建只需要3星期,采用96台NVIDIA DGX-2H超级计算机与Mellanox互联技术。其处理能力高达9.4 petaflops,能够用于训练安全自动驾驶汽车所需要的海量深度神经网络。

DGX SuperPOD内含1,536颗NVIDIA V100 Tensor Core GPU。

英伟达方面称,该套系统能够不间断运行,优化自动驾驶软件,并以前所未有的周转时间(turnaround time)反复训练神经网络。

例如,DGX SuperPOD软硬件平台能够在不到2分钟的时间之内完成ResNet-50训练。

此外,具备同等性能的其他TOP500超级计算机系统都由数千台服务器构建而成,而DGX SuperPOD占地面积更少,其体积比这些同等系统小400倍左右。

AI社群 | 与优秀的人交流

精选直播 | 大牛的观点碰撞

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧!

英伟达联手Arm CPU打造AI超算,百万兆级性能,主攻气候变化和核武建模相关推荐

  1. 英伟达与 ARM 初携手,英国共建 AI 研究中心

    By 超神经 内容提要:上周一,英伟达正式官宣豪掷 400 亿美金收购 ARM 的消息,犹如一颗重磅炸弹引爆科技圈.而与此同时,英伟达 CEO 黄仁勋还宣布了一个消息,透露其与 ARM 已经迫不及待地 ...

  2. 英伟达吞并Arm失败!英美欧盟一齐干涉,老黄还要给孙正义12.5亿美元分手费

    鱼羊 萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 英伟达660亿美元收购Arm一事,被曝已彻底玩完! 英国<金融时报>援引知情人士消息称,软银将Arm出售给英伟达的计划在本周一流 ...

  3. 英伟达收购ARM失败,理由是...

    关注+星标公众号,不错过精彩内容 来源 | 量子位 视频号 | strongerHuang 上个月整理<Keil的发展历史>还特意了解了下ARM的发展历史,看到"合并" ...

  4. 英伟达对ARM、Linux开放光线追踪,SDK已就位,网友:switch也能跑光追的节奏?...

    鱼羊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 今后,在ARM架构CPU的电脑上,你也可以享受英伟达光追的快乐了. 在GDC 2021上,英伟达首次展示了DLSS和光追等技术在ARM硬件上 ...

  5. 英伟达收购Arm计划落空,跨国半导体并购难再现?|硅基世界

     关注ITValue,看企业级最新鲜.最价值报道! 来源:Nvidia官网 不出意外地,在美国.英国和欧盟监管机构以及众多行业人士的反对声浪下,芯片半导体领域最大收购案最终告吹. 2月8日下午,英伟达 ...

  6. 用“AI核弹”饱和攻击的英伟达,如何赢下AI计算新赛场?

    在2012年的ImageNet挑战赛(ILSVRC)上,深度卷积神经网络AlexNet横空出世,在图像分类识别领域实现了质的飞跃,被认为是AI时代的标志性事件,代表着深度学习时代的正式开端. 在此之前 ...

  7. 彭博社:中企游说政府否决英伟达收购Arm

    9月14日,英伟达与软银宣布达成最终协议,英伟达将以400亿美元的价格从软银收购ARM. 在台积电明确于9月15日后不再向HW的ARM提供代工服务之后,一家美国公司又将ARM收入囊中,这使国产ARM ...

  8. 百度英伟达联手推混合精度训练,同样性能只需一半内存 | 附论文

    夏乙 编译整理 量子位 出品 | 公众号 QbitAI 这几年来,各科技大厂搞出了越来越大的神经网络,达到了越来越高的准确率,但同时,这些模型对内存和计算力的要求也越来越高. 于是,有一部分研究者想要 ...

  9. 黄仁勋:英伟达收购 ARM 是谣言,下周发布会有惊喜

    By 超神经 内容提要:近期,英伟达发布了第二季度财报,业绩喜人,再创新高.公司 CEO 黄仁勋随后还接受了 Venturebeat 旗下游戏频道 Gamesbeat 的记者采访,就英伟达目前现状.游 ...

最新文章

  1. CV00-04-卷积
  2. android中常见的内存泄漏和解决的方法
  3. 30 天精通 RxJS (05): 建立 Observable(一)
  4. 前端学习(2715):重读vue电商网站35之在sessionStorage保存左侧菜单栏的激活状态
  5. valgrind检测libevent内存泄露
  6. PyCharm的structure自动定位到相应的函数位置
  7. pdf常用字体包 -baijiahao_如何给PDF文档添加和插入页码?
  8. 利用gsoap工具,通过wsdl文件生成webservice的C++工程文件
  9. java web 学习计划
  10. modbus调试工具开发(1)--windows下编译libmodbus库文件
  11. [转]软件安装管家软件安装目录
  12. 上班太无聊,我要考证 之 程序员考证
  13. 后盾网php多少钱_后盾网向军老师PHP视频教程
  14. 简单动态字符串(SDS)
  15. 上海公交投诉电话:12319
  16. 织梦后台模块管理空白不显示的解决方法
  17. HIDS-ebpf-0
  18. 云计算厂商怎么打造自己的生态网络
  19. java实现端口映射_Java BIO实现TCP端口转发(端口映射)功能源码
  20. 网站搜索引擎优化问题

热门文章

  1. servlet session listener
  2. 基于python的scrapy爬虫抓取京东商品信息
  3. linux下软件安装与yum源码库的设置
  4. hadoop : hdfs的心跳时间设置及心跳检测算法
  5. 关于MyEcplise中常见的问题和解决方案
  6. Django学习--9 Admin
  7. python网络编程——简单例子
  8. PPTPD×××服务器架设
  9. 用Spotlight on windows 实时监控Windows服务器性能
  10. python取整数_python 取整函数