技术编辑:芒果果丨发自 思否编辑部  
SegmentFault 思否报道丨公众号:SegmentFault


是他,还是那个男人,那个熟悉的皮夹克。

5 月 14 日 晚,黄仁勋在厨房召开了英伟达 GTC 2020 线上发布会。由于新冠病毒疫情影响,英伟达原计划的现场活动被迫取消,定于 3 月 24 日通过媒体发布的新闻稿也未见踪影。千呼万唤中,黄仁勋终于在烤箱前和大家见面了。

本届 GTC 从预热开始就不走寻常路,黄仁勋在大会前一天晒出了自己从烤箱里拿出了全新的安培(Ampere)架构 GPU NVIDIA A100

这个「全球最大」果然没有骗人

令人颇感意外的是,虽然无法举办线下活动,英伟达竟然连线上直播都懒得办,直接播放了黄仁勋在自家厨房里录制的视频完成了新品发布。果然是手里有「硬货」就不在乎形式了。

英伟达的首款安培架构 GPU 可以算「史上最强」了,基于 7nm 工艺制程,拥有 540 亿晶体管,面积为826mm²,与 Volta 架构相比性能提升了 20 倍,既可以做训练也可以做推理。

NVIDIA A100 具有 TF32的第三代 Tensor Core 核心,能在不更改任何代码的情况下将 FP32 精度下的 AI 性能提高 20倍,达到19.5万亿次/秒

多实例 GPU-MG 可将单个 A100 GPU 分割为 7 个独立的 GPU,根据任务不同提供不同的计算力,实现最佳利用率和投资回报率的最大化。

NVIDIA A100 新的效率技术利用了AI数学固有的稀疏性,优化之后性能提升了一倍。

英伟达将 NVIDIA A100 的特性总结为以下 5 点:

  1. 超过 540 亿个晶体管,使其成为世界上最大的 7 纳米处理器;

  2. 带有 TF32 的第三代 Tensor Core 核心,这是一种新的数值格式,可加速开箱即用的单精度AI训练。NVIDIA 广泛使用的 Tensor Core 现在更加灵活,快速,且更易于使用;

  3. 结构稀疏性(Structural sparsity)加速,这是一种新的高效技术,可以利用AI数学固有的稀疏性来获得更高的性能;

  4. 多实例  GPU(Multi-instance GPU或MIG),允许将一个 A100 分割为多达七个独立的 GPU,每个 GPU 都有自己的资源;

  5. 第三代 NVLink 技术,使 GPU 之间的高速联接能力加倍,从而可以使多个 A100 服务器充当一个巨型 GPU。

黄仁勋说:“Ampere架构的突破性设计为英伟达第八代GPU提供了迄今为止最大的性能飞跃,集 AI 训练和推理于一身,并且其性能相比于前代产品提升了高达 20 倍。这是有史以来首次,可以在一个平台上实现对横向扩展以及纵向扩展的负载的加速。A100 将在提高吞吐量的同时,降低数据中心的成本。”

NVIDIA A100 是第一个基于 NVIDIA 安培架构的 GPU,提供了在 NVIDIA 八代 GPU 里最大的性能提升,它还可用于数据分析,科学计算和云图形,并已全面投产并交付给全球客户。

全球 18 家领先的服务提供商和系统构建商正在将 NVIDIA A100 整合到他们的服务和产品中,其中包括阿里云、AWS、百度云、思科、Dell Technologies、Google Cloud、HPE、Microsoft Azure和甲骨文。

单节点 AI 算力达 5 PFLOPS,140 台DGXA100 组成 DGXSuper POD

黄仁勋还介绍了基于 NVIDIA A100 的第三代 AI 系统 DGX-A100 AI。DGX-A100 AI 是世界上第一台单节点 AI 算力达到 5 PFLOPS 的服务器,每台 DGX A100 可以分割为多达 56 个独立运行的实例,还集合了 8 个 NVIDIA A100 GPU,每个 GPU 均支持 12 路 NVLink 互连总线。

据了解,与其他高端 CPU 服务器相比,DGXA100 的 AI 计算性能高 150 倍、内存带宽高 40 倍、IO 带宽高 40 倍。

黄仁勋说:“AI已经被应用到云计算、汽车、零售、医疗等众多领域,AI算法也正变得越来越复杂和多样。ResNet模型的算力需求从2016年到现在已经增加了3000倍,我们需要更好的解决方案。”

如此强大的 DGX-A100 AI 售价自然也不便宜,标价 19.9 万美元,约合人民币 141 万元。

此外,黄仁勋还提到了英伟达新一代 DGXSuper POD 集群,由 140 台DGXA100系统组成,AI算力达 700 Petaflops,相当于数千台服务器的性能

据了解,首批 DGXSuper POD 将部署在美国能源部阿贡国家实验室,用于新冠病毒疫情相关的研究。


五大软硬件齐上阵,自动驾驶平台合作已敲定

除了以上两款重磅产品,黄仁勋还宣布推出了 NVIDIA Merlin,这是一个用于构建下一代推荐系统的端到端框架,该系统正迅速成为更加个性化互联网的引擎。Merlin将创建一个 100 TB 数据集推荐系统所需的时间从四天减少到 20 分钟。

英伟达此次还推出了众多 AI 领域相关产品,包括 以太网智能网卡 Mellanox ConnectX-6 Lx SmartNIC、EGX 边缘 AI 平台和一系列软件更新扩展。

1.以太网智能网卡 Mellanox ConnectX-6 Lx SmartNIC

ConnectX-6 Lx 是业界首个为 25Gb/s 优化的安全智能网卡,可提供两个 25Gb/s 端口或一个 50Gb/s 端口。

2.EGX 边缘 AI 平台

EGX Edge AI 平台是首款基于 NVIDIA 安培架构的边缘 AI 产品,可接收高达 200Gbps 的数据,并将其直接发送到 GPU 内存进行 AI 或 5G 信号处理。

3.Spark 3.0

英伟达还宣布在 Spark 3.0 上支持 NVIDIA GPU 加速,基于 RAPIDS 的 Spark 3.0,打破了提取,转换和加载数据的性能基准。它已经帮助 Adobe Intelligent Services 将计算成本降低了90%。

4.NVIDIA Jarvis

黄仁勋在发布会中详细介绍了 NVIDIA Jarvis,这是一个新的端到端平台,可以充分发挥英伟达 AI 平台的强大功能,创建实时多模态对话式 AI。

5.Misty 交互 AI

现场演示中,一个名为 Misty 的 AI系统展示了实时理解并回答一系列有关天气的复杂问题的交互过程。

自动驾驶方面,英伟达也将安培架构嵌入了新的 NVIDIA DRIVE 平台。据了解,小马智行、法拉第未来等自动驾驶企业已宣布采用 NVIDIA DRIVE AGX 计算平台。

英伟达的 NVIDIA Isaac 软件定义的机器人平台还将用于宝马集团工厂。英伟达机器人技术全球生态系统涵盖配送、零售、自主移动机器人、农业、服务业、物流、制造和医疗保健各个行业。

英伟达 AI 生态全布局,中国 AI 芯片研发与与世界差距正在缩短

英伟达这场时隔 3 年的发布会可谓诚意满满,首次推出的安培架构给足了惊喜,性能提升 20 倍的 NVIDIA A100 GPU 可谓性能飞跃。

虽然发布会并不是现场直播,但依旧爆点十足。一台就比千台强的 DGX-A100 AI 也印证了黄仁勋那就经典名言“买的越多,赚的越多”。英伟达的 AI 解决方案已经覆盖了各行各业,强大的 AI  生态正在形成。

中国工程院院士倪光南曾表示:「芯片设计门槛极高,只有极少数企业能够承受中高端芯片研发成本,这也制约了芯片领域创新。」

英伟达在本届 GTC 上推出的安培架构和基于此的一系列 AI 平台无一部显示了一个 AI 芯片巨头的实力,又一次树立了性能标杆。

根据 Gartner 的预测数据 ,未来 5 年内全球人工智能芯片市场规模将呈飙升趋势 ,自 2018 年的 42.7 亿美元 ,升高至 343 亿美元 ,增长已超过 7 倍,可见 AI 芯片市场有较大增长空间。

尽管与西方发达国家相比,中国的 AI 芯片研发还存在一定差距,但过去两年中,中国 AI 芯片初创企业已获得了数亿美元的资金。华为等公司也开发了令人印象深刻的芯片设计。

但芯片开发极具复杂性,中国人才的短缺以及缺乏多家全球销售排名前 15 位的中国半导体公司的情况表明,中国仍需要取得重大进展,才能在半导体领域与美国匹敌。

- END -

英伟达TX2烧录系统_英伟达秀全球最大GPU,黄仁勋从烤箱里拿出的产品果然爆了...相关推荐

  1. 英伟达TX2烧录系统_英伟达的DPU,是想在数据中心奇袭英特尔?

    热点追踪 / 深度探讨 / 实地探访 / 商务合作 最近几年,经常关注科技圈的朋友们总会发现,每次遇到厂商有重大发布,就总能看到"颠覆"."极致"." ...

  2. 英伟达TX2烧录系统_99美元AI计算机:英伟达推出嵌入式电脑Jetson Nano

    3月19日,由英伟达举办的2019 GTC(GPU技术大会)在美国加州圣何塞举行,英伟达CEO黄仁勋发表主题演讲,正式发布了机器人开发者工具箱Jetson Nano,可以为机器人设计引入AI算力. 黄 ...

  3. 黄仁勋误入直播被当“路人”,英伟达粉丝都乐疯了

    作者|李禾子 邮箱|lihezi@pingwest.com 黄仁勋,大名鼎鼎的芯片巨头英伟达CEO,硅谷最炙手可热的男人,最近出现在了台北街头两个女主播的直播间里. 不是宣传产品,不是接受访问,而是纯 ...

  4. 真假黄仁勋疑云?英伟达推出全球首个元宇宙平台

    [编者按]近日,在计算机图形顶级会议ACM SIGGRAPH 2021上,英伟达介绍了公司研发的3D仿真模拟和协作平台Omniverse,并详细解释了数字假人黄仁勋的打造过程.难道英伟达今年4月的主题 ...

  5. 黄仁勋没有回应,英伟达没有新品

    晓査 乾明 假装发自 苏州 量子位 出品 | 公众号 QbitAI 黄仁勋上台,然后下台. 在今天上午的GTC China大会上,黄教主没能拿出让人惊艳的新品,也没有只字片语回应英伟达的目前的&quo ...

  6. 重磅丨英伟达刚刚发布全球最大GPU:GTC2018黄仁勋演讲核心内容整理

    文章来源:机器之心 在刚刚结束的 Keynote 演讲中,英伟达创始人兼首席执行官黄仁勋宣布了该公司在芯片.AI 平台.自动驾驶上的一系列新动作. 正如黄仁勋所说的,今天的发布会有关于:「Amazin ...

  7. 被骗两次?黄仁勋骗过世界的14秒,英伟达押宝未来的元宇宙……

    来源:物联网智库 在近期召开的计算机图形顶级会议ACM SIGGRAPH 2021 上,英伟达介绍了自研的3D仿真模拟和协作平台Omniverse,并放出了"合成版老黄"的打造过程 ...

  8. 英伟达黄仁勋发布全球最大GPU,超300斤,汽车后备箱大小

    大数据文摘作品 作者:魏子敏.云舟.龙牧雪 这一次的GTC大会可能让不少矿工略微失望,英伟达并没有如传言所说发布一款"挖矿"专用芯片,但这并不影响这场持续三小时的英伟达2018GT ...

  9. 教主黄仁勋亮相GTC China:英伟达已售出15亿块GPU!重磅发布TensorRT 7

      新智元报道   新智元编辑部 又到了一年一度的英伟达GTC China大会,NVIDIA 创始人兼首席执行官黄仁勋又是一身黑色皮衣亮相苏州,为大家分享了英伟达取得的成绩:NVIDIA已经售出15亿 ...

  10. 【突发利好】黄仁勋明天要发挖矿专用显卡?英伟达股价今年暴涨25%

    黄教主可能做梦都要笑醒. 周一,英伟达的股价涨了4.2%,这得益于分析师预测游戏.机器学习和自动驾驶汽车的对GPU强劲趋势.更重要的是,北京时间28号英伟达在GTC还有大量新产品会发布. " ...

最新文章

  1. 浅析Spring——控制反转IoC
  2. python的函数的对象属性_Python帮助函数调试函数 用于获取对象的属性及属性值...
  3. .net显示今天农历的代码
  4. 转_人人网开放平台技术架构
  5. 构建高性能分布式搜索引擎(Wcf-基础篇)一
  6. 关于putty中的psftp、ftp上传下载的基本操作
  7. php特效表白代码,js爱心表白动画特效代码
  8. 自动更新程序源码下载(C#.Net)
  9. 我所理解的Remoting(3):创建CAO Service Factory使接口和实现相互分离
  10. html正方体旋转效果,纯CSS3超酷3D旋转立方体动画特效
  11. [转] PHP开发通用型标题图片功能
  12. MFC中Wnd.PostMessage()的作用
  13. 用debugserver+lldb代替gdb进行iOS远程动态调试
  14. 比MySQL快839倍!揭开分析型数据库JCHDB的神秘面纱
  15. Ubuntu LTS 版本知多少
  16. Linux平台基于poll实现网络编程IO多路复用
  17. Java:Java vs Kotlin–Android应用程序开发的最佳语言?
  18. mysql数据库时区配置
  19. 零知识证明系列之二——Schnorr协议
  20. 2021 电子书搜索网站/工具,找电子书不再愁

热门文章

  1. 【月径流预测】基于matlab人工生态系统算法优化BP神经网络月径流预测【含Matlab源码 2000期】
  2. 【跳频扩频通信】基于matlab跳频扩频通信【含Matlab源码 1003期】
  3. 【预测模型】基于matlab GUI AR模型线性预测【含Matlab源码 942期】
  4. 【手势识别】基于matlab GUI肤色手势识别【含Matlab源码 716期】
  5. 【TSP】基于matlab粒子群算法求解旅行商问题【含Matlab源码 445期】
  6. gulp编译html中的less,使用插件less-plugin-functions让gulp-less支持自定义函数
  7. linux系统的电脑要不要买,是否有必要为Linux购买一台相对较高配置的电脑?
  8. 搬水果 - 九度教程第31题(哈夫曼树)
  9. 蓝桥杯_算法训练_审美课
  10. 查看jdk版本命令_JDK配置和Eclipse安装