近日,NVIDIA发布NVIDIA A100 80GB GPU,这一创新产品将支持NVIDIA HGX AI超级计算平台。该GPU内存比上一代提升一倍,能够为研究人员和工程师们提供空前的速度和性能,助力实现新一轮AI和科学技术突破。

全新A100采用HBM2e技术,可将A100 40GB GPU的高带宽内存增加一倍至80GB,提供每秒超过2TB的内存带宽。这使得数据可以快速传输到全球最快的数据中心GPU A100上,使研究人员能够更快地加速其应用,处理最大规模的模型和数据集。

NVIDIA应用深度学习研究副总裁Bryan Catanzaro表示:“若想获得HPC和AI的最新研究成果,则需要构建最大的模型,而这需要比以往更大的内存容量和更高的带宽。A100 80GB GPU所提供的内存是六个月前推出的前代产品的两倍,突破了每秒2TB的限制,使研究人员可以应对全球科学及大数据方面最严峻的挑战。”

用于NVIDIA DGXTM A100 和 NVIDIA DGX StationTM A100系统的NVIDIA A100 80GB GPU也于今日发布,预计将于本季度发货。

领先的系统提供商源讯、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想、云达科技、超微预计将于2021年上半年,提供基于HGX A100集成底板的系统,该集成底板搭载4-8个A100 80GB GPU。

满足大流量数据工作负载需求

A100 80GB版本基于A100 40GB的多样化功能,成为需要大量数据存储空间的各类应用的理想选择。

DLRM等推荐系统模型为AI训练提供了涵盖数十亿用户和产品信息的海量表单。A100 80GB可实现高达3倍加速,使企业可以重新快速训练这些模型,从而提供更加精确的推荐。

HGX服务器中搭载的A100 80GB还可训练具有更多参数的最大模型,如GPT-2。GPT-2是具有超常生成文本能力的自然语言处理模型。这就消除了对数据或模型并行架构的需求,因为实现并行架构需要花费大量时间,而且跨多个节点运行缓慢。

凭借其多实例GPU(MIG)技术,A100可分割为多达7个GPU实例,每个实例具有10GB内存。该技术是一种安全的硬件隔离方法,在处理各类较小的工作负载时,可实现GPU最佳利用率。对于如RNN-T等自动语言识别模型的AI推理,单个A100 80GB MIG实例可处理更大规模的批量数据,将生产中的推理吞吐量提高1.25倍。

在TB级零售大数据分析基准上,A100 80GB将其性能提高了2倍,使其成为可对最大规模数据集进行快速分析的理想平台。随着数据的动态更新,企业可以实时做出关键决策。

对于科学应用,A100 80GB可为天气预报和量子化学等领域提供巨大的加速。材料模拟软件Quantum Espresso采用单节点A100 80GB实现了近2倍的吞吐量提升。

RIKEN计算科学中心负责人Satoshi Matsuoka表示:“快速、充足的内存带宽和容量对实现高性能超级计算应用来说至关重要。具有80GB HBM2e GPU内存的NVIDIA A100提供2TB/s的全球最快带宽,可帮助我们大幅提高应用性能。”

A100 80GB的关键特性

A100 80GB具备NVIDIA Ampere架构突破性特性:

  • 第三代Tensor Core核心:通过全新TF32,将上一代Volta架构的AI吞吐量提高多达20倍。通过FP64,将HPC性能提高多达2.5倍。通过 INT8,将AI推理性能提高多达20倍,并且支持BF16数据格式。

  • 更大、更快的HBM2e GPU内存:使内存容量增加一倍,在业内率先实现2TB/s以上的内存带宽。

  • MIG技术:将单个独立实例的内存增加一倍,可最多提供七个MIG,每个实例具备10GB内存。

  • 结构化稀疏:将推理稀疏模型的速度提高2倍。

  • 第三代NVLink和NVSwitch,相较于上一代互连技术,可使GPU之间的带宽增加至原来的两倍,将数据密集型工作负载的GPU数据传输速度提高至每秒600 gigabytes。

NVIDIA HGX AI 超级计算平台 

A100 80GB GPU是NVIDIA HGX AI超级计算平台的关键组件。该平台将NVIDIA GPU、NVIDIA NVLink®、NVIDIA InfiniBand网络以及全面优化的NVIDIA AI和HPC软件堆栈的全部功能整合在一起,以提供最优越的应用性能。该平台使研究人员和科学家能够将HPC、数据分析和深度学习计算技术结合起来,共同推动科学进步。

惊喜来袭

AI行业盛会GTC 中国站注册火热进行中。

大会期间,所有注册参会者可通过登陆,定制个人参会日程、设置参会提醒、查看积分并兑换,换取电商购物券、拉杆箱、NVIDIA Jetson Nano 等好礼。观看主题演讲还将有机会赢得 GeForce RTX 3070 显卡!所有福利仅限注册用户。

即刻扫描海报二维码,免费注册,赢取大奖!

点击“阅读原文”,了解更多GTC China的详细日程。

强核问世:NVIDIA发布A100 80GB GPU,为AI超级计算带来全球最强GPU相关推荐

  1. 【百强榜单】2018第六届上汽设计国际挑战赛 全球百强作品正式公布!

    近日,2018年第六届上汽设计国际挑战赛(SDC)百强评审会,在上汽设计中国总部设计中心.上汽欧洲前瞻设计中心两地同时展开. 作为中国最具影响力的国际汽车设计挑战赛,上汽设计国际挑战赛获得了海内外高校 ...

  2. 硬核黑科技、技术大咖、AI 音乐节……科大讯飞全球 1024 开发者节太燃了!

    (文末有价值1024元的福利赠送) 1956 年 8 月,自达特茅斯会议首次提出"人工智能"以来,人工智能的命运起起伏伏,经历三大浪潮. 在黄金时期的50-70年代,人们发明最早的 ...

  3. GPU在AI业务中的核心技术与应用

    近日,业内某AI平台研发负责人江州司马在信服云<云集技术学社>系列直播课上进行了<GPU在AI业务中的核心技术与应用>的分享,详细介绍了GPU的发展.GPU的架构以及如何利用G ...

  4. 2021-2027全球与中国GPU服务器市场现状及未来发展趋势

    本报告研究全球与中国市场GPU服务器的产能.产量.销量.销售额.价格及未来趋势.重点分析全球与中国市场的主要厂商产品特点.产品规格.价格.销量.销售收入及全球和中国市场主要生产商的市场份额.历史数据为 ...

  5. 电脑核显可以用html吗,GPU性能测试:看最强核显能干翻哪些独显

    ●评测平台及方法说明 本次评测主要从CPU.GPU性能及功耗三方面进行,在CPU性能评测中除了加入4790K.6700K,同时增加三款CPU同频率对比作为辅助参考:而在GPU性能评测中,我们将加入AP ...

  6. 208核、6TB内存,阿里云发布全球最强云服务器:挑战摩尔定律极限

    7月15日,阿里云宣布推出第三代神龙云服务器.与上一代相比,第三代神龙云服务器的综合性能提升高达160%,比目前全球最顶级云服务器还要快30%以上,整体算力全球最强. 配置上,第三代神龙云服务器产品家 ...

  7. 208核、6TB内存!阿里云发布全球最强云服务器:挑战摩尔定律极限

    7月15日,阿里云宣布推出第三代神龙云服务器.与上一代相比,第三代神龙云服务器的综合性能提升高达160%,比目前全球最顶级云服务器还要快30%以上,整体算力全球最强. 配置上,第三代神龙云服务器产品家 ...

  8. 阿里第一颗芯片问世!平头哥发布含光800:全球最强

    9月25日的杭州云栖大会上,达摩院院长张建锋现场展示了这款全球最强的AI芯片--含光800,这也是阿里巴巴第一颗自研芯片. 在业界标准的ResNet-50测试中,含光800推理性能达到78563IPS ...

  9. Nvidia GPU 入门教程之 03 在 GPU 上运行 Python 脚本,对比cpu与gpu性能,检测a100性能(教程含源码)

    GPU 的内核比 CPU 多,因此在数据的并行计算方面,GPU 的性能比 CPU 好得多,尽管 GPU 的时钟速度较低,并且与 CPU 相比缺乏几个内核管理功能. 因此,在 GPU 上运行 pytho ...

最新文章

  1. Web.Config文件配置之连接默认错误页
  2. 单链表倒数第K个节点的查找和显示
  3. 架构漫谈(二):认识概念是理解架构的基础
  4. 嵌入式系统低功耗管理(备忘)
  5. 自动判断浏览器的中英文版本自动跳转网站中英文页面代码
  6. 2016总结 wjwdive
  7. LeetCode 437. 路径总和 III(双重递归)
  8. 素数回文数的个数(信息学奥赛一本通-T1408)
  9. HDU1253 胜利大逃亡
  10. 与人方便,随遇而安!
  11. macOS 升级12.0.1后,virtualBox 报错 Kernel driver not installed
  12. win10电脑找不到xps查看器的详细解决步骤
  13. Adobe Premiere(pr)2021 安装教程【64位】
  14. 沁园春·长沙 中法对照
  15. bzoj 1467 exBSGS
  16. At least one JAR was scanned for TLDs yet contained no TLDs.
  17. iphone苹果二手手机购买前必看
  18. python性能差_Python 性能分析大全
  19. laravel中公共子视图继承实现
  20. python tkinter treeview_Python tkinter treeview列大小

热门文章

  1. 简单干净的C#方法设计案例:SFCUI.AjaxLoadPage()之一
  2. 续:Fucking 这个网站!
  3. 247. Segment Tree Query II
  4. Yii中设置时间分区
  5. 数据库远程导入导出步骤
  6. [NVIDIA] Ubuntu 20.04 安装 nvidia-460 + cuda-11.2
  7. 拖拽之路(二):自定义QListWidget实现美观的拖拽样式(拖拽不影响选中)
  8. 211计算机建设,“211工程”重点学科信息资源建设综述
  9. python元编程 实际应用_Python元编程
  10. Keras之模型拼接