强核问世：NVIDIA发布A100 80GB GPU，为AI超级计算带来全球最强GPU

近日，NVIDIA发布NVIDIA A100 80GB GPU，这一创新产品将支持NVIDIA HGX AI超级计算平台。该GPU内存比上一代提升一倍，能够为研究人员和工程师们提供空前的速度和性能，助力实现新一轮AI和科学技术突破。

全新A100采用HBM2e技术，可将A100 40GB GPU的高带宽内存增加一倍至80GB，提供每秒超过2TB的内存带宽。这使得数据可以快速传输到全球最快的数据中心GPU A100上，使研究人员能够更快地加速其应用，处理最大规模的模型和数据集。

NVIDIA应用深度学习研究副总裁Bryan Catanzaro表示：“若想获得HPC和AI的最新研究成果，则需要构建最大的模型，而这需要比以往更大的内存容量和更高的带宽。A100 80GB GPU所提供的内存是六个月前推出的前代产品的两倍，突破了每秒2TB的限制，使研究人员可以应对全球科学及大数据方面最严峻的挑战。”

用于NVIDIA DGX^TM A100 和 NVIDIA DGX Station^TM A100系统的NVIDIA A100 80GB GPU也于今日发布，预计将于本季度发货。

领先的系统提供商源讯、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想、云达科技、超微预计将于2021年上半年，提供基于HGX A100集成底板的系统，该集成底板搭载4-8个A100 80GB GPU。

满足大流量数据工作负载需求

A100 80GB版本基于A100 40GB的多样化功能，成为需要大量数据存储空间的各类应用的理想选择。

DLRM等推荐系统模型为AI训练提供了涵盖数十亿用户和产品信息的海量表单。A100 80GB可实现高达3倍加速，使企业可以重新快速训练这些模型，从而提供更加精确的推荐。

HGX服务器中搭载的A100 80GB还可训练具有更多参数的最大模型，如GPT-2。GPT-2是具有超常生成文本能力的自然语言处理模型。这就消除了对数据或模型并行架构的需求，因为实现并行架构需要花费大量时间，而且跨多个节点运行缓慢。

凭借其多实例GPU（MIG）技术，A100可分割为多达7个GPU实例，每个实例具有10GB内存。该技术是一种安全的硬件隔离方法，在处理各类较小的工作负载时，可实现GPU最佳利用率。对于如RNN-T等自动语言识别模型的AI推理，单个A100 80GB MIG实例可处理更大规模的批量数据，将生产中的推理吞吐量提高1.25倍。

在TB级零售大数据分析基准上，A100 80GB将其性能提高了2倍，使其成为可对最大规模数据集进行快速分析的理想平台。随着数据的动态更新，企业可以实时做出关键决策。

对于科学应用，A100 80GB可为天气预报和量子化学等领域提供巨大的加速。材料模拟软件Quantum Espresso采用单节点A100 80GB实现了近2倍的吞吐量提升。

RIKEN计算科学中心负责人Satoshi Matsuoka表示：“快速、充足的内存带宽和容量对实现高性能超级计算应用来说至关重要。具有80GB HBM2e GPU内存的NVIDIA A100提供2TB/s的全球最快带宽，可帮助我们大幅提高应用性能。”

A100 80GB的关键特性

A100 80GB具备NVIDIA Ampere架构突破性特性：

第三代Tensor Core核心：通过全新TF32，将上一代Volta架构的AI吞吐量提高多达20倍。通过FP64，将HPC性能提高多达2.5倍。通过 INT8，将AI推理性能提高多达20倍，并且支持BF16数据格式。
更大、更快的HBM2e GPU内存：使内存容量增加一倍，在业内率先实现2TB/s以上的内存带宽。
MIG技术：将单个独立实例的内存增加一倍，可最多提供七个MIG，每个实例具备10GB内存。
结构化稀疏：将推理稀疏模型的速度提高2倍。
第三代NVLink和NVSwitch，相较于上一代互连技术，可使GPU之间的带宽增加至原来的两倍，将数据密集型工作负载的GPU数据传输速度提高至每秒600 gigabytes。

NVIDIA HGX AI 超级计算平台

A100 80GB GPU是NVIDIA HGX AI超级计算平台的关键组件。该平台将NVIDIA GPU、NVIDIA NVLink®、NVIDIA InfiniBand网络以及全面优化的NVIDIA AI和HPC软件堆栈的全部功能整合在一起，以提供最优越的应用性能。该平台使研究人员和科学家能够将HPC、数据分析和深度学习计算技术结合起来，共同推动科学进步。

惊喜来袭

AI行业盛会GTC 中国站注册火热进行中。

大会期间，所有注册参会者可通过登陆，定制个人参会日程、设置参会提醒、查看积分并兑换，换取电商购物券、拉杆箱、NVIDIA Jetson Nano 等好礼。观看主题演讲还将有机会赢得 GeForce RTX 3070 显卡！所有福利仅限注册用户。

即刻扫描海报二维码，免费注册，赢取大奖！

点击“阅读原文”，了解更多GTC China的详细日程。

强核问世：NVIDIA发布A100 80GB GPU，为AI超级计算带来全球最强GPU相关推荐

【百强榜单】2018第六届上汽设计国际挑战赛全球百强作品正式公布！
近日,2018年第六届上汽设计国际挑战赛(SDC)百强评审会,在上汽设计中国总部设计中心.上汽欧洲前瞻设计中心两地同时展开. 作为中国最具影响力的国际汽车设计挑战赛,上汽设计国际挑战赛获得了海内外高校 ...
硬核黑科技、技术大咖、AI 音乐节……科大讯飞全球 1024 开发者节太燃了！
(文末有价值1024元的福利赠送) 1956 年 8 月,自达特茅斯会议首次提出"人工智能"以来,人工智能的命运起起伏伏,经历三大浪潮. 在黄金时期的50-70年代,人们发明最早的 ...
GPU在AI业务中的核心技术与应用
近日,业内某AI平台研发负责人江州司马在信服云<云集技术学社>系列直播课上进行了<GPU在AI业务中的核心技术与应用>的分享,详细介绍了GPU的发展.GPU的架构以及如何利用G ...
2021-2027全球与中国GPU服务器市场现状及未来发展趋势
本报告研究全球与中国市场GPU服务器的产能.产量.销量.销售额.价格及未来趋势.重点分析全球与中国市场的主要厂商产品特点.产品规格.价格.销量.销售收入及全球和中国市场主要生产商的市场份额.历史数据为 ...
电脑核显可以用html吗,GPU性能测试：看最强核显能干翻哪些独显
●评测平台及方法说明本次评测主要从CPU.GPU性能及功耗三方面进行,在CPU性能评测中除了加入4790K.6700K,同时增加三款CPU同频率对比作为辅助参考:而在GPU性能评测中,我们将加入AP ...
208核、6TB内存，阿里云发布全球最强云服务器：挑战摩尔定律极限
7月15日,阿里云宣布推出第三代神龙云服务器.与上一代相比,第三代神龙云服务器的综合性能提升高达160%,比目前全球最顶级云服务器还要快30%以上,整体算力全球最强. 配置上,第三代神龙云服务器产品家 ...
208核、6TB内存！阿里云发布全球最强云服务器：挑战摩尔定律极限
7月15日,阿里云宣布推出第三代神龙云服务器.与上一代相比,第三代神龙云服务器的综合性能提升高达160%,比目前全球最顶级云服务器还要快30%以上,整体算力全球最强. 配置上,第三代神龙云服务器产品家 ...
阿里第一颗芯片问世！平头哥发布含光800：全球最强
9月25日的杭州云栖大会上,达摩院院长张建锋现场展示了这款全球最强的AI芯片--含光800,这也是阿里巴巴第一颗自研芯片. 在业界标准的ResNet-50测试中,含光800推理性能达到78563IPS ...
Nvidia GPU 入门教程之 03 在 GPU 上运行 Python 脚本,对比cpu与gpu性能，检测a100性能（教程含源码）
GPU 的内核比 CPU 多,因此在数据的并行计算方面,GPU 的性能比 CPU 好得多,尽管 GPU 的时钟速度较低,并且与 CPU 相比缺乏几个内核管理功能. 因此,在 GPU 上运行 pytho ...

强核问世：NVIDIA发布A100 80GB GPU，为AI超级计算带来全球最强GPU

强核问世：NVIDIA发布A100 80GB GPU，为AI超级计算带来全球最强GPU相关推荐

最新文章

热门文章