强核问世:NVIDIA发布A100 80GB GPU,为AI超级计算带来全球最强GPU
近日,NVIDIA发布NVIDIA A100 80GB GPU,这一创新产品将支持NVIDIA HGX AI超级计算平台。该GPU内存比上一代提升一倍,能够为研究人员和工程师们提供空前的速度和性能,助力实现新一轮AI和科学技术突破。
全新A100采用HBM2e技术,可将A100 40GB GPU的高带宽内存增加一倍至80GB,提供每秒超过2TB的内存带宽。这使得数据可以快速传输到全球最快的数据中心GPU A100上,使研究人员能够更快地加速其应用,处理最大规模的模型和数据集。
NVIDIA应用深度学习研究副总裁Bryan Catanzaro表示:“若想获得HPC和AI的最新研究成果,则需要构建最大的模型,而这需要比以往更大的内存容量和更高的带宽。A100 80GB GPU所提供的内存是六个月前推出的前代产品的两倍,突破了每秒2TB的限制,使研究人员可以应对全球科学及大数据方面最严峻的挑战。”
用于NVIDIA DGXTM A100 和 NVIDIA DGX StationTM A100系统的NVIDIA A100 80GB GPU也于今日发布,预计将于本季度发货。
领先的系统提供商源讯、戴尔科技、富士通、技嘉科技、慧与、浪潮、联想、云达科技、超微预计将于2021年上半年,提供基于HGX A100集成底板的系统,该集成底板搭载4-8个A100 80GB GPU。
满足大流量数据工作负载需求
A100 80GB版本基于A100 40GB的多样化功能,成为需要大量数据存储空间的各类应用的理想选择。
DLRM等推荐系统模型为AI训练提供了涵盖数十亿用户和产品信息的海量表单。A100 80GB可实现高达3倍加速,使企业可以重新快速训练这些模型,从而提供更加精确的推荐。
HGX服务器中搭载的A100 80GB还可训练具有更多参数的最大模型,如GPT-2。GPT-2是具有超常生成文本能力的自然语言处理模型。这就消除了对数据或模型并行架构的需求,因为实现并行架构需要花费大量时间,而且跨多个节点运行缓慢。
凭借其多实例GPU(MIG)技术,A100可分割为多达7个GPU实例,每个实例具有10GB内存。该技术是一种安全的硬件隔离方法,在处理各类较小的工作负载时,可实现GPU最佳利用率。对于如RNN-T等自动语言识别模型的AI推理,单个A100 80GB MIG实例可处理更大规模的批量数据,将生产中的推理吞吐量提高1.25倍。
在TB级零售大数据分析基准上,A100 80GB将其性能提高了2倍,使其成为可对最大规模数据集进行快速分析的理想平台。随着数据的动态更新,企业可以实时做出关键决策。
对于科学应用,A100 80GB可为天气预报和量子化学等领域提供巨大的加速。材料模拟软件Quantum Espresso采用单节点A100 80GB实现了近2倍的吞吐量提升。
RIKEN计算科学中心负责人Satoshi Matsuoka表示:“快速、充足的内存带宽和容量对实现高性能超级计算应用来说至关重要。具有80GB HBM2e GPU内存的NVIDIA A100提供2TB/s的全球最快带宽,可帮助我们大幅提高应用性能。”
A100 80GB的关键特性
A100 80GB具备NVIDIA Ampere架构突破性特性:
第三代Tensor Core核心:通过全新TF32,将上一代Volta架构的AI吞吐量提高多达20倍。通过FP64,将HPC性能提高多达2.5倍。通过 INT8,将AI推理性能提高多达20倍,并且支持BF16数据格式。
更大、更快的HBM2e GPU内存:使内存容量增加一倍,在业内率先实现2TB/s以上的内存带宽。
MIG技术:将单个独立实例的内存增加一倍,可最多提供七个MIG,每个实例具备10GB内存。
结构化稀疏:将推理稀疏模型的速度提高2倍。
第三代NVLink和NVSwitch,相较于上一代互连技术,可使GPU之间的带宽增加至原来的两倍,将数据密集型工作负载的GPU数据传输速度提高至每秒600 gigabytes。
NVIDIA HGX AI 超级计算平台
A100 80GB GPU是NVIDIA HGX AI超级计算平台的关键组件。该平台将NVIDIA GPU、NVIDIA NVLink®、NVIDIA InfiniBand网络以及全面优化的NVIDIA AI和HPC软件堆栈的全部功能整合在一起,以提供最优越的应用性能。该平台使研究人员和科学家能够将HPC、数据分析和深度学习计算技术结合起来,共同推动科学进步。
惊喜来袭
AI行业盛会GTC 中国站注册火热进行中。
大会期间,所有注册参会者可通过登陆,定制个人参会日程、设置参会提醒、查看积分并兑换,换取电商购物券、拉杆箱、NVIDIA Jetson Nano 等好礼。观看主题演讲还将有机会赢得 GeForce RTX 3070 显卡!所有福利仅限注册用户。
即刻扫描海报二维码,免费注册,赢取大奖!
点击“阅读原文”,了解更多GTC China的详细日程。
强核问世:NVIDIA发布A100 80GB GPU,为AI超级计算带来全球最强GPU相关推荐
- 【百强榜单】2018第六届上汽设计国际挑战赛 全球百强作品正式公布!
近日,2018年第六届上汽设计国际挑战赛(SDC)百强评审会,在上汽设计中国总部设计中心.上汽欧洲前瞻设计中心两地同时展开. 作为中国最具影响力的国际汽车设计挑战赛,上汽设计国际挑战赛获得了海内外高校 ...
- 硬核黑科技、技术大咖、AI 音乐节……科大讯飞全球 1024 开发者节太燃了!
(文末有价值1024元的福利赠送) 1956 年 8 月,自达特茅斯会议首次提出"人工智能"以来,人工智能的命运起起伏伏,经历三大浪潮. 在黄金时期的50-70年代,人们发明最早的 ...
- GPU在AI业务中的核心技术与应用
近日,业内某AI平台研发负责人江州司马在信服云<云集技术学社>系列直播课上进行了<GPU在AI业务中的核心技术与应用>的分享,详细介绍了GPU的发展.GPU的架构以及如何利用G ...
- 2021-2027全球与中国GPU服务器市场现状及未来发展趋势
本报告研究全球与中国市场GPU服务器的产能.产量.销量.销售额.价格及未来趋势.重点分析全球与中国市场的主要厂商产品特点.产品规格.价格.销量.销售收入及全球和中国市场主要生产商的市场份额.历史数据为 ...
- 电脑核显可以用html吗,GPU性能测试:看最强核显能干翻哪些独显
●评测平台及方法说明 本次评测主要从CPU.GPU性能及功耗三方面进行,在CPU性能评测中除了加入4790K.6700K,同时增加三款CPU同频率对比作为辅助参考:而在GPU性能评测中,我们将加入AP ...
- 208核、6TB内存,阿里云发布全球最强云服务器:挑战摩尔定律极限
7月15日,阿里云宣布推出第三代神龙云服务器.与上一代相比,第三代神龙云服务器的综合性能提升高达160%,比目前全球最顶级云服务器还要快30%以上,整体算力全球最强. 配置上,第三代神龙云服务器产品家 ...
- 208核、6TB内存!阿里云发布全球最强云服务器:挑战摩尔定律极限
7月15日,阿里云宣布推出第三代神龙云服务器.与上一代相比,第三代神龙云服务器的综合性能提升高达160%,比目前全球最顶级云服务器还要快30%以上,整体算力全球最强. 配置上,第三代神龙云服务器产品家 ...
- 阿里第一颗芯片问世!平头哥发布含光800:全球最强
9月25日的杭州云栖大会上,达摩院院长张建锋现场展示了这款全球最强的AI芯片--含光800,这也是阿里巴巴第一颗自研芯片. 在业界标准的ResNet-50测试中,含光800推理性能达到78563IPS ...
- Nvidia GPU 入门教程之 03 在 GPU 上运行 Python 脚本,对比cpu与gpu性能,检测a100性能(教程含源码)
GPU 的内核比 CPU 多,因此在数据的并行计算方面,GPU 的性能比 CPU 好得多,尽管 GPU 的时钟速度较低,并且与 CPU 相比缺乏几个内核管理功能. 因此,在 GPU 上运行 pytho ...
最新文章
- Web.Config文件配置之连接默认错误页
- 单链表倒数第K个节点的查找和显示
- 架构漫谈(二):认识概念是理解架构的基础
- 嵌入式系统低功耗管理(备忘)
- 自动判断浏览器的中英文版本自动跳转网站中英文页面代码
- 2016总结 wjwdive
- LeetCode 437. 路径总和 III(双重递归)
- 素数回文数的个数(信息学奥赛一本通-T1408)
- HDU1253 胜利大逃亡
- 与人方便,随遇而安!
- macOS 升级12.0.1后,virtualBox 报错 Kernel driver not installed
- win10电脑找不到xps查看器的详细解决步骤
- Adobe Premiere(pr)2021 安装教程【64位】
- 沁园春·长沙 中法对照
- bzoj 1467 exBSGS
- At least one JAR was scanned for TLDs yet contained no TLDs.
- iphone苹果二手手机购买前必看
- python性能差_Python 性能分析大全
- laravel中公共子视图继承实现
- python tkinter treeview_Python tkinter treeview列大小
热门文章
- 简单干净的C#方法设计案例:SFCUI.AjaxLoadPage()之一
- 续:Fucking 这个网站!
- 247. Segment Tree Query II
- Yii中设置时间分区
- 数据库远程导入导出步骤
- [NVIDIA] Ubuntu 20.04 安装 nvidia-460 + cuda-11.2
- 拖拽之路(二):自定义QListWidget实现美观的拖拽样式(拖拽不影响选中)
- 211计算机建设,“211工程”重点学科信息资源建设综述
- python元编程 实际应用_Python元编程
- Keras之模型拼接