英特尔创始人之一戈登·摩尔(Gordon Moore)提出的摩尔定律(Moore's law),是指集成电路上的晶体管数目每两年(或18个月)会增加一倍,该定律已经被奉为半导体产业圭臬。

即使摩尔定律这几年一直遇到瓶颈与挑战,半导体大厂仍是努力以各种方式延续该定律的生命,让半导体技术持续延展创新。

在AI领域,我们也常听到“黄氏定律 (Huang’s Law)”,是预测 GPU 将推动 AI 性能实现逐年翻倍;该定律是由英伟达 NVIDIA 首席执行官黄仁勋名字命名。

在英伟达 2020 年的 GTC 中国线上大会中,首席科学家 Bill Dally 指出,英伟达的研究人员致力于打造速度更快的 AI 芯片,并将其用于具有更高带宽的系统,从而简化编程。

Dally 以三个项目为例,讲述了自己带领的 200 人的研究团队如何成功实现“黄氏定律(Huang’s Law)”。

所谓的“黄氏定律”是以英伟达首席执行官黄仁勋名字命名的定律,预测 GPU 将推动 AI 性能实现逐年翻倍。

Dally 表示,如果我们真想提高计算机性能,黄氏定律就是一项重要指标,且在可预见的未来都将一直适用。

图说:英伟达帮助 AI推理性能每年提升一倍以上

为实现这一突破,英伟达研究人员专门开发了一种名为 MAGNet 的工具,其生成的 AI 推理加速器在模拟测试中,能够达到每瓦 100 tera ops 的推理能力,比目前的商用芯片高出一个数量级。

MAGNet 采用了一系列新技术来协调并控制通过设备的信息流,最大限度地减少数据传输,而数据传输正是当今芯片中最耗能的环节。这一研究原型以模组化实现,因此能够灵活扩展。

另外,研究团队还开展了一项研究,试图以更快速的光链路取代现有系统内的电气链路。

Dally 在 2009 年加入英伟达之前,曾任斯坦福大学计算机科学系主任,个人拥有 120 多项专利。他表示,可以将连接 GPU 的 NVLink 速度提高一倍,也许还会再翻番,但电子信号最终会消耗殆尽。

该团队正在与哥伦比亚大学的研究人员密切合作,探讨如何利用电信供应商在其核心网络中所采用的技术,通过一条光纤来传输数十路信号。

这种名为“密集波分复用”的技术,有望在仅一毫米大小的芯片上实现 Tb/s 级数据的传输,是如今互连密度的十倍以上。

除了更大的吞吐量,光链路也有助于打造更为密集型的系统。Dally 举例展示了一个未来将搭载 160 多个 GPU 的 NVIDIA DGX 系统模型。

图说:工程师借助光链路,在单一系统中可搭载160多个GPU

软件方面,英伟达的研究人员开发了全新编程系统原型 Legate。开发者借助 Legate,即可在任何规模的系统上,运行针对单一 GPU 编写的程序——甚至适用于诸如 Selene 等搭载数千个 GPU 的巨型超级计算机。

Legate 将一种新的编程速记融入了加速软件库和高级运行时环境 Legion,目前它正在美国国家实验室接受测试。

除上述三项研究,Dally 还在主题演讲中谈到了英伟达特别针对医疗健康、无人驾驶汽车和机器人等众多行业打造的平台。他表示,经过几代人的努力,英伟达的产品将通过基于物理渲染的路径追踪技术,实时生成令人惊艳的图像,并能够借助AI构建整个场景。

此外,他还首次公开展示了英伟达的对话式 AI 框架 Jarvis 和 GauGAN的完美组合。GauGAN利用生成式对抗网络,只需简略构图就能创建风景图。

再者,光线追踪领域的进展都始于英伟达研究院打造的原型。2011年,Dally 委派研究员 Bryan Catanzaro 与斯坦福大学教授 Andrew Ng 共同合作一个项目,后来打造 出 CuDNN 软件,让深度学习领域大量的研究工作成为可能。

英伟达最大gpu_摩尔定律未死,黄律定律已出!英伟达要用GPU推动AI性能逐年翻倍...相关推荐

  1. AI时代的摩尔定律?黄氏定律预测AI性能将逐年翻倍

    黄氏定律是以英伟达创始人黄仁勋名字命名的定律,对AI性能的提升作出预测. 作者 | 包永刚 1965年,时任仙童半导体公司工程师,也是后来英特尔的创始人之一的戈登·摩尔(Gordon Moore)提出 ...

  2. 英伟达最大gpu_英伟达正式发布Ampere架构GPU,完成史上最大性能飞跃

    PingWest品玩5月14日讯,在GTC 2020线上发布会上,英伟达CEO黄仁勋正式推出了安培(Ampere)架构GPU.据其表示,这块芯片采用7nm工艺,540亿晶体管,20倍AI算力,实现5大 ...

  3. “半价买2080Ti”,英伟达发布RTX 30系列显卡,性能翻倍价格更低,网友高呼“NVIDIA YES”...

    晓查 贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 千呼万唤始出来!游戏玩家等待了2年的英伟达新显(he)卡(dan)终于来了,而且加量又减价. 今天,黄仁勋在自家厨房里正式发布新一代 ...

  4. AI性能基准测试从此有了「中国标准」!英伟达、谷歌可以试试

    2020-11-10 15:56:02 金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 在秀算力这件事上,近几年一个叫MLPerf的AI性能基准测试,经常跃入人们的视线. 为了拿这个标准证 ...

  5. AI性能基准测试从此有了「中国标准」!英伟达、谷歌可以试试这套算力卷

    金磊 发自 凹非寺 量子位 报道 | 公众号 QbitAI 在秀算力这件事上,近几年一个叫MLPerf的AI性能基准测试,经常跃入人们的视线. 为了拿这个标准证明实力,英伟达.谷歌等「算力」大厂的表现 ...

  6. 英特尔AI芯片首次商用交货!推理性能3.7倍于英伟达T4,年贡献245亿涨250%

    李根 发自 旧金山  量子位 报道 | 公众号 QbitAI AI豪赌出业绩,产品启动商用--性能"吊打"友商. 今天(11月13日)在年度AI峰会上,老牌芯片霸主英特尔,交上最新 ...

  7. AI算力霸主诞生!英伟达发布首款安培架构GPU,性能提升20倍

    来源:雷锋网 由于疫情缘故,本该在今年3月英伟达(NVIDIA)GTC 2020上发布的安培(Ampere)架构曝光多次却一直未发布. 5月15日,英伟达CEO黄仁勋发布了英伟达新一代GPU架构安培, ...

  8. 英伟达老黄又来送大礼,全新Titan V CEO限量版GPU火力全开

    岳排槐 发自 凹非寺 量子位 出品 | 公众号 QbitAI 六月的盐湖城,老黄也穿着皮衣. 就在计算机视觉顶级会议CVPR 2018举办的间隙,英伟达照例在盐湖城搞了一个Party,核心就是一句话: ...

  9. 本周AI热点回顾:百度推出全球首个mRNA疫苗不稳定性解决方案、性能提升20倍:英伟达GPU旗舰A100

    01 百度推出全球首个mRNA疫苗不稳定性解决方案LinearDesign 新冠疫情爆发后,RNA设计领域世界知名专家.斯坦福大学生物化学系Rhiju Das教授关注到疫苗研发存在的一个非常棘手的问题 ...

  10. 英伟达凭借GPU与AI笑傲本届CES展会

    英伟达公司联合创始人兼CEO黄仁勋在本周三晚身着大家熟悉的黑色夹克再度亮相消费电子展(简称CES),并致开幕主题演讲. 我们很难想象其它芯片厂商的CEO会像他这样,在全球最大的贸易展会之一上受到与会者 ...

最新文章

  1. 基于 Python 和 OpenCV 构建智能停车系统
  2. Android 手机震动
  3. duilib 修复Text控件无法设置宽度的bug,增加自动加算宽度的属性
  4. redis 主从模式_Redis主从模式部署文档
  5. CISCO 2950,3550交换机的端口隔离
  6. https 密钥 php,https加密方式是什么
  7. 【数值分析】证明题一道
  8. 单片机如何用普通电池供电?
  9. bash awk_Bash指南,Linux终端技巧,DevOps错误,Python,awk,NASA等
  10. Chrome在302重定向的时候对原请求产生2次请求的问题说明
  11. SpringCloud工作笔记037---spring cloud-zuul的Filter详解
  12. Oulipo(Hash入门第一题 Hash函数学习)
  13. UnityShader10:CG标准函数库
  14. 最简单的c 语言打开串口程序,一个简单的串口程序
  15. C++ 解决大数运算(大数加法,大数幂运算,大数求余)
  16. 开发者头条(一):导航页
  17. Windows批处理命令:start、call 的区别
  18. Excel文件加密后忘记密码破解方法
  19. 干货 | 电子设备散热技术详解
  20. 软件构造期末复习知识点整理

热门文章

  1. ERP技术在财务信息化转型中应用探讨
  2. PHP文件中定义加载资源文件
  3. linux下c语言编程之一环境架设和入门
  4. [MSDN]Design Guidelines for Developing Class Libraries with .NET Framework 4
  5. SVN MKACTIVITY
  6. PHP下简单交换两个变量
  7. 09月27日 pytorch与resnet(二)
  8. 机器学习-决策树--基础知识总结
  9. kafka-spark-streaming-mysql(scala)实时数据处理案列
  10. 第三季-第27课-Shell脚本高级编程