硅谷Live / 实地探访 / 热点探秘 / 深度探讨

美国时间3月27日早上,英伟达 GTC 大会最重磅环节——英伟达创始人黄仁勋的主题演讲在圣何塞举行。

要知道,GTC大会向来都是以AI和深度学习作为讨论重点,这次也不例外!那酷爱皮衣,还专门换了一件新皮衣的黄教主说了啥呢?

从星球大战,哦不,从里面运用到的光线追踪RTX技术说起,到第一款采用 Volta 架构的 Quadro GV100 GPU,再从新版的Tesla V100内存升级为32G,说到超级电脑 DGX-2。没错,DGX-2 就是黄教主口中搭载了“全球最大GPU”的超级电脑,能实现每秒2亿千万次浮点运算,功耗10千瓦,比英伟达去年发布的 DGX-1性能高出10倍。

小探知道,如果你不是内行肯定也不知道这啥意思,但举个例子你就懂了。用这超级电脑,每秒下载1万4千部电影,怎样,牛不牛?

当然,英伟达还推出了各种新版的机器学习应用平台、下一代自动驾驶芯片、自动驾驶测试平台等……小探就不多说这些让工业界好奇、震惊的新名词了,今天,就来说说,到底英伟达这些新技术,应用到日常生活的话,有什么改变?哪些应用场景适用?别担心,小白都能看得懂!

光影实时追踪技术:为娱乐行业打开新世界

虽然此黄教主非彼黄教主,但这次黄教主宣布的新产品当中,可是能造福广大娱乐动画行业的小伙伴啊。

英伟达新推出的这款 Quadro GV100 GPU,使用 RTX 技术进行实时光线追踪,这将为动画产业提供一种更有效的 3D 图形和场景制作方法。再展开一步,媒体和娱乐行业的从业者开心了,因为他们能更快地创建出逼真的动画效果;而观众和玩家们也有福了,因为视觉盛宴会更多更好。

英伟达在大会现场展示了一段《星球大战》视频,来证明 RTX 实时光影追踪能做到多好:每一束光线遇到每一个表面,计算机都要迅速决定如何处理两者关系:是反射还是吸收?从哪个角度反射?要吸收到哪种程度?

毫无疑问,这种光影处理需要非常巨大的计算量。现在的动画电影中,渲染单个场景都需要好几个小时。但是黄仁勋说,我们走入了一个光影实时处理的时代,“你在这里看到的一切,都是实时的”。这也是为什么英伟达敢称自己的这项成果是“自从约20年前推出可编程着色器以来,计算机图形学的最大进步。”

下面来看看参数部分。

上周,英伟达已经透露:其技术支持超过 24 种、总用户量超过 2500 万的专业设计和创意应用程序。

采用英伟达 NVLink 互连技术的 Quadro GV100 GPU,具有32GB内存,可扩展至64GB并配备多个 Quadro GPU,是目前市面上适用这些应用程序的最顶级性能平台。

基于英伟达的 Volta GPU 架构,GV100 可提供双精度7.4 teraflops(teraflops 即“浮点运算”,是衡量计算机计算能力的量,teraflops 是每秒一万亿次的浮点运算,所以 GV100 的运算量极为强大),单精度14.8 teraflops和深度学习性能118.5 teraflops。内置于Nvidia RTX中的Nvidia OptiX AI-denoiser可实现近100倍的CPU性能,实现实时的无噪音渲染。

黄仁勋自己也很激动

然后,娱乐行业对此有什么反应呢?

那肯定是喜闻乐见的。

出品了《堡垒之夜》和《无尽之剑》系列的 Epic Games,其首席执行官在一份声明中表示:“Nvidia RTX 技术的面世,让实时光影追踪这件事进入了下一个篇章。通过在新的 DirectX Raytracing API 支持下,为游戏开发社区提供强大的技术,英伟达成为新一代游戏和电影图像背后的推动力量。”话说的比较官方,划重点就是“对游戏开发来讲,真是跨时代技术啊”。

而 Remedy Entertainment 则说:“使用英伟达 RTX 技术开发之后,我们惊叹于它的速度之快,并且还比传统技术有更高的视觉保真度。想到未来使用 RTX 能实现的目标,我们就很兴奋——是时候给玩家们准备些特别的东西了!”

聊完娱乐,我们来看看医疗。

在大会现场,黄仁勋展示了英伟达首次推出专用于医疗图像处理的超级电脑 Clara。这个超级电脑有什么厉害之处?

还记得那些超声波拍摄的医疗影像吗?大多数都是2D、黑白的。但只要把 2D 的黑白图像数据传入 Clara 电脑,再配合人工智能软件的处理,医疗影像就能够给出更多信息。原来的黑白图像上能实时渲染出颜色、分层、分区域等。也就是说,准妈妈就可以看到 3D 心脏,还有子宫中宝宝的模样了。

更实用的是,医院可以在现有医疗设备上直接接入这台电脑,不需要替换。目前,英伟达正在和众多医疗厂商合作,除了GE通用电气、三星电子等,还有像图玛深维、推想科技等 AI 医疗创业公司。说多一句,推想科技是国内最早将深度学习技术应用于医疗影像诊断的人工智能公司。

可以想象的是,英伟达这款超级医疗图像计算机要是部署到各大三甲医院的话,得是多么大的一个市场。

搭载全球最大GPU的超级计算机

今天英伟达这场大会,最重磅的莫过于发布了被称为“全球最大的GPU”。小探不妨先来带大家回顾下,这款超级计算机 DGX-2 的前身 DGX-1。

2016年英伟达 GPU 全球技术大会上,英伟达推出了全球首款深度学习超级计算机 DGX-1,它有首个专为深度学习而设计的系统,提供了相当于 250 台 x86 服务器的吞吐量。计算能力有多强大?相当于你把 250 台服务器装在了这个盒子里。

那 DGX-2 比起 DGX-1,有哪些改进呢?

首先,它有16个 Volta GPU,使得 DGX-2 具有300台服务器的深度学习处理能力。从其他参数来看,共有512GB HBM2内存,可提供高达14.4TB / s的吞吐量,有 81920 个 CUDA 内核。

但这16个GPU并不是简单连接,因为 DGX-2 是第一个首次推出 NVSwitch 的系统,它能够使系统中16个 GPU 共享一个统一的内存空间,这使专业开发人员能够处理最大的数据集和最复杂的深度学习模型。这个由 NVSwitch 连接的 NVIDIA Volta GPU 可以说创造了世界上最大的GPU。

其次,速度更快。DGX-2 可以在不到两天的时间内训练 FAIRSeq,这是一种最先进的神经机器翻译模型。这比 DGX-1 的性能提高了10倍。说到速度,我们前面也说了,因为高达14.4TB每秒,每秒可以下载1万4千部电影。

这款全球最强大的 GPU 售价为39.9万美元(约人民币250万),今年第三季度上市。这个价位,个人估计是买不起的了,但能给企业省下多少钱呢?300 台双 CPU 服务器的价格约为300万美元,英伟达的售价只是1/8的花费。难怪今天 GTC 大会上,黄教主的口头禅是 “你买得越多,省得越多”。

自动驾驶:测试暂停,研发继续

在发布会的最后,黄仁勋说英伟达会暂停自动车上路测试,但研发会继续。

今年 1 月 8 号 CES 大会上,英伟达正式宣布与 Uber 合作,其芯片将成为 Uber 车队的重要驱动力。其实 Uber 自 2016 年部署沃尔沃测试车队时,就一直使用英伟达的技术。上周 Uber 事故发生前,英伟达在美国新泽西、加州圣克拉拉,日本及德国等地测试其无人车。事故后,英伟达宣布将在全球范围内暂停其无人车部分的测试,股价随即应声下跌。

自动车和硬件供应商和平分手并非没有先例:2016 年 5月,特斯拉的自动驾驶系统 “Autopilot” 由于多重原因判断失误,导致一位驾驶着特斯拉 Model S 的男子直接在毫无减速的情况下,钻进了一辆货柜卡车的下方,车主当场死亡。此后不久,特斯拉当时的摄像头供应商、以色列公司 Mobileye 宣布和特斯拉终止合作。虽然双方并未做出太多解释,外界普遍认为该事故是合作终止的重要原因。

当然,无人车测试只是暂停。早些时候英伟达一名发言人回应此事时说:“以后无人车的安全性会远远超过人类驾驶者,因此对无人车的研发需要继续进行。但为了从 Uber 事故中学到教训,我们将暂停测试。”

“只要能动,就会成为自动驾驶”

不过今天的发布会可以看出,英伟达绝非要停下探索自动驾驶的脚步:英伟达计划打造一个测试自动驾驶汽车的新系统 Drive Sim and Constellation,具体包括:

  • AV 验证系统

  • VR AV 模拟器

  • 与 DRIVE 电脑相同架构

  • 模拟罕见或困难条件、场景重建、运行回归测试、积累虚拟测试里程

Drive Sim and Constellation 系统的第一部分叫 Drive Sim(模拟驾驶)。Drive Sim 是一个软件平台,可以模拟无人车上使用的传感器。它运行在模块化硬件平台上,每个模块由 8 个高端图形处理器组成。由于可以根据需要随时添加模块,这种方法可以模拟车辆上所有的传感器。模拟传感器所处理的信息可以以假乱真、高度模拟真实世界,肉眼几乎无法分辨。

英伟达 Drive Constellation

使用道路上记录的数据,英伟达 GPU 可以改变太阳的位置,天气,道路反射率等等。模拟场景时,夏日中午、夜间驾驶、倾盆大雨或暴风雪等都可以随意转换。

所有这些都是为了在数据中心运行而设计的,价格不会太便宜。当然,和在现实世界中冒着生命危险积累测试里程比起来,模拟环境下测试更安全,而且可以在无限变化的情况下每天积累数百万英里。

Drive 系列是英伟达旗下 Pegasus 人工智能计算平台的一部分。Pegasus 主板的样品将在今年晚些时候推出,但该模拟器也可以在任何英伟达 Drive 自动化平台上运行。 英伟达对其所有硬件的软件兼容性可以说是非常自豪:软件可以先在现有硬件上开发,以后如果需要移到新的硬件上,也能轻松移植到新平台。

黄教主今天费尽心思说了那么多,但没想到英伟达的股票下跌了7.7%,这对广大小白来讲,到底是不是入手英伟达股票的好时机呢?大伙们都怎么看?


推荐阅读

区块链报告 | 脑机接口报告

硅谷人工智能 | 斯坦福校长

卫哲 | 姚劲波 | 胡海泉

垂直种植 | 无人车

王者荣耀 | 返老还童


英伟达开大会,每秒下载1.4万部小电影的GPU来啦相关推荐

  1. 【报告分享】2023人工智能企业研究报告:为什么是英伟达?.pdf(附下载链接)...

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 无需翻墙,无需注册,ChatGPT4直接使用 ChatGPT提词手册,学完工作效率提升百倍 马斯克谈AI:中美差 ...

  2. 英伟达CUDA 10终于开放下载了

    栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI 英伟达的CUDA 10工具包,终于可以下载了. 与9字头的前辈相比,10.0是第一次为图灵GPU定制的版本. 英伟达新近发布的GeForce ...

  3. 离开英伟达仅19个月,他交出了一块国产全功能GPU

    金磊 发自 凹非寺 量子位 | 公众号 QbitAI 当他拿出这块GPU时,现场可谓是掌声与惊叹交错. 他叫张建中 (James Zhang),很多人熟知这个名字,是因为他曾是英伟达中国区的一把手,任 ...

  4. 解决英伟达CUDA和cuDNN下载过慢的问题

    文章目录 为什么会慢 为什么会快 怎么加速下载英伟达CUDA和cuDNN 推荐下载工具-2021-01-19更新 为什么会慢 英伟达开发者网站最近的服务器位于日本东京,带宽也是很感人的. 可以看到下载 ...

  5. cuda和对应英伟达显卡驱动下载

    在安装完显卡后,要安装对应的cuda很麻烦,一不小心对应不上就需要卸载重新下载 在多次下载之后,经验是 先不下载英伟达显卡驱动,直接下载cuda,在下载cuda的选项里选择英伟达显卡驱动,一步到位 不 ...

  6. 英伟达的DPU,是想在数据中心奇袭英特尔?

    最近几年,经常关注科技圈的朋友们总会发现,每次遇到厂商有重大发布,就总能看到"颠覆"."极致"."革命性"等概念出现在发布会上. 前几天,i ...

  7. 英伟达TX2烧录系统_英伟达的DPU,是想在数据中心奇袭英特尔?

    热点追踪 / 深度探讨 / 实地探访 / 商务合作 最近几年,经常关注科技圈的朋友们总会发现,每次遇到厂商有重大发布,就总能看到"颠覆"."极致"." ...

  8. 2002年3月英伟达发布核弹GPU与大算力自动驾驶芯片

    2002年3月英伟达发布核弹GPU与大算力自动驾驶芯片 英伟达核弹级GPU:800亿晶体管,20块承载全球互联网流量 2022年3 月 22 日,在英伟达 GTC2022 上,英伟达介绍了 Hoppe ...

  9. 英伟达发布史上最强GPU,却叫停了自动驾驶车路测

    作者 | DavidZh 出品 | AI科技大本营(公众号ID:rgznai100) 当地时间 3 月 27 日,英伟达在美国圣克拉的 GTC 大会上推出多款产品. ▌显卡扩容,史上最强的 DGX-2 ...

最新文章

  1. IIS7.5 安全配置研究(推荐)
  2. MATLAB实战系列(十九)-遗传算法解决TSP(旅行商)问题-应用及解析(文末附MATLAB源码)
  3. ubuntu-14.04.2-desktop-i386.iso:ubuntu-14.04.2-desktop-i386:安装Oracle11gR2
  4. TXSQL企业级特性揭秘:加密与审计
  5. 谷歌gcp 远程计算机_引导性GCP:带有Google Cloud Pub / Sub的Spring Cloud Stream
  6. String.valueOf(Object)与Objects.toString(Object)
  7. 诺基亚:你以为他死了,他却靠这一点重回世界第二
  8. Infinity loop in cursor iteration
  9. HDFS副本放置策略
  10. 这算抄百度?Google为信息流告别简洁搜索框,也押注短视频
  11. Stata数据处理:清洗CFPS数据库
  12. 大数据平台核心架构图鉴,建议收藏!
  13. 修改iphone模拟器hosts
  14. linux打开笔记本摄像头驱动程序,Linux下使用Opencv打开笔记本摄像头
  15. M1 Mac 开发Android遇到的坑点与我的解决方法
  16. 题目:猴子吃桃问题:猴子第一天摘下若干个桃子,当即吃了一半,还不瘾,又多吃了一个
第二天早上又将剩下的桃子吃掉一半,又多吃了一个。以后每天早上都吃了前一天剩下
的一半零一个。到第10天早上想再吃时,见
  17. 中国金融科技50强之“百度金融”技术基因研究
  18. python requests中content与text方法的区别
  19. 【Java字符串分割[split()]和截取[substring()]】
  20. vue进入浏览器大屏

热门文章

  1. JAVA模拟ATM取款
  2. hive 练习影评案列
  3. 整体式转向梯形优化设计MATLAB程序
  4. Vue 组件,事件,循环,父子传值,非组件传值 vuex
  5. 模拟昼夜交替-第11届蓝桥杯Scratch国赛真题第1题
  6. project中如何设置非标准工作时间
  7. 自然拼读与词根词缀简版
  8. ubuntu 安装pac
  9. 计算机简历相关经验,计算机相关专业学生简历经验谈(8页)-原创力文档
  10. 教务管理系统示例——前端模板