在技术应用快速变迁的时代,对于开发者而言,技术架构的相对稳定和编程技能的通用性是难能可贵的。近日,NVIDIA全球副总裁Shanker Trivedi及NVIDIA全球副总裁、PSG与云计算总经理Ashok Pandey接受了CSDN记者的专访,介绍NVIDIA对前沿技术应用趋势的判断,以及NVIDIA如何在技术、产品、生态等方面进行布局,以一种通用技术架构应对从当前深度学习热潮到未来物联网世界的挑战,让各行各业能够以更少的编程工作实现应用的智能化。

NVIDIA全球副总裁Shanker Trivedi(左)与NVIDIA全球副总裁、中国区PSG与云计算总经理Ashok Pandey

从深度学习到互联网+

NVIDIA专注于视觉计算和加速计算,深度学习是其过去一年的战略重心之一。Shanker Trivedi表示,神经网络的概念已经存在了三四十年,但是之前缺乏强大的计算能力以及相应的编程工具,编程非常麻烦,其发展受到制约。而对于NVIDIA而言,GPU可以提供强大的计算能力,CUDA则让数据科学家可以更容易地使用GPU和编程,所以在深度学习领域的发力就成了顺其自然的事情。

支持深度学习和人工智能的技术并不是最终目的,NVIDIA希望将深度学习带到一些行业应用中,包括医疗、机器人、教育、制造业等,最终是把这些在互联网上发展的技术应用到所有的传统行业,使他们也能获得智能化的应用,这也是当前所说的“互联网+”。

通过CUDA、OpenACC并行计算平台, NVIDIA强调加速计算、减少编程。NVIDIA的一个特点,是从云到端的整个产品线都基于同一个框架,都由CUDA支撑的。从做模型训练的(云)服务器,到最后的部署,可能部署到一个机器人,或者一个摄像头,或者任何一种设备,整个框架都是用的CUDA,这样编程和数据处理等方面,工程量和难度就会降低很多。目前模型精度没有极限,训练和部署是一个需要不断完善的动态工作,使用同一套框架,可以非常平滑地做到两者的协调改进。反之,如果训练用一个平台,部署的时候用的是另外一个平台,那这两件事情做完的时候,还需要去处理两套系统的协调,中间会增加很多的工作量,实现起来就比较困难。Shanker Trivedi认为,NVIDIA这种端对端的解决方案,这个框架是NVIDIA真正的价值。

构建加速计算生态

为实现其目标,NVIDIA从企业/行业合作伙伴、开发者、开源技术、初创企业等方面构建其技术生态系统,并将中国市场置于最重要海外市场的位置。

Shanker Trivedi介绍了NVIDIA面向未来的整体策略。

  1. NVIDIA非常强调要与教育界,特别是大学研究机构,开展广泛的交流和合作,因为他们是位于研究未来最前沿的。NVIDIA目前在全世界大概和600多所大学有相应的合作,希望借此了解最前沿的研究人员面临什么样的问题,他们的问题越有挑战性,NVIDIA的兴趣就越大,NVIDIA的工程师也会和他们一起去解决问题。

  2. NVIDIA和开发者群体做很多的沟通,比如经常举办开发者研讨会等,帮助他们更好地理解GPU,介绍NVIDIA有什么样的工具和技术,面临的问题可以怎样利用GPU来解决等。有时候NVIDIA会收到这些开发者的感谢信,关于NVIDIA和他们的交流以及技术的讲解,帮助他们解决了很大的问题等。

  3. 产品层面的部署,除了在基础的GPU产品上有CUDA编程环境,针对一些专门的领域,NVIDIA也有相应的产品,如神经网络方面的cuDNN,虚拟GPU方面的vGPU,科学计算方面的cuFFT,针对天气、医疗、金融等其他方面的一些应用领域,NVIDIA也会有相应的产品,提供给所在具体领域的公司使用。

HPC应用是需要加速计算的典型,GPU+CUDA已经在发挥作用,在目前TOP10的HPC应用中,已有9款支持GPU加速,如果按照TOP50的HPC应用来看,其中有35款已支持GPU加速。加速视觉计算和普通的计算不一样,现在还有很多新出现的应用程序无法支持加速计算。NVIDIA希望不仅能够对已有应用程序的进行加速计算,更希望能够帮助支持到新应用程序。NVIDIA加入到OpenPOWER,希望能够有更大的生态系统,来为基于POWER的应用程序进行加速的客户提供服务。出于这样一种兴趣,NVIDIA与IBM结成伙伴关系,直接把GPU加速计算提供给整个的OpenPOWER的成员。这和NVIDIA之前针对x86处理器所开展的工作类似。未来,NVIDIA还可能针对其它的平台处理器开展类似的合作。

对技术合作伙伴的考量,NVIDIA重点考虑三个要素。

  1. 对方的工作是不是非常有意义,并且与NVIDIA具有技术互补性。

  2. 要有很强的工程能力。

  3. 非常多的数据。因为要进行数据研究,首先要有大量的可用数据。

例如,NVIDIA和美国的国家科学计算应用中心有很多合作,也非常喜欢和他们合作,因为他们解决的是世界上最难的一些问题,如气候变化、基因测序、个性化医疗,以及天气物理等非常复杂的问题;NVIDIA和西门子医疗有很多的合作,因为他们的工程能力非常强,对医疗健康及整个医学的认识程度是非常深的,NVIDIA和他们之间的合作非常愉快;和阿里巴巴的合作,NVIDIA也是看到了他们工程师的能力非常强(支撑了他们双十一、双十二的交易平台),相信NVIDIA可以从他们那里学到很多东西,他们也可以从NVIDIA学到一些东西。

支持开源

NVIDIA具有拥抱开源的传统,即便是vGPU,NVIDIA也有一个针对于开源的SDK,有些公司就是利用NVIDIA这个SDK实施的开源。Shanker Trivedi谈到了一个基本宗旨:对于在数据中心生态系统中实现加速计算普遍化有意义的开源项目,NVIDIA都会去支持。

除了vGPU SDK,支持Linux,以及之前做的Ganglia、LSF平台等一系列的开源项目,NVIDIA目前也正在开展KVM、Docker、Mesos等开源项目,并在网站上给开发者提供如何在GPU上使用Docker的用户指南。Shanker Trivedi相信这些项目会增加对数据中心加速计算的生态系统的支持。现在,Docker用户指南已成为NVIDIA网站下载量排行前几位的文档。

当然,开源是技术而不是解决方案,对于企业来说,他们还需要相应的支持,所以,NVIDIA公司也会全力提供企业级的支持。

扶持初创企业

从一家非常小的初创企业起家,NVIDIA了解初创企业的需求和潜力,认为初创企业最重要的是保持创新力,能够进行前沿产品的开发,并为此开展针对初创企业的工作。Shanker Trivedi列举了四个方面的例子。

  1. 新兴企业峰会。NVIDIA有一个新兴企业峰会,这是一个有竞赛性质的国际论坛,针对那些在加速视觉计算方面做得最好的新兴企业,当他们的展示成果胜出,NVIDIA会给予十万美元的奖励,在每年的GPU技术大会(GTC)上进行最终的颁奖。NVIDIA也把新兴企业峰会的概念带到了更多的初创企业聚集的地方,包括在英国伦敦,在以色列特拉维夫,中国上海,去年在北京,NVIDIA都举办过类似的活动。

  2. 加速计算云化。对初创企业来说,他们可能资金有限,要想完全投资自己的系统比较困难,那NVIDIA会和一些云服务商携手,像中国的阿里云,像IBM的云服务部门等,从而使得这些小企业可以用从云端获取服务的方式,来进行加速计算,应用在高性能计算,人工智能等或者其他的一些应用领域。

  3. 市场对接。初创企业在市场销售方面也是需要一些帮助的,NVIDIA也在帮助初创企业寻找市场方面,开展了一些工作,比如说帮助这些初创企业去对接对他们产品有需求的一些大企业等,这种例子,在美国市场,在中国市场都有,通过帮助初创企业对接一些潜在客户,来帮助他们增加收入。

  4. 开发者社区。NVIDIA开发者项目里的开发者,他们可以抢先使用一些NVIDIA最新推出的技术,并在社区中交流他们在技术开发,代码开发等方面的经验,使得参与者能够保持前沿的创新性。

深耕中国市场

NVIDIA进入中国市场已经很长时间,包括在游戏领域,在高性能计算领域,NVIDIA在中国建立GPU教育中心,也已经有七年左右的时间。Shanker Trivedi谈到,中国具有从芯片到系统、集成、虚拟化、数据库、中间件应用的强大生态链,BAT、搜狐、网易、优酷土豆、京东等众多的大型互联网企业,以及浓厚的创业文化,尤其是图形图像、视频方面,出现了Face++、格灵深瞳、衣+(Dress+)等在深度学习、计算机视觉方向创业的公司,这些只有在美国才有可能看到,基于互联网的商业模式创新甚至领先于美国。基于此,NVIDIA将中国视为美国之外最重要的国家。

在中国,NVIDIA有相当强的研发工程能力,NVIDIA非常支持“技术应更多依赖于本地研发,而不是依靠进口”的理念。NVIDIA一直以来也是在继续坚持助力中国本地的研究机构、大公司、创业公司、系统供应商等利用GPU来开展创新。

据Ashok Pandey介绍,在教育和科研机构合作这一方面,包括开发和研究,NVIDIA在中国做了很多的工作,包括合作建立三个GPU卓越中心12个GPU研究中心,25个GPU教育中心。除此之外,在本地合作伙伴方面,曙光、浪潮、华为等,包括一些大客户,都是NVIDIA的服务器、云服务的合作伙伴,在技术、新产品研发方面做了很多的合作。包括GRID软件,不仅支持VMware和Citrix,也支持华为。

推动POWER+GPU加速计算的模式方面,NVIDIA与OpenPOWER联盟的众多中国成员,比如曙光、浪潮、中太数据和位于苏州的软视软件(Zoom)等,都在积极的开展合作联系。

布局物联网

针对未来的物联网,除了已有的神经网络、科学计算方面的产品外,NVIDIA还有专门用来采集传感器数据进行应用的一些产品。不久之前,NVIDIA推出了一个叫做Jetson TX1的开发平台,它是针对像小型的机器人、智能摄像头、智能传感器、海底油气勘探平台等小装置的产品。Jetson TX1所使用的CUDA编程环境,和数据中心当中所使用的Tesla是同样的架构,都是用CUDA进行编程,这样就可以在物联网的边缘端点,形成Tesla+Tegra的一个组合,一个在物联网边缘,一个在物联网核心。Shanker Trivedi认为,这对于物联网,也是一个非常合适的架构。

总结

在HPC、深度学习领域,NVIDIA Tesla GPU加速器和CUDA平台已经发挥重要作用,例如商汤科技以2000多片NVIDIA作为核心竞争力之一,而在IoT、VR领域,NVIDIA也已经进行相应的研发。和前沿研究机构、大小本土企业以及不同技术类型的技术合作,让NVIDIA技术的先进性、实用性、普适性具有依据,但以相同的技术架构加速技术、简化编程,才是其技术能够在行业应用中落地的最重要保证。

NVIDIA:构建加速计算生态,推动深度学习应用落地相关推荐

  1. 「构建企业级推荐系统系列」深度学习在推荐系统中的应用

    点击上方"数据与智能","星标或置顶公众号" 第一时间获取好内容 作者 | gongyouliu 编辑 | auroral-L 2016年DeepMind开发的 ...

  2. GPU信息查看以及确认Pytorch使用了GPU计算模块进行深度学习的训练

    GPU信息查看以及确认Pytorch使用了GPU计算模块进行深度学习的训练 目录 GPU信息查看以及确认Pytorch使用了GPU计算模块进行深度学习的训练 GPU基础信息查看 Pytorch是否使用 ...

  3. 计算某个时间距离现在_计算成像amp;深度学习(1)

    从今天开始,我们一起顺着文献摸一摸计算成像&深度学习的来龙去脉.有时间就会更新. 1. U-Net的问世(2015年) 这张图大家应该已经很熟悉了,长得像字母"U",名叫U ...

  4. docker 利用docker拉取Nvidia/cuda官方镜像,部署深度学习环境

    利用docker拉取Nvidia/cuda官方镜像,部署深度学习环境 1.拉取Nvidia/cuda官方镜像 2.生成容器 3.在容器内安装深度学习环境 看完这篇博文,可以查看我总结的另一篇博文教程: ...

  5. 算法工程 # 深度学习算法落地最后一公里:工业界中的大规模向量检索

    前言:现代深度学习实践中很多场景其实都是对输入数据进行处理.嵌入,最终获得一个 embedding,然后对 embedding 进行相似度检索,而工业界中的被检索数据往往是海量的,因此深度学习模型落地 ...

  6. Nvidia推出强大的新图形芯片Tesl V100加速进军AI和深度学习的步伐

    Nvidia公司携旗下的图形处理器在半导体领域可以说是声名赫赫,Nvidia图形处理器曾为创造最热门的游戏个人电脑立下汗马功劳,而时至今日原来的游戏市场几乎成了后娘的儿子. Nvidia日前在加利福尼 ...

  7. 障碍期权定价 python_Python王牌加速库2:深度学习下的障碍期权定价

    作者:Yi Dong 编译:1+1=6 1.前言 上一期推文中,我们使用了Numba和CuPy来运行蒙特卡罗模拟来确定亚式障碍期权的价格.Python王牌加速库:奇异期权定价的利器​mp.weixin ...

  8. 不用GPU,稀疏化也能加速你的YOLOv3深度学习模型

    水木番 发自 凹非寺 来自|量子位 你还在为神经网络模型里的冗余信息烦恼吗? 或者手上只有CPU,对一些只能用昂贵的GPU建立的深度学习模型"望眼欲穿"吗? 最近,创业公司Neur ...

  9. NVIDIA RTX A6000/RTX3090/3080/3070深度学习训练/GPU服务器硬件配置推荐2021

    本方案中,推荐配置报价更新日期:2021/03/06 变更原因: 1)近期唯利是图的厂家将RTX显卡大部分卖给挖矿的,造成断货.暴涨 2)RTX A6000上市.增加新GPU配置方案 3)GX630M ...

  10. vgg16卷积层的计算量_深度学习_经典网络_VGG16和ResNet152哪个参数量更多

    首先,我们我们知道深度学习中网络的计算量代表时间复杂度,参数量代表空间复杂度. 从ResNet的论文中可知(ResNet论文可在这个文章中的第六部分找到)152层的残差网络在时间复杂度上和VGG16是 ...

最新文章

  1. Deepmind最新研究:从图表示学习看算法推理
  2. zabbix配置外部邮件服务器进行邮件报警
  3. Python面向对象进阶及类成员
  4. oracle数据库的select,Oracle数据库--基本的select语句
  5. 2019.01.26 codeforces 1096G. Lucky Tickets(生成函数)
  6. Python--进程、线程、协程对比
  7. WebSocket实战
  8. 比亚迪发布九款新车 首次展示L4技术和BNA升级架构...
  9. 一招搞定时间序列数据,手把手教你绘制时间序列图
  10. VNC远程控制软件,五大容易上手的VNC远程控制软件
  11. IT行业道德伦理 介绍
  12. 阿兹后来明白了,其实别人没有我们想象中的那么关注我们
  13. ffmpeg命令行使用
  14. c++语言程序中,要调用的函数必须在main()函数中定义,惠州学院C++考试复习题
  15. VC中画基准线,随鼠标移动
  16. 手机捕鱼服务器维护,手机捕鱼游戏服务器
  17. Java Exer0910_4 输入身高(厘米)体重(公斤)计算BMI,四舍五入保留两位小数
  18. 互联网金融做大数据风控的九种维度
  19. GG云更新 - 测试代码
  20. 邮件归档,完善企业信息管理

热门文章

  1. 容器云平台使用体验:阿里云容器服务
  2. jQuery 文档操作方法大全(也适用于 XML 文档和 HTML 文档)
  3. 怎么使用 soapui 做接口测试?
  4. Win10 PSCAD4.5安装心路历程Mark
  5. 微信小程序Axure元件库
  6. 干货来啦!!!二十种Python代码游戏源代码分享
  7. typora最好用的主题_推荐一款超好用Markdown编辑器-Typora
  8. mysql实现递归查询的方法
  9. Lingo 软件的使用 数学建模 司守奎
  10. 全面对比 C C++ Java Python