NVIDIA：构建加速计算生态，推动深度学习应用落地

在技术应用快速变迁的时代，对于开发者而言，技术架构的相对稳定和编程技能的通用性是难能可贵的。近日，NVIDIA全球副总裁Shanker Trivedi及NVIDIA全球副总裁、PSG与云计算总经理Ashok Pandey接受了CSDN记者的专访，介绍NVIDIA对前沿技术应用趋势的判断，以及NVIDIA如何在技术、产品、生态等方面进行布局，以一种通用技术架构应对从当前深度学习热潮到未来物联网世界的挑战，让各行各业能够以更少的编程工作实现应用的智能化。

NVIDIA全球副总裁Shanker Trivedi（左）与NVIDIA全球副总裁、中国区PSG与云计算总经理Ashok Pandey

从深度学习到互联网+

NVIDIA专注于视觉计算和加速计算，深度学习是其过去一年的战略重心之一。Shanker Trivedi表示，神经网络的概念已经存在了三四十年，但是之前缺乏强大的计算能力以及相应的编程工具，编程非常麻烦，其发展受到制约。而对于NVIDIA而言，GPU可以提供强大的计算能力，CUDA则让数据科学家可以更容易地使用GPU和编程，所以在深度学习领域的发力就成了顺其自然的事情。

支持深度学习和人工智能的技术并不是最终目的，NVIDIA希望将深度学习带到一些行业应用中，包括医疗、机器人、教育、制造业等，最终是把这些在互联网上发展的技术应用到所有的传统行业，使他们也能获得智能化的应用，这也是当前所说的“互联网+”。

通过CUDA、OpenACC并行计算平台， NVIDIA强调加速计算、减少编程。NVIDIA的一个特点，是从云到端的整个产品线都基于同一个框架，都由CUDA支撑的。从做模型训练的（云）服务器，到最后的部署，可能部署到一个机器人，或者一个摄像头，或者任何一种设备，整个框架都是用的CUDA，这样编程和数据处理等方面，工程量和难度就会降低很多。目前模型精度没有极限，训练和部署是一个需要不断完善的动态工作，使用同一套框架，可以非常平滑地做到两者的协调改进。反之，如果训练用一个平台，部署的时候用的是另外一个平台，那这两件事情做完的时候，还需要去处理两套系统的协调，中间会增加很多的工作量，实现起来就比较困难。Shanker Trivedi认为，NVIDIA这种端对端的解决方案，这个框架是NVIDIA真正的价值。

构建加速计算生态

为实现其目标，NVIDIA从企业/行业合作伙伴、开发者、开源技术、初创企业等方面构建其技术生态系统，并将中国市场置于最重要海外市场的位置。

Shanker Trivedi介绍了NVIDIA面向未来的整体策略。

NVIDIA非常强调要与教育界，特别是大学研究机构，开展广泛的交流和合作，因为他们是位于研究未来最前沿的。NVIDIA目前在全世界大概和600多所大学有相应的合作，希望借此了解最前沿的研究人员面临什么样的问题，他们的问题越有挑战性，NVIDIA的兴趣就越大，NVIDIA的工程师也会和他们一起去解决问题。
NVIDIA和开发者群体做很多的沟通，比如经常举办开发者研讨会等，帮助他们更好地理解GPU，介绍NVIDIA有什么样的工具和技术，面临的问题可以怎样利用GPU来解决等。有时候NVIDIA会收到这些开发者的感谢信，关于NVIDIA和他们的交流以及技术的讲解，帮助他们解决了很大的问题等。
产品层面的部署，除了在基础的GPU产品上有CUDA编程环境，针对一些专门的领域，NVIDIA也有相应的产品，如神经网络方面的cuDNN，虚拟GPU方面的vGPU，科学计算方面的cuFFT，针对天气、医疗、金融等其他方面的一些应用领域，NVIDIA也会有相应的产品，提供给所在具体领域的公司使用。

HPC应用是需要加速计算的典型，GPU+CUDA已经在发挥作用，在目前TOP10的HPC应用中，已有9款支持GPU加速，如果按照TOP50的HPC应用来看，其中有35款已支持GPU加速。加速视觉计算和普通的计算不一样，现在还有很多新出现的应用程序无法支持加速计算。NVIDIA希望不仅能够对已有应用程序的进行加速计算，更希望能够帮助支持到新应用程序。NVIDIA加入到OpenPOWER，希望能够有更大的生态系统，来为基于POWER的应用程序进行加速的客户提供服务。出于这样一种兴趣，NVIDIA与IBM结成伙伴关系，直接把GPU加速计算提供给整个的OpenPOWER的成员。这和NVIDIA之前针对x86处理器所开展的工作类似。未来，NVIDIA还可能针对其它的平台处理器开展类似的合作。

对技术合作伙伴的考量，NVIDIA重点考虑三个要素。

对方的工作是不是非常有意义，并且与NVIDIA具有技术互补性。
要有很强的工程能力。
非常多的数据。因为要进行数据研究，首先要有大量的可用数据。

例如，NVIDIA和美国的国家科学计算应用中心有很多合作，也非常喜欢和他们合作，因为他们解决的是世界上最难的一些问题，如气候变化、基因测序、个性化医疗，以及天气物理等非常复杂的问题；NVIDIA和西门子医疗有很多的合作，因为他们的工程能力非常强，对医疗健康及整个医学的认识程度是非常深的，NVIDIA和他们之间的合作非常愉快；和阿里巴巴的合作，NVIDIA也是看到了他们工程师的能力非常强（支撑了他们双十一、双十二的交易平台），相信NVIDIA可以从他们那里学到很多东西，他们也可以从NVIDIA学到一些东西。

支持开源

NVIDIA具有拥抱开源的传统，即便是vGPU，NVIDIA也有一个针对于开源的SDK，有些公司就是利用NVIDIA这个SDK实施的开源。Shanker Trivedi谈到了一个基本宗旨：对于在数据中心生态系统中实现加速计算普遍化有意义的开源项目，NVIDIA都会去支持。

除了vGPU SDK，支持Linux，以及之前做的Ganglia、LSF平台等一系列的开源项目，NVIDIA目前也正在开展KVM、Docker、Mesos等开源项目，并在网站上给开发者提供如何在GPU上使用Docker的用户指南。Shanker Trivedi相信这些项目会增加对数据中心加速计算的生态系统的支持。现在，Docker用户指南已成为NVIDIA网站下载量排行前几位的文档。

当然，开源是技术而不是解决方案，对于企业来说，他们还需要相应的支持，所以，NVIDIA公司也会全力提供企业级的支持。

扶持初创企业

从一家非常小的初创企业起家，NVIDIA了解初创企业的需求和潜力，认为初创企业最重要的是保持创新力，能够进行前沿产品的开发，并为此开展针对初创企业的工作。Shanker Trivedi列举了四个方面的例子。

新兴企业峰会。NVIDIA有一个新兴企业峰会，这是一个有竞赛性质的国际论坛，针对那些在加速视觉计算方面做得最好的新兴企业，当他们的展示成果胜出，NVIDIA会给予十万美元的奖励，在每年的GPU技术大会（GTC）上进行最终的颁奖。NVIDIA也把新兴企业峰会的概念带到了更多的初创企业聚集的地方，包括在英国伦敦，在以色列特拉维夫，中国上海，去年在北京，NVIDIA都举办过类似的活动。
加速计算云化。对初创企业来说，他们可能资金有限，要想完全投资自己的系统比较困难，那NVIDIA会和一些云服务商携手，像中国的阿里云，像IBM的云服务部门等，从而使得这些小企业可以用从云端获取服务的方式，来进行加速计算，应用在高性能计算，人工智能等或者其他的一些应用领域。
市场对接。初创企业在市场销售方面也是需要一些帮助的，NVIDIA也在帮助初创企业寻找市场方面，开展了一些工作，比如说帮助这些初创企业去对接对他们产品有需求的一些大企业等，这种例子，在美国市场，在中国市场都有，通过帮助初创企业对接一些潜在客户，来帮助他们增加收入。
开发者社区。NVIDIA开发者项目里的开发者，他们可以抢先使用一些NVIDIA最新推出的技术，并在社区中交流他们在技术开发，代码开发等方面的经验，使得参与者能够保持前沿的创新性。

深耕中国市场

NVIDIA进入中国市场已经很长时间，包括在游戏领域，在高性能计算领域，NVIDIA在中国建立GPU教育中心，也已经有七年左右的时间。Shanker Trivedi谈到，中国具有从芯片到系统、集成、虚拟化、数据库、中间件应用的强大生态链，BAT、搜狐、网易、优酷土豆、京东等众多的大型互联网企业，以及浓厚的创业文化，尤其是图形图像、视频方面，出现了Face++、格灵深瞳、衣+（Dress+）等在深度学习、计算机视觉方向创业的公司，这些只有在美国才有可能看到，基于互联网的商业模式创新甚至领先于美国。基于此，NVIDIA将中国视为美国之外最重要的国家。

在中国，NVIDIA有相当强的研发工程能力，NVIDIA非常支持“技术应更多依赖于本地研发，而不是依靠进口”的理念。NVIDIA一直以来也是在继续坚持助力中国本地的研究机构、大公司、创业公司、系统供应商等利用GPU来开展创新。

据Ashok Pandey介绍，在教育和科研机构合作这一方面，包括开发和研究，NVIDIA在中国做了很多的工作，包括合作建立三个GPU卓越中心12个GPU研究中心，25个GPU教育中心。除此之外，在本地合作伙伴方面，曙光、浪潮、华为等，包括一些大客户，都是NVIDIA的服务器、云服务的合作伙伴，在技术、新产品研发方面做了很多的合作。包括GRID软件，不仅支持VMware和Citrix，也支持华为。

推动POWER+GPU加速计算的模式方面，NVIDIA与OpenPOWER联盟的众多中国成员，比如曙光、浪潮、中太数据和位于苏州的软视软件（Zoom）等，都在积极的开展合作联系。

布局物联网

针对未来的物联网，除了已有的神经网络、科学计算方面的产品外，NVIDIA还有专门用来采集传感器数据进行应用的一些产品。不久之前,NVIDIA推出了一个叫做Jetson TX1的开发平台，它是针对像小型的机器人、智能摄像头、智能传感器、海底油气勘探平台等小装置的产品。Jetson TX1所使用的CUDA编程环境，和数据中心当中所使用的Tesla是同样的架构，都是用CUDA进行编程，这样就可以在物联网的边缘端点，形成Tesla+Tegra的一个组合，一个在物联网边缘，一个在物联网核心。Shanker Trivedi认为，这对于物联网，也是一个非常合适的架构。

总结

在HPC、深度学习领域，NVIDIA Tesla GPU加速器和CUDA平台已经发挥重要作用，例如商汤科技以2000多片NVIDIA作为核心竞争力之一，而在IoT、VR领域，NVIDIA也已经进行相应的研发。和前沿研究机构、大小本土企业以及不同技术类型的技术合作，让NVIDIA技术的先进性、实用性、普适性具有依据，但以相同的技术架构加速技术、简化编程，才是其技术能够在行业应用中落地的最重要保证。