中国HPC领域盛会2015年全国高性能计算学术年会(HPC China 2015)今日在无锡开幕。全球视觉计算的行业领袖NVIDIA®(英伟达™)及应用其GPU的众多企业和科研机构,带来近20场报告和演讲,针对GPU的最新技术以及GPU在科学计算、大数据分析、深度学习乃至自动驾驶汽车领域的应用和创新,做了深度解读和分享。随着深度学习爆发式发展,GPU成为HPC 领域受关注的焦点。

在大会首日上午的特邀报告中,NVIDIA解决方案工程架构副总裁Marc Hamilton提到:“在NVIDIA的推动下,过去7年间整个加速计算领域获得了10倍的增长,NVIDIA的GPU加速器占据了加速器市场85%的份额。同时在GPU的驱动下全球和中国都掀起了深度学习热潮,GPU也已成为深度学习研究的首选技术平台。此次大会我们非常高兴地看到GPU帮助了众多企业和研究机构在HPC和深度学习领域实现大量创新应用,相信我们将于明年面世的下一代GPU架构Pascal和NVLink高速互联技术,将为数据中心和深度学习提供更加强大的加速动力。”

“后摩尔定律”时代 GPU提供强大加速动力

计算核心并没有越来越快,只不过处理器正朝着并行化的方向发展。如今我们已步入了“后摩尔定律时代”,处理器单线程性能的增速放缓,逻辑核心数量则在不断增加,由CPU和加速器构成的加速计算体系,成为整个计算领域的必然趋势。

目前,加速器发展势头迅猛,自2010年到今天的短短几年时间,全球超级计算机TOP 500榜单中采用加速器的系统就已经达到90台。同时,最常用的50款HPC应用中有70%已支持加速器加速。

NVIDIA在整个加速计算领域中居于主导地位,其推出的Tesla GPU加速器和CUDA®并行计算架构,在过去7年中引领了加速计算领域10倍以上的增长,例如支持CUDA的应用数量从27款增长至334款,Tesla GPU加速器的使用量从6,000个增加至45万个,占据整个加速器市场85%的份额。

2008年全球首台GPU超级计算机即由Tesla GPU加速器驱动,随后几年内Tesla GPU加速器更成就多台顶级超级计算机,例如美国的泰坦系统。而当前美国基于Tesla GPU加速器正构建两台新一代超级计算机高峰和峰峦,将距离百亿亿次级计算目标更近一步。

NVIDIA的Tesla GPU加速器还在2013年帮助科学家实现重大突破,首次确定了HIV"病毒衣壳"的准确化学结构。而如果不使用GPU,则需要5倍的处理器规模才能达到近似的性能;Tesla GPU加速器还可显著提升成本效益,例如谷歌大脑系统在使用Tesla加速器后,性能提升到之前的6倍,而能耗却从原先的600千瓦降低到4千瓦。

高密度GPU服务器也已成为主流,Cray、DELL、HP以及Quanta都已推出支持Tesla GPU加速器的产品,可为HPC客户提供直接、完整的解决方案。

围绕Tesla GPU加速器和CUDA并行计算架构,NVIDIA推出了Tesla加速计算平台,专门针对大数据分析与科学计算领域的密集型计算需求,构建了一个由软件开发者、软件供应商以及数据中心系统OEM厂商组成的综合生态系统。Tesla平台可为高性能计算专业人士提供所需的工具,使其能够在数据中心轻松地打造、测试和部署加速的应用。

当前Tesla加速计算平台的最新旗舰是Tesla K80双GPU加速器,它可提供最快的数据分析和科学计算性能,被众多对计算有较高要求的企业和研究机构列为首选升级方案。Tesla K80拥有带宽极高的24GB内存、高达8.74TFlops的单精度峰值浮点性能和高达2.91 TFlops的双精度峰值浮点性能。在数百款HPC应用中,Tesla K80比当今最快CPU快10倍。

得益于优秀的性能表现,Tesla K80已开始在全球得到广泛应用。瑞士联邦气象气候局利用基于Tesla K80的超级计算机,将气象模型解析度和能源使用效率分别提升到之前的两倍和三倍。同时,Tesla K80也在各项超算大赛中发挥重要优势,帮助清华大学先后在今年ASC和ISC两次超算大赛中获得总冠军。也因此让Tesla GPU加速器公认成为在超算大赛中获得优胜的首选加速方案。

作为能够让开发人员轻松为应用实现GPU加速的并行编程标准,NVIDIA一直推动其在HPC领域中的普及,并促进其在更多的加速器平台和CPU架构上的应用。目前全球已经有超过8,000名研究人员在采用OpenACC。NVIDIA在今年推出的OpenACC工具包可以帮助开发人员快速利用OpenACC实现应用加速;在上月末推出的新增对x86多核CPU的OpenACC支持的新版PGI加速器编译器,让开发者能够对基于OpenACC的源代码进行编译,使其可以在多核CPU或GPU加速器上并行执行,为开发者带来巨大的灵活性。

硬件架构的升级也将进一步推动HPC行业的发展,将随NVIDIA下一代GPU架构Pascal一同到来的NVLink高速互联技术可以为超级计算机内CPU和GPU之间、以及GPU和GPU之间的数据传输带来现有PCI-Express总线5倍的带宽,最终的应用性能也将获得两倍以上性能提升,为数据中心和深度学习提供强大的加速动力。

可以说,GPU加速器彻底改变了高性能计算行业。

GPU掀起深度学习革命 助力全球多领域创新

深度学习如今成为HPC行业中一个爆发式增长的应用方向,大数据、算法的进步、强大的GPU加速,共同驱动了深度学习研究和应用热潮。诸如Adobe、百度、谷歌、Facebook、IBM等企业已成为深度学习领域的探索者和领导者,并在包括图像识别、人脸识别、语音识别、视频分析、语音识别和翻译、自然语言处理等方面促成了大量革命性的进展和创新,这些创新已被广泛应用于社交网络、安防和能源领域。

在医学研究领域,深度学习助力创造多项革命,例如乳腺癌细胞有丝分裂检测、药物发现领域的分子活动预测、预测新型药物的毒性,以及帮助科学家了解基于突变防止疾病。

在图像识别领域,以ImageNet大规模视觉识别挑战赛为例,GPU在2012年被首次应用即取得了突破性成绩,它帮助多伦多大学大幅提升了识别精度,将错误率从之前两年的28%和26%直接降低到了16%,也由此掀起了GPU加速深度学习的热潮。

作为深度学习研究技术平台领导厂商,NVIDIA先后推出了多项创新产品和技术,助力国内外各大企业实现创新应用,NVIDIA GPU也成为深度学习研究首选平台。

在硬件方面,得益于统一的GPU架构,从嵌入式到桌面再到HPC和云服务,NVIDIA可为不同的硬件平台均提供深度学习研究的支持。其中,Tesla K80即有针对深度学习任务的优化,在深度学习框架Caffe中,Tesla K80的速度更可以比CPU快上近24倍。

在软件方面,NVIDIA推出了DIGITS深度学习训练系统,它是首个专门用于图像分类的全功能图像系统,可用于设计、训练和验证深度神经网络,目前已推出最新的DIGITS 2可以充分利用多GPU扩展实现性能翻倍。NVIDIA还推出了cuDNN(CUDA深度神经网络库),让开发者可以将其集成到更高级的机器学习框架如Caffe、Torch、Theano中,这些框架均可充分利用GPU加速,帮助研究人员高效地训练更大、更复杂的神经网络。

NVIDIA还联合曙光、浪潮等HPC领域的众多合作伙伴,推动中国深度学习生态链的构建,助力中国企业在深度学习领域的创新。例如此次NVIDIA 展台展示的曙光XSystem深度学习产品,可为用户提供完整的软硬件一体化深度学习解决方案;NVIDIA与曙光、中科院计算技术研究所共建的深度学习与高性能计算联合实验室,将联合开展深度学习软硬件产品的开发和推广工作。

目前,基于NVIDIA GPU的深度学习平台已帮助谷歌、Facebook、阿里巴巴、百度、腾讯、京东、网易、科大讯飞、搜狗、爱奇艺等国内外知名企业实现创新研究和应用。例如,谷歌研究院利用GPU,在自动驾驶、智能交通领域关键技术行人检测方面实现了的性能与精度的双重飞跃;阿里云推出的中国第一个基于GPU计算的HPC云服务为诸多从事深度学习创新企业提供加速支持;百度研发的计算机视觉系统Deep Image和深度语音识别系统Deep Speech均在GPU的加持下实现了识别速度和精度的显著提高。

深度学习还促成了新一轮创业热潮,包括格林深瞳、旷视科技、图普科技、Linkface、轻搜、元趣、小猿搜题等新兴企业依托于NVIDIA GPU已开发出了大量的创新产品。

写在后面

NVIDIA无论在加速计算领域、HPC领域、深度学习研究技术领域、硬件方面以及软件方面都有着突出的贡献,并且NVIDIA还在积极推动着整个生态系统的构建,我相信在未来NVIDIA将会帮助更多的用户来满足在深度学习方面上的需求。

原文发布时间为:2015年11月10日

本文来自云栖社区合作伙伴至顶网,了解相关信息可以关注至顶网。

GPU驱动“后摩尔定律时代” 为HPC和深度学习提供强大加速动力相关推荐

  1. 后摩尔定律时代的计算机性能提升之道

    Version[1.00] <RISC-V 手册 一本开源指令集的指南>读后感 原著DAVID PATTERSON, ANDREW WATERMAN,翻译:勾凌睿.黄成.刘志刚 校阅:包云 ...

  2. win10+anaconda+cuda配置dlib,使用GPU对dlib的深度学习算法进行加速(以人脸检测为例)...

    win10+anaconda+cuda配置dlib,使用GPU对dlib的深度学习算法进行加速(以人脸检测为例) 转载于:https://www.cnblogs.com/zhehan54/p/8540 ...

  3. Ubuntu18.04 RTX2070 显卡驱动、Cuda、cudnn和Pytorch深度学习环境配置——亲测可用

    这篇博文的主要目的是记录我在Ubuntu18.04下配置深度学习环境的过程,方便自己以后配置的需求,也供大家参考,减少跳坑,虽然我主要是在Ubuntu18.04下实践的,但经过在Ubuntu16.04 ...

  4. GPU技术大会2020 NVIDIA GTC DLI 培训深度学习与人工智能大会

      NVIDIA GTC (GPU 技术大会) 2020 顶级 AI 盛会 NVIDIA GTC (GPU 技术大会) 是一系列全球盛会,广纳当今计算领域最热门话题的相关培训和见解,并为您创造与顶级专 ...

  5. 18 岁清华毕业,95后博士生杨幻睿将深度学习 “单核” 变“多核”,显著提高 “对抗性攻击” 防御力-1

    9 月 26 日,杜克大学陈怡然教授在微博秀出了组里博士生的成绩--杨幻睿同学的论文被 NeurIPS 评为最优的 Oral 级别,并不忘强调"还是家里领导最牛",狠狠向粉丝撒了一 ...

  6. 服务器指定gpu命令,用于亚马逊网络服务深度学习的10个命令行技巧

    在亚马逊网络服务CE2上运行大型深度学习进程是学习和开发模型的一种廉价有效的方法.你只需花费几美元就能够使用几千兆的内存,数十个CPU内核和多个GPU.我强烈推荐它.如果你敢接触到CE2或者Linux ...

  7. 后摩尔定律时代的芯片新选择!

    来源:gizmodo 摘要:很长一段时间以来,摩尔定律和它的最终结局一直就像房间里的大象,不容忽视.英特尔联合创始人戈登·摩尔在1965年的一篇论文中预测,芯片中的晶体管数量每年将翻一番. 更多的晶体 ...

  8. 重装Ubuntu(Linux)后快速搭建工作环境(深度学习环境)

    文章目录 准备 一.安装Filezilla 二.安装显卡驱动 1. 前期准备 2. 禁用nouveau 3.安装驱动 三.安装gnome-pannel 四.安装搜狗输入法 1. 下载搜狗输入法的安装包 ...

  9. GPU驱动及CUDA安装流程介绍

    安装前准备工作   确认GPU型号和操作系统版本   准备gpu驱动和CUDA软件包   在nvidia官网进行驱动包下载   GPU驱动下载链接    Linux系统均选择 Linux 64-bit ...

最新文章

  1. react useRef()函数
  2. django_rest_framework—路由器机制
  3. c++静态变量的生存期
  4. 【numpy】20道numpy题目
  5. Hibernate第十一篇【配置C3P0数据库连接池、线程Session】
  6. 难以理解的软件工程师:几千行代码能搞定为什么要写几万行?
  7. iconv 判断字符编码_php下用iconv函数转换字符编码的问题
  8. Android 系统(172)---如何使用addr2line命令解析native backtrace
  9. linux下-bash: ls: command not found
  10. 课时3:小插曲之变量和字符串
  11. 系统背景描述_【通用博世丨智能广播系统】新都芳华微马公园
  12. Adobe 字体显示不清楚----解决方案
  13. 华东师范数学分析第4版笔记和课后答案
  14. 广告学计算机平面设计(1)形考5,(更新版)国家开放大学电大专科《计算机平面设计(2)》网络课形考任务1-5答案.doc...
  15. python发邮件给多个人发送消息_python发送邮件(带附件)、发送给多人、抄送给多人的示例...
  16. PDF怎么转换成Word?来看这两个方法
  17. BZOJ 4199 品酒大会
  18. 毕达哥拉斯定理a^2 + b^2 =c^2
  19. 计算机管理没有Android手机项,电脑没有手机驱动各品牌解决办法
  20. uva 10977 Enchanted Forest 魔幻森林

热门文章

  1. 潭州课堂25班:Ph201805201 django 项目 第二十四课 文章主页 多级评论数据库设计 ,后台代码完成 (课堂笔记)...
  2. 【加密算法】Base64
  3. 【原创】 Boost序列化了解设计思想
  4. asp.net用户注销或者关闭网页时清除用户Cookie
  5. 诗与远方:无题(十)- 小熊夜游走廊记
  6. Storm集群安装Version1.0.1开启Kerberos
  7. 设计模式之单例模式的多重实现
  8. 导致出现404的原因以及解决方案
  9. 分析maven依赖导入失败原因
  10. 最大独立匹配_新车|升级柴油国六动力,配后排独立座椅,瑞风M5新车型上市...