英伟达公司已经推出了其Tesla P100加速芯片,采用PCIe卡形式且可接入标准服务器节点以支持人工智能与超级计算机级别的工作负载处理工作。

P100公布于今年4月在加利福尼亚州召开的英伟达GPU技术大会上:这款16纳米FinFET图形处理器在一块600平方毫米晶片上容纳有150亿个晶体管。其设计目标在于每秒实现万亿级别计算,适用软件包括神经网络训练以及天气与粒子模拟。这款GPU采用英伟达的Pascal架构,能够实现CPU与GPU之间的页面迁移。

每块P100包含4个每秒40 GB英伟达NVLink端口,分部接入GPU集群。NVLink为英伟达公司设计的高速互连机制。IBM公司的Power8+与Power9处理器皆支持NVLink,允许主机的Power CPU核心直接与各GPU相对接。

这些来自蓝色巨人的芯片主要服务于美国政府所拥有的各超级计算机及其它高负载设备。不过在民用领域,我们普遍使用x86处理器支撑后端工作负载。

时至今日,数据中心内的绝大部分计算处理器由英特尔公司提供;然而英特尔方面并不支持英伟达的NVLink,而且似乎也没有在这方面做出努力的计划。因此,英伟达方面拿出了自己的解决办法,即PCIe版本的Tesla P100卡,帮助服务器构建人员将加速处理器同其x86设备相结合。这意味着GPU能够通过NVLink实现彼此间的高速通信,同时经由PCIe总线接入主机CPU。

目前PCIe P100分为两种型号:其一HBM2堆栈内存为16 GB且内存传输带宽为每秒720 GB;其二成本更为低廉,HBM2内存为12 GB且内存传输带宽为每秒540 GB。二者皆采用PCIe gen-3 x 16通道以实现每秒32 GB传输能力。

二者在处理64位双精度运算与32位单精度运算时的持续性能水平分别为4.7万亿次与9.3万亿次;16位半精度运算则为18.7万亿次。这一水平略低于原始P100在双、单与半精度运算中的5.3万亿次、10.6万亿次与21万亿次。原因在于,PCIe卡的性能由于发热量的考虑而必须有所牺牲——毕竟我们不希望塞满了GPU加速节点的机架由于全力运转而被融化。

另外,NVLink P100的额定功率为300瓦,而其16 GB PCIe表亲的功率水平为250瓦,12 GB版本的功耗则更低。

顺带一提,如果大家希望在非NVLink服务器上使用全速、全功率Tesla P100,其实也是能够实现的:系统制造商能够在主机上添加PCIe gen-3接口,从而实现额外的性能提升。不过如果大家只希望使用PCIe,那么目前的低功耗、低性能PCIe选项已经非常理想。

“PCIe P100将成为主力系统——即大规模计算设备,”英伟达公司高级产品经理Roy Kim在接受采访时表示。他同时建议称,每个服务器节点可以接入4到8块该PCIe卡。

这些PCIe设备预计将在2016年第四季度正式推出,且面向克雷、戴尔、惠普、IBM以及其它英伟达合作伙伴发布。其最终定价将取决于经销商,但根据我们得到的消息,其价格会与目前的英伟达K80基本持平——后者的售价约为4000美元。

而在价值层面,英伟达方面告诉我们,P100 PCIe卡将在今年晚些时候作为欧洲各顶级超级计算机的构建组件,其中包括位于瑞士卢加诺国家超级计算中心的Piz Daint。
本文转自d1net(转载)

英伟达Tesla P100超级计算机组件全面登陆PCIe总线相关推荐

  1. 显卡吧超级计算机,残暴8路Tesla V100:NVIDIA 英伟达 发布 HGX-1 超级计算机

    五杀超神吧 NVIDIA STUDIO 设计师电脑主机渲染建模影视后期视频剪辑台式定制组装图形工作站 升级版1 i7 8700/RTX2060S 8G 五杀超神吧 NVIDIA STUDIO 设计师电 ...

  2. Colab笔记本能用英伟达Tesla T4了,谷歌的羊毛薅到酸爽

    谷歌出品的Colab笔记本,机器学习界薅羊毛神器,如今又有了新福利: 连英伟达最新一代机器学习GPU:Tesla T4都能免费蹭,穷苦羊毛党也顿时高端了起来. 英伟达的Tesla T4,是去年秋天才发 ...

  3. 英伟达Tesla T4 显卡编解码能力测试

    显卡基本参数: Timestamp : Fri Aug 27 10:04:12 2021 Driver Version : 460.32.03 CUDA Version 11.2 Attached G ...

  4. 英伟达 Tesla K80显卡驱动安装

    文章目录 准备驱动安装文件 安装过程中的问题 安装成功 准备驱动安装文件 到英伟达官网下载驱动文件,根据自己显卡型号进行选择,下载文件名为 *.run的文件. 更改驱动安装文件的属性 chmod +x ...

  5. 拯救顽疾大作战!IDC绘中国医疗AI生态图谱,英伟达献医疗影像新杀器

    来源:智东西 摘要:中国千家医院部署AI系统!IDC医疗AI报告详解行业趋势和五大药方. 2018年是令人唏嘘的一年,台湾作家李敖.动画大师高畑勋.相声表演艺术家师胜杰.央视主持人李咏.微软联合创始人 ...

  6. 本周AI热点回顾:百度推出全球首个mRNA疫苗不稳定性解决方案、性能提升20倍:英伟达GPU旗舰A100

    01 百度推出全球首个mRNA疫苗不稳定性解决方案LinearDesign 新冠疫情爆发后,RNA设计领域世界知名专家.斯坦福大学生物化学系Rhiju Das教授关注到疫苗研发存在的一个非常棘手的问题 ...

  7. 英伟达终于开源GPU内核模块代码

    作者 | 钰莹,核子可乐 内容来源:infoq 近日,英伟达(NVIDIA)宣布,将 Linux GPU 内核模块作为开放源代码发布.早在几天前,NVIDIA 开始在 GitHub 上陆续公开相关代码 ...

  8. GPU对决TPU,英伟达能否守住领先地位?

    作者 | James Wang, ARK 分析师 翻译 | shawn 一年的时间,股价增长两倍以上,创始人成为<财富>杂志2017年度商业人物,这家公司就是风头正劲英伟达(NVIDIA) ...

  9. 华为算力最强AI芯片商用:2倍于英伟达V100!开源AI框架,对标TensorFlow和PyTorch...

    乾明 边策 一璞 发自 凹非寺  量子位 报道 | 公众号 QbitAI 刚刚,华为业界算力最强的AI芯片正式商用. 并且宣布自研AI框架MindSpore开源,直接对标业界两大主流框架--谷歌的Te ...

最新文章

  1. R语言gc函数垃圾回收实战
  2. ppt批量缩略图_PPT如何在文件夹下显示缩略图的方法
  3. 拦截聊天记录--Hook技巧简介【原创】
  4. jmx JVM监测工具使用
  5. scrapy学习笔记(二)进阶使用
  6. 商品订单表怎么设计_三级分销系统系统设计
  7. PHP涟漪云-蓝奏云挂载直连下载程序源码
  8. redis应用之——关注、被关注
  9. golang 所有进程休眠_Golang基础--常见坑
  10. 如何快速在 Springboot 中集成拦截器? | 原力计划
  11. 用户登录自动注销问题
  12. (6)ASP.NET Core 中使用IHttpClientFactory发出HTTP请求
  13. 微信小程序源代码demo
  14. Python Roberts算子、Sobel算子——举例说明 ^_^
  15. 锁定计算机过久电脑自动关机,为什么电脑一锁定就会自动关机
  16. 中文数字阿拉伯数字相互转换(Java版本)
  17. 解决VS2010使用mscomm控件无法接收数据的问题
  18. 开吃吧无线订餐机 改变餐饮O2O外卖行业
  19. c++ 之deque
  20. Android 打包流程之aapt打包资源文件

热门文章

  1. iOS中UITextField 使用全面解析
  2. java 循环时间调用 程序(转)
  3. VC编写自己构造http协议数据的post上传图片类(MFC环境 带编码转换)(转)
  4. PTA(BasicLevel)-1007素数对猜想
  5. LCUI.css 0.1.2 发布, 基于 LCUI 开发的 UI 组件库
  6. 浅析微信支付:开发前的准备
  7. zookeeper+kafka集群部署+storm集群
  8. 关于Messenger实现进程间通信
  9. 太晚睡不着的落寞与开心(记近况)
  10. iOS开源项目周报0420