GTX 1080/1070虽然性能很强悍,但它们在全新的帕斯卡家族中只能算是中档水准,真正的大杀器是顶级大核心GP100,拥有3840个FP32单精度、1920个FP64双精度CUDA核心,主要面向高性能计算领域。

担任首发的Tesla P100(似乎也叫Tesla P1),只开启了3584个单精度、1792个双精度核心,即便如此单、双精度浮点性能也高达10.6TFlops、5.3TFlops,同时还搭配了4096-bit 16GB HBM2高带宽显存,并支持全新的NVLink互连总线,取代传统PCI-E。

NVIDIA Tesla P100

那么它到底性能如何呢?圣地亚哥超级计算中心的Scott Le GrandRoss Walker、亚马逊网络服务的Scott Le Grand联合编写了一个通用计算测试工具AMBER,可模拟生物分子周围的力场,并与NVIDIA合作对Tesla P100进行了一番测试,包括单路、双路、四路。

由于测试所用硬件还是工程样品,操作系统是Linux,而且测试工具和测试方法是专门为了考察纯粹计算性能而设计的,所以结果反映的只是纯计算能力,和游戏表现无关。

事实上,GP100核心应该永远不会出现在消费级领域,GTX 1080 Ti、GTX Titan X 2之类的顶级卡会使用GP102。

参与对比的产品中,Tesla M40基于麦克斯韦架构大核心GM200,3072个流处理器,单精度性能突破7TFlops,双精度只有0.21TFlops,搭配384-bit 12GB GDDR5显存。

Tesla K80使用的是两个开普勒架构大核心GK210,4992个流处理器,单双精度浮点性能8.74、2.91TFlops,搭配两组384-bit 12GB GDDR5。

Tesla K40的核心是GK110,2880个流处理器,单双精度浮点性能4.29、1.43TFlops,搭配384-bit 12GB GDDR5。

GTX 1080、Titan X、980 Ti、980也都加入了对比,另外还有几颗纯CPU,包括双路的E5-2697 v4/2698 v3/2650 v3,分别有32/32/20个核心。

具体测试原理、流程啥的就不多说了,专业性太强,只简单看看结果:

相比于前辈M40,P100的计算性能提升相当猛,绝大部分项目都在50%左右,少数甚至超过80%,有的甚至接近100%!

事实上在大部分时候,单路P100都能干掉双路M40,领先幅度10-20%不等。

对比消费级游戏卡,P100单路已经相当于GTX Titan X四路的水准,也可以看到GTX 1080同样十分凶猛,多数情况下都达到或者接近M40的水平,但不够稳定,有时候相当于单块Titan X,有时候超过人家两块。

最遗憾的是,NV-Link总线的威力还没有发挥出来,双路、四路P100的提升幅度普遍还不如PCI-E。

标题八路Tesla P100

原文链接

Nvidia Tesla P100 性能评测

更多推荐

百度开启燎原计划并启动AI加速器,打造自己的AI平台

英特尔联合脸谱, 正在开发人工智能芯片

利用人工智能回答员工的重复性问题,Spoke获得2800万美元融资

算法交易的神经网络:强化经典策略

三星重仓“物联网智能”,扩大AI朋友圈

本文为ATYUN(www.atyun.com)编译作品,ATYUN专注人工智能。

请扫码或微信搜索ATYUN订阅号及时获取最新内容标题

Nvidia Tesla P100 性能评测相关推荐

  1. tesla p100 linux,Tesla P100怎么样?NVIDIA Tesla P100计算卡性能首发评测

    Nvidia在之前的GTC大会上正式发布了全新一代的计算卡Tesla P100,这也是世界上首款采用Pascal架构的计算卡,那么对于这么一块计算卡来说,它的性能如何呢?下面就详情来看看相关评测吧! ...

  2. NVIDIA Tesla® P100 加速训练 OCR 模型

    案例简介  本案例中,今始科技(Linkface)是一家专注从事计算机视觉研究的科技创新型公司.该公司利用NVIDIA Tesla P100极大的加速了OCR模型的训练过程,显著降低了训练时间,对整 ...

  3. 在VMware ESXi 6.7中配置NVIDIA Tesla P100直通

    宿主机设备环境 制造商:Supermicro 型号:SYS-4028GR-TR CPU:20 CPUs x Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz 内存:: ...

  4. tesla p100 linux,NVIDIA Tesla P100计算卡性能首测:震撼地球!

    GTX 1080/1070虽然性能很强悍,但它们在全新的帕斯卡家族中只能算是中档水准,真正的大杀器是顶级大核心GP100,拥有3840个FP32单精度.1920个FP64双精度CUDA核心,主要面向高 ...

  5. 基于ubuntu16.04操作系统安装tensorlfow-gpu版(GPU板卡:nvidia tesla P100)

    一.Tensorflow-gpu安装需要 根据tensorflow-gpu版本的软件要求: [注意]NVIDIA GPU drivers 需要与CUDA对应 CUDA 9.0 https://deve ...

  6. IBM推出云深度学习图形芯片Tesla P100 GPU加速器

    IBM加大云托管服务力度,日前宣布推出Nvidia 的Tesla P100 图形处理器(GPU),成为在云里提供Tesla P100 图形处理器的第一大云提供商. IBM在旗下的云平台上推出Tesla ...

  7. Tesla P100

    特色与介绍 将人工智能应用于自动驾驶汽车,预测未来气候,研发治疗癌症的新型药物,这些都是如今需要克服的全球重大挑战,但是,必须进行海量的计算才能实现相应目标.当今的数据中心依赖大量互连的通用计算节点, ...

  8. 新款IBM POWER8通过NVLINK与Tesla P100互联

    近日在GTC CHINA 2016大会上, NVIDIA与IBM共同宣布最新合作项目,全新 POWER8 家族将通过NVLINK与NVIDIA Tesla P100实现强势组合.NVIDIA的科技在I ...

  9. 新款IBM POWER8服务器通过NVLINK与Tesla P100互联

    在日前举行的GTC CHINA 2016大会上, NVIDIA与IBM共同宣布最新合作项目,全新 POWER8 家族将通过NVLINK与NVIDIA Tesla P100实现强势组合.NVIDIA的科 ...

最新文章

  1. 计算机系演员表,爱来的刚好演员表 爱来的刚好演员角色介绍
  2. Java项目:在线考试系统(java+springBoot+vue+Mysql+maven)
  3. (七十)Xcode5及以上对于状态栏和导航栏样式的设定方法
  4. 数据共享如何改变世界_做个手活就改变世界了?论“手工木匠”如何改变了西方文明(3)...
  5. mysql中union与union all的区别
  6. ant构建项目迁移到gradle_Gradle构建工具
  7. Compass样式重置
  8. matlab哈宁低通,Matlab实现电网谐波测量加窗插值算法.pdf
  9. android java.rmi不存在_ANDROID_HOME'环境变量设置为不存在的路径Jenkins
  10. 2016百度之星复赛 1003 拍照 优先队列
  11. 电脑锁屏按什么键解锁_锁屏键除了锁屏还能干什么?这 6 个 App 带你玩转手机实体键...
  12. 手写java通用curd_还在手写CRUD代码?这款开源框架助你解放双手!
  13. 环信小程序 Demo源码发布,让你的小程序聊起来
  14. 数学物理中希腊字母的手写体笔顺及写法
  15. 飞鸽传书——空号检测
  16. 区块链技术从入门到精通教程
  17. poi操作Excel给列设置下拉菜单(数据验证)
  18. 十进制转换为二进制(短除法)
  19. 一种高效查找树-radix的实现
  20. 有没有一瞬间不想活了?

热门文章

  1. 实时可视化大数据项目02 -- 项目目录介绍
  2. 为此计算机所有用户安装此项,windows已经阻止此软件因为无法验证发行者,教您提示win已阻止此软件因为无法验...
  3. WebView调用微信H5支付
  4. 网络安全学习(十四)IP协议
  5. 功能篇------android 实现“摇一摇”功能
  6. MATLAB面向对象_及_AppDesigner使用
  7. 苹果系统版本依次顺序_iphone所有型号上市顺序
  8. windows录屏_录屏软件:如何录制游戏视频?简单方法了解下
  9. 缺省(默认)端口参数
  10. 关于渲染帧率(FPS)的问题