Nvidia Tesla P100 性能评测
GTX 1080/1070虽然性能很强悍,但它们在全新的帕斯卡家族中只能算是中档水准,真正的大杀器是顶级大核心GP100,拥有3840个FP32单精度、1920个FP64双精度CUDA核心,主要面向高性能计算领域。
担任首发的Tesla P100(似乎也叫Tesla P1),只开启了3584个单精度、1792个双精度核心,即便如此单、双精度浮点性能也高达10.6TFlops、5.3TFlops,同时还搭配了4096-bit 16GB HBM2高带宽显存,并支持全新的NVLink互连总线,取代传统PCI-E。
NVIDIA Tesla P100
那么它到底性能如何呢?圣地亚哥超级计算中心的Scott Le GrandRoss Walker、亚马逊网络服务的Scott Le Grand联合编写了一个通用计算测试工具AMBER,可模拟生物分子周围的力场,并与NVIDIA合作对Tesla P100进行了一番测试,包括单路、双路、四路。
由于测试所用硬件还是工程样品,操作系统是Linux,而且测试工具和测试方法是专门为了考察纯粹计算性能而设计的,所以结果反映的只是纯计算能力,和游戏表现无关。
事实上,GP100核心应该永远不会出现在消费级领域,GTX 1080 Ti、GTX Titan X 2之类的顶级卡会使用GP102。
参与对比的产品中,Tesla M40基于麦克斯韦架构大核心GM200,3072个流处理器,单精度性能突破7TFlops,双精度只有0.21TFlops,搭配384-bit 12GB GDDR5显存。
Tesla K80使用的是两个开普勒架构大核心GK210,4992个流处理器,单双精度浮点性能8.74、2.91TFlops,搭配两组384-bit 12GB GDDR5。
Tesla K40的核心是GK110,2880个流处理器,单双精度浮点性能4.29、1.43TFlops,搭配384-bit 12GB GDDR5。
GTX 1080、Titan X、980 Ti、980也都加入了对比,另外还有几颗纯CPU,包括双路的E5-2697 v4/2698 v3/2650 v3,分别有32/32/20个核心。
具体测试原理、流程啥的就不多说了,专业性太强,只简单看看结果:
相比于前辈M40,P100的计算性能提升相当猛,绝大部分项目都在50%左右,少数甚至超过80%,有的甚至接近100%!
事实上在大部分时候,单路P100都能干掉双路M40,领先幅度10-20%不等。
对比消费级游戏卡,P100单路已经相当于GTX Titan X四路的水准,也可以看到GTX 1080同样十分凶猛,多数情况下都达到或者接近M40的水平,但不够稳定,有时候相当于单块Titan X,有时候超过人家两块。
最遗憾的是,NV-Link总线的威力还没有发挥出来,双路、四路P100的提升幅度普遍还不如PCI-E。
原文链接
Nvidia Tesla P100 性能评测
更多推荐
百度开启燎原计划并启动AI加速器,打造自己的AI平台
英特尔联合脸谱, 正在开发人工智能芯片
利用人工智能回答员工的重复性问题,Spoke获得2800万美元融资
算法交易的神经网络:强化经典策略
三星重仓“物联网智能”,扩大AI朋友圈
本文为ATYUN(www.atyun.com)编译作品,ATYUN专注人工智能。
Nvidia Tesla P100 性能评测相关推荐
- tesla p100 linux,Tesla P100怎么样?NVIDIA Tesla P100计算卡性能首发评测
Nvidia在之前的GTC大会上正式发布了全新一代的计算卡Tesla P100,这也是世界上首款采用Pascal架构的计算卡,那么对于这么一块计算卡来说,它的性能如何呢?下面就详情来看看相关评测吧! ...
- NVIDIA Tesla® P100 加速训练 OCR 模型
案例简介 本案例中,今始科技(Linkface)是一家专注从事计算机视觉研究的科技创新型公司.该公司利用NVIDIA Tesla P100极大的加速了OCR模型的训练过程,显著降低了训练时间,对整 ...
- 在VMware ESXi 6.7中配置NVIDIA Tesla P100直通
宿主机设备环境 制造商:Supermicro 型号:SYS-4028GR-TR CPU:20 CPUs x Intel(R) Xeon(R) CPU E5-2630 v4 @ 2.20GHz 内存:: ...
- tesla p100 linux,NVIDIA Tesla P100计算卡性能首测:震撼地球!
GTX 1080/1070虽然性能很强悍,但它们在全新的帕斯卡家族中只能算是中档水准,真正的大杀器是顶级大核心GP100,拥有3840个FP32单精度.1920个FP64双精度CUDA核心,主要面向高 ...
- 基于ubuntu16.04操作系统安装tensorlfow-gpu版(GPU板卡:nvidia tesla P100)
一.Tensorflow-gpu安装需要 根据tensorflow-gpu版本的软件要求: [注意]NVIDIA GPU drivers 需要与CUDA对应 CUDA 9.0 https://deve ...
- IBM推出云深度学习图形芯片Tesla P100 GPU加速器
IBM加大云托管服务力度,日前宣布推出Nvidia 的Tesla P100 图形处理器(GPU),成为在云里提供Tesla P100 图形处理器的第一大云提供商. IBM在旗下的云平台上推出Tesla ...
- Tesla P100
特色与介绍 将人工智能应用于自动驾驶汽车,预测未来气候,研发治疗癌症的新型药物,这些都是如今需要克服的全球重大挑战,但是,必须进行海量的计算才能实现相应目标.当今的数据中心依赖大量互连的通用计算节点, ...
- 新款IBM POWER8通过NVLINK与Tesla P100互联
近日在GTC CHINA 2016大会上, NVIDIA与IBM共同宣布最新合作项目,全新 POWER8 家族将通过NVLINK与NVIDIA Tesla P100实现强势组合.NVIDIA的科技在I ...
- 新款IBM POWER8服务器通过NVLINK与Tesla P100互联
在日前举行的GTC CHINA 2016大会上, NVIDIA与IBM共同宣布最新合作项目,全新 POWER8 家族将通过NVLINK与NVIDIA Tesla P100实现强势组合.NVIDIA的科 ...
最新文章
- 计算机系演员表,爱来的刚好演员表 爱来的刚好演员角色介绍
- Java项目:在线考试系统(java+springBoot+vue+Mysql+maven)
- (七十)Xcode5及以上对于状态栏和导航栏样式的设定方法
- 数据共享如何改变世界_做个手活就改变世界了?论“手工木匠”如何改变了西方文明(3)...
- mysql中union与union all的区别
- ant构建项目迁移到gradle_Gradle构建工具
- Compass样式重置
- matlab哈宁低通,Matlab实现电网谐波测量加窗插值算法.pdf
- android java.rmi不存在_ANDROID_HOME'环境变量设置为不存在的路径Jenkins
- 2016百度之星复赛 1003 拍照 优先队列
- 电脑锁屏按什么键解锁_锁屏键除了锁屏还能干什么?这 6 个 App 带你玩转手机实体键...
- 手写java通用curd_还在手写CRUD代码?这款开源框架助你解放双手!
- 环信小程序 Demo源码发布,让你的小程序聊起来
- 数学物理中希腊字母的手写体笔顺及写法
- 飞鸽传书——空号检测
- 区块链技术从入门到精通教程
- poi操作Excel给列设置下拉菜单(数据验证)
- 十进制转换为二进制(短除法)
- 一种高效查找树-radix的实现
- 有没有一瞬间不想活了?
热门文章
- 实时可视化大数据项目02 -- 项目目录介绍
- 为此计算机所有用户安装此项,windows已经阻止此软件因为无法验证发行者,教您提示win已阻止此软件因为无法验...
- WebView调用微信H5支付
- 网络安全学习(十四)IP协议
- 功能篇------android 实现“摇一摇”功能
- MATLAB面向对象_及_AppDesigner使用
- 苹果系统版本依次顺序_iphone所有型号上市顺序
- windows录屏_录屏软件:如何录制游戏视频?简单方法了解下
- 缺省(默认)端口参数
- 关于渲染帧率(FPS)的问题