新一届高性能计算大会召开,中国的“天河二号”勇夺全球超级计算机性能四连冠,各大厂商也都趁机纷纷推出了各自的重磅新品。

先来看NVIDIA的怪物级计算卡:Tesla K80

Tesla K系列都是基于“开普勒”(Kepler)架构的高性能计算产品,其中采用GK110大核心的已有三款,而今天这款Tesla K80,从各个方面都进行了前所未有的增强。

首先,她的核心是新的GK210。

GK110核心第一次用于高性能计算是Tesla K20,只开启了2496个流处理器,经过一次修订后升级为GK110B,先后推出了2688个流处理器的增强版Tesla K20X、2880个流处理器的完整版Tesla K40,后者还提供了三个档次的核心频率。

GK210则是NVIDIA第一次对某个核心进行中途修改,最大的变化就是寄存器文件、一级缓存容量都翻了一番,分别来到512KB、128KB,不过整体架构没变,还是2880个流处理器、384-bit位宽,制造工艺也依然是台积电28nm,但晶体管数量理论上应该比71亿个更多了。

寄存器文件、一级缓存增大后,可以明显改进流处理器阵列内的数据吞吐能力,工作更高效,尤其适合高性能计算。这显然是一次针对性的重新设计。

可怕的是,Tesla K80一次就用了俩GK210核心,而上次的双芯计算卡还是Tesla K10,当时用的是俩小核心GK104。

不过可以理解的是,如此庞大的两个核心很难全速开动,每一个都只开启了15组流处理器阵列中的13组,也就是总共2496×2=4992个流处理器,相当于Tesla K20翻了一番。

核心频率也定得很低,只有562MHz,但是第一次支持GPU Boost动态加速了,最高可达875MHz。显存是两组384-bit 12GB GDDR5,总计达24GB,但频率也不是很高,只有5GHz。

这一切都是出于功耗的妥协。Tesla K20X/K20已经达到235W,而双芯的Tesla K80在一番折腾后,仍控制在了300W,并且保持了双插槽的身材,但需要使用被动散热,由系统风扇带走热量,主动散热版暂时没有。

性能方面自然可期,官方宣称FP32单精度、FP64双精度浮点性能最高分别可达8.74TFlops(万亿次浮点)、2.91TFlops(比例还是1:3),比此前提高了74%,但这只是最大加速理论性能,实际上会低一些。

1U标准机架内可以放入最多四块Tesla K80,双精度性能可超10TFlops。

根据情况不同,Tesla K80的效率提升幅度最好59%,最差2%。

Tesla K80的售价高达5000美元,但其实比单芯Tesla K40 5500美元的首发价格便宜了很多,不过后者现在已经降至3900美元。

目前,全球性能第十的Cray CS-Storm,以及戴尔、惠普、广达的高性能计算系统都已经配备了Tesla K80。

NVIDIA Tesla K80:怪物般的双芯计算卡相关推荐

  1. 多块英伟达K80显卡linux安装,ubuntu14.04下NVIDIA Tesla K80 、GTX1080顯卡驅動以及Tensorflow、Python的安裝教程...

    目錄 1 安裝NVIDIA Tesla K80顯卡驅動 1.1 准備工作 1.1.1 證明存在GPU lspci | grep -i nvidia 結果例示 01:00.0 VGA compatibl ...

  2. NVIDIA Tesla® K80 加速 数字全息实时重建

    案例简介  本案例中,重庆淏晗科技有限公司是由重庆理工大学创办的高科技企业.该公司利用利用丽台科技提供的包含Tesla K80 GPU服务器以及算法优化方案实现了微流体内粒子的三维位置与速度场的实时 ...

  3. ubuntu14.04下的NVIDIA Tesla K80显卡驱动的安装教程

    搞深度学习如何能够不与浑身是"核"的显卡打交道呢? 人工智能的兴起除了数据量的大量提升,算法的不断改进,计算能力的逐步提高,还离不开软件基础设施的逐步完善.当下的主流的深度学习工具 ...

  4. ESXI 6.7 环境 centos7.6 虚拟机安装tesla k80 显卡驱动失败问题解决

    ESXI 6.7 环境 16.04虚拟机安装tesla k80 一切正常,但虚拟机重装了centos7.6后,驱动一直安装失败,报错如下: 换了多个驱动版本,问题依然存在.安装时指定 --no-ker ...

  5. tesla p100 linux,Tesla P100怎么样?NVIDIA Tesla P100计算卡性能首发评测

    Nvidia在之前的GTC大会上正式发布了全新一代的计算卡Tesla P100,这也是世界上首款采用Pascal架构的计算卡,那么对于这么一块计算卡来说,它的性能如何呢?下面就详情来看看相关评测吧! ...

  6. Nvidia发布全新计算卡Tesla P40/P4

    在北京召开的GTC 2016技术大会上,NVIDIA CEO黄仁勋亲自发布了新一代高性能计算卡Tesla P40.Tesla P4,专为人工智能.深度学习.神经网络推演而生! 这两款产品将取代上代麦克 ...

  7. tesla p100 linux,NVIDIA Tesla P100计算卡性能首测:震撼地球!

    GTX 1080/1070虽然性能很强悍,但它们在全新的帕斯卡家族中只能算是中档水准,真正的大杀器是顶级大核心GP100,拥有3840个FP32单精度.1920个FP64双精度CUDA核心,主要面向高 ...

  8. Nvidia发布顶级计算卡 Tesla V100!

    在GTC 2017大上,NVIDIA正式发布了史上最强大的"核弹"–旗舰计算卡Tesla V100.Tesla V100是基于Volta架构的产品,内置了5120个CUDA单元,核 ...

  9. linux驱动K10运算卡,NVIDIA TESLA K10 GPU 运算卡 K20 C2075 C2050

    测评 数据 FeaturesTesla K10Tesla M2090Tesla M2075Tesla M2070-Q Number and Type of GPU2 Kepler GK104s1 Fe ...

最新文章

  1. android studio 常量表达式错误
  2. 性能SOTA、适用多种类型物体,国防科技大学单张RGB-D图像预测物体对称性
  3. linux 进程参数文件 /proc/pid/cmdline 简介
  4. codevs 2879 堆的判断
  5. java集合类根接口:Collection和Map
  6. arcgis server账号需要设置地图缓存的访问权限
  7. Selenium with Python 001 - 安装篇
  8. 《学习Opencv》第五章 习题6
  9. apache配置mpm_worker
  10. 计算机组成原理中断实验的分析,计算机组成原理_中断实验.pdf
  11. 手把手写深度学习(3)——用RNN循环神经网络自动生成歌词之理论篇
  12. suparc服务器没信号,SupARC街机对战平台
  13. java合并果子_合并果子(经典优先队列)
  14. pythonds模块_python之模块
  15. 707. 设计链表(中等 链表)
  16. GDSOI2019退役祭
  17. Python- sklearn之最小二乘法
  18. 计算机音译英语单词,汉语谐音英文单词
  19. 检验方法的验证、确认步骤及详细计算方法
  20. select函数是怎么用的

热门文章

  1. 2019年宁波顶岗实习
  2. 好书推荐,电子人的入门好书
  3. 中国计算机专业的大学生相比于美国差在哪里?
  4. python遍历循环和无限循环结构_Python --- 程序的循环结构
  5. 电商行业前景怎么样?
  6. Java 性能优化实战工具实践:如何获取代码性能数据?
  7. 双目立体视觉(3)- ZED2 ROS Melodic 发布RGB图像及深度信息
  8. 信息化时代,,生产制造管理系统该具备哪些功能?
  9. Django models 筛选不等于
  10. 【渝粤教育】国家开放大学2018年春季 3894T理工英语1 参考试题