一，桌面端显卡天梯图

显卡天梯图主要是根据传统光栅性能排名的

1，疑问？为什么显卡天梯图里没有丽台T4，v100

因为显卡天梯图只是针对桌面端，桌面端只是针对玩游戏的消费级用户
术业有专攻。对于消费级用户来说，GPU就是玩游戏，对于专业人员来说，GPU是计算工具，俗话说，一分钱一分货。

1.1消费级用户：使用消费级显卡，GeForce产品

对于消费级用户来说GPU的浮点计算能力可以忽略不计，因为日常应用根本涉及不到，所以追求性价比的消费级用户，不会为没用的高双精度浮点运算能力买单。而对于专业领域来说，准确性是计算结果的重要指标，双精度浮点运算能力直接影响计算的准确性和时效性。
GeForce产品对于计算精度要求比较低，也许对于普通用户来说，即使发现一些数据下次也会忽略不计，比如显存错误，而专业计算卡比如Tesla V100对数据准确性和及时错误数据修正能力都非常依赖。其他方面还有诸如针对专业软件的针对性的GPU加速优化、显存的配备方面都有明显的不同。

链接：https://www.zhihu.com/question/459070453/answer/1892126063

1.2专业人员：使用专业计算卡，NVIDIA Tesla V100

专业计算卡比如Tesla V100对数据准确性和及时错误数据修正能力都非常依赖。其他方面还有诸如针对专业软件的针对性的GPU加速优化、显存的配备方面都有明显的不同。说到NVIDIA Tesla V100，它采用的是NVIDIA Volta™架构，是科学计算和人工智能时代的理想计算引擎。从语音识别到训练虚拟个人助理和教会自动驾驶汽车自动驾驶，数据科学家们正利用人工智能解决日益复杂的挑战。解决此类问题需要花大量时间密集训练复杂性飞速增长的深度学习模型。V100 拥有 640 个 Tensor Core，是世界上第一个突破 100 万亿次 (TFLOPS) 深度学习性能障碍的 GPU。新一代 NVIDIA NVLink 以高达 300 GB/s 的速度连接多个 V100 GPU，在全球打造出功能极其强大的计算服务器。现在，在之前的系统中需要消耗数周计算资源的人工智能模型在几天内就可以完成训练。随着训练时间的大幅缩短，人工智能现在可以解决各类新型问题。

2 使用fp16 混合精度训练？什么是双精度，单精度和半精度？

浮点数是计算机上最常用的数据类型之一，有些语言甚至数值只有浮点型（Perl，Lua同学别跑，说的就是你）。

常用的浮点数有双精度和单精度。除此之外，还有一种叫半精度的东东。

双精度64位，单精度32位，半精度自然是16位了。

半精度是英伟达在2002年搞出来的，双精度和单精度是为了计算，而半精度更多是为了降低数据传输和存储成本。

很多场景对于精度要求也没那么高，例如分布式深度学习里面，如果用半精度的话，比起单精度来可以节省一半传输成本。考虑到深度学习的模型可能会有几亿个参数，使用半精度传输还是非常有价值的。

Google的TensorFlow就是使用了16位的浮点数，不过他们用的不是英伟达提出的那个标准，而是直接把32位的浮点数小数部分截了。据说是为了less computation expensive。。。

参考链接：https://blog.csdn.net/sinat_24143931/article/details/78557852

参考链接：
https://blog.csdn.net/qq_33221533/article/details/111473678?spm=1001.2101.3001.6650.7&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-7-111473678-blog-78557852.pc_relevant_aa2&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7EBlogCommendFromBaidu%7Edefault-7-111473678-blog-78557852.pc_relevant_aa2&utm_relevant_index=11

gpu是否支持fp16

fp16和fp32区别？

FP32 是单精度浮点数，4个字节，32个bit，1bit表示符号，8bit 表示指数，23bit 表示小数。
FP16 半精度浮点数，2个字节，16个bit，1bit表示符号，5bit 表示指数，10bit 表示小数。
fp16作用

加载训练，同时减少显存的使用

3，TFLOPS是什么单位

TFLOPS是floating point operations per second每秒所执行的浮点运算次数的英文缩写。
它是衡量一个电脑计算能力的标准。最后面的S是秒的意思，最前面的T是个常量。1P=1024T 1T=1024G 1G=1024M 1M=1024K 这里的TFLOPS就是每秒运算能力为1T＝10的12次方
1TFLOPS等于1万亿次浮点指令
TFlops/s，可以简单写为T/s，是数据流量的计数单位，意思是”1万亿次浮点指令每秒”，它是衡量一个电脑计算能力的标准。1TFlops=1024GFlops，即1T=1024G。
浮点运算是指浮点数参与的运算，这种运算通常伴随着因为无法精确表示而进行的近似或舍入。浮点运算是计算机编程中很重要的一部分。浮点运算就是实数运算，因为计算机只能存储整数，所以实数都是约数，这样浮点运算是很慢的而且会有误差。
一个 MFLOPS (megaFLOPS) 等于每秒1百万 (=10^6) 次的浮点运算，
一个 GFLOPS (gigaFLOPS) 等于每秒10亿 (=10^9) 次的浮点运算，
一个 TFLOPS (teraFLOPS) 等于每秒1万亿 (=10^12) 次的浮点运算，
一个 PFLOPS (petaFLOPS) 等于每秒1千万亿 (=10^15) 次的浮点运算。

显卡天梯图vs专业计算卡丽台T4，v100vs混合精度训练相关推荐

ResNet实战：单机多卡DDP方式、混合精度训练
文章目录摘要 apex DP和DDP Parameter Server架构(PS模式) ring-all-reduce模式 DDP的基本用法 (代码编写流程) Mixup 项目结构计算mean和s ...
a卡 n卡 html5性能,装机之家显卡天梯图2019年12月独显A卡和N卡性能排行一目了然...
显卡对于游戏玩家至关重要,但是小白在选购显卡总是存在一个最大的选购误区,那就是以显卡显存容量来判断一款显卡的性能好坏,因为决定一款显卡的性能好坏主要是架构.流处理器.核心频率.显存带宽.显存位宽.显存 ...
【玩耍】 NVIDIA 历代显卡提升自制显卡天梯图
闲来无聊从TechPowerUp和PassMark收集了NV 400系到20系,X60到旗舰(双芯核弹忽略)的性能提升,样本不多,数据肯定有一些误差,整理后的表格,大概是这样.. 红色数据表示两个Be ...
adreno性能天梯图_显卡如何看性能好坏？2020年1月2月显卡天梯图性能排行榜
转眼间来到了2020年,祝愿大家鼠年大吉,发发发!工作顺利,事事顺心!万事如意!而今天装机之家晓龙依然带来了显卡天梯图更新,这次更新,加入了AMD家的RX5500XT,不过RX 5500不知是什么原因 ...
adreno性能天梯图_显卡之间如何对比性能好坏？2020年4月5月显卡天梯图性能排行榜...
对于游戏玩家,显卡的重要性要高于CPU,独立显卡的选购十分重要,而选择显卡总是纠结A和N卡,不知道哪款显卡芯片强,但是我们可以通过显卡天梯图来对比显卡之间的性能差异.那么显卡之间如何对比性能好坏?下面 ...
adreno性能天梯图_显卡如何看性能好坏？2020年1月-2月显卡天梯图性能排行榜
转眼间来到了2020年,祝愿大家鼠年大吉,发发发!工作顺利,事事顺心!万事如意!而今天装机之家晓龙依然带来了显卡天梯图更新,这次更新,加入了AMD家的RX5500XT,不过RX 5500不知是什么原因 ...
mx350显卡天梯图_2020最新显卡高清天梯图
我们在选购电脑整机或者是组装电脑的时候一定会去挑选电脑的设备部件.那么对于游戏玩家来说除了CPU之外,重要的就是我们的显卡了吧.一块好的显卡可以让我们在游戏的过程中画画面显示更加流畅,不掉帧不卡顿.另 ...
显卡天梯图:2014最新显卡性能天梯图
随着电脑游戏的推广,很多用户都喜欢上了电脑网络游戏,所以组装电脑用户在装机的时候,会考虑电脑配置的游戏性能,要提高电脑配置游戏性能首要条件就是显卡性能要强,如果显卡性能不佳,那么其它方面性能再强,玩大 ...
mx250显卡天梯图_笔记本电脑显卡分析（天梯图）
注:重新更新,2020年笔记本显卡变化比较大的是很多主流轻薄全能本配置了MX350,其他变化不大. 当前笔记本主流显卡有(同时按性能排名):集显Intel UHD Graphics 620<MX ...
gtx1660是什么级别的_显卡天梯图秒懂GTX1660Ti性能 GTX1660Ti相当于什么显卡
GTX1660Ti是NVIDIA二月份刚发布的一款显卡,从命名上看,它是历代英伟达显卡中,最"6"的显卡,名称中包含了3个6字.作为上一代甜品级GTX1060的继任者,而颇受关注. ...

显卡天梯图vs专业计算卡丽台T4，v100vs混合精度训练

显卡功课