博主在硬件设备方面还是个小白,近日想要知道深度学习应当选用哪些显卡,其性能如何?且网络上能搜到的GPU天梯图似乎都停留在以装机选配为目的的个人级别上,于是在本站试图搜索相关文章或者排行,看到有不少博主搬运了NVIDA发布的一系列表格,比如:

GPU运算能力对比(详细)https://blog.csdn.net/edward_zcl/article/details/100099353?spm=1001.2101.3001.6650.1&utm_medium=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1-100099353-blog-119384400.pc_relevant_default&depth_1-utm_source=distribute.pc_relevant.none-task-blog-2%7Edefault%7ECTRLIST%7Edefault-1-100099353-blog-119384400.pc_relevant_default&utm_relevant_index=2nullhttps://blog.csdn.net/chigusakawada/article/details/80198970

这一系列文章的博主几乎都是搬运了相关表格,部分博主也加入了一些自己的评价或感受,但这一系列博客看下来给人一种理所应当的感觉:“文章中衡量GPU所使用的计算能力(Compute Capability)指标越大越好,相关GPU指标之间有合理、可靠的排名意义”

以下是表格部分摘录:

GPU Compute Capability
Tesla K80 3.7
Tesla K40 3.5
NVIDIA A100 8.0
NVIDIA A40 8.6
NVIDIA A30 8.0
NVIDIA TITAN X 6.1
GeForce GTX 1080 Ti 6.1
GeForce GTX 750 5.0
GeForce GTX 560 Ti 2.1

隐隐约约感觉有点不对劲,比如,虽然Tesla K40确实不是很强的卡,但是这个表格里面它的能力比GTX750差了那么大一截吗?

感谢相关博主在搬运表格时几乎都能够标出表格来源,于是我顺藤摸瓜找到了NVIDIA发布的原始数据网址:https://developer.nvidia.com/cuda-gpus

点进去一看,数据倒是没有在搬运的时候发生错误,不过网页上特地提示用户去看Compute Capability的定义

点开之后发现,Compute Capability的定义和想象中还真有些区别,它不是直接用某些计算速度等量化指标来决定数值的,而是以类似于版本号的机制来决定的;

感兴趣的朋友可以亲自去这里看看https://docs.nvidia.com/cuda/cuda-c-programming-guide/index.html#compute-capability

The compute capability of a device is represented by a version number, also sometimes called its "SM version". This version number identifies the features supported by the GPU hardware and is used by applications at runtime to determine which hardware features and/or instructions are available on the present GPU.

设备的计算能力由版本号表示,有时也被称为“SM版本”。这个版本号标识了GPU硬件支持的特性,并被应用程序在运行时用来确定当前GPU上哪些硬件特性和/或指令可用。

The compute capability comprises a major revision number X and a minor revision number Y and is denoted by X.Y.

计算能力包括一个大版本号X和一个小版本号Y,用X.Y表示

Devices with the same major revision number are of the same core architecture. The major revision number is 8 for devices based on the NVIDIA Ampere GPU architecture, 7 for devices based on the Volta architecture, 6 for devices based on the Pascal architecture, 5 for devices based on the Maxwell architecture, 3 for devices based on the Kepler architecture, 2 for devices based on the Fermi architecture, and 1 for devices based on the Tesla architecture.

具有相同主版本号的设备具有相同的核心架构。主要版本号为 :

8 用于基于NVIDIA Ampere GPU架构的设备

7 用于基于Volta架构的设备

6 用于基于 Pascal架构的设备

5 用于基于Maxwell架构的设备

3 用于基于Kepler架构的设备架构

2 个用于基于Fermi架构的设备

1 个用于基于 Tesla的设备建筑学。

The minor revision number corresponds to an incremental improvement to the core architecture, possibly including new features.

次要修订号对应于对核心架构的增量改进,可能包括新功能。

Turing is the architecture for devices of compute capability 7.5, and is an incremental update based on the Volta architecture.

ps:博主对GPU了解不多,上标中的主版本序号1-8对应的核心架构的实际性能水平也是大致与数字大小呈正关系吗?请各位大神赐教

原来,这个所谓的“计算能力”是基于技术面的分析,一般可以认为,随着技术和架构的进步,对计算能力有一定的帮助,而且同系列的新卡一般都因为采用新技术而比旧卡好,但这并不绝对;

另一个问题在于,同样的核心架构、同样的增量改进号,对应到这里的GPU的“计算能力”指标是相同的,但很显然在这张表上相同指标的某些GPU之间的性能差距还是有较明显的差别,比如:

GPU Compute Capability
Quadro P500 6.1
Tesla P4 6.1

总结:

NIVIDA显卡计算能力表被多位博主转载,并且缺乏对表格指标定义的相关说明,容易让读者产生误解;经过搜索与整理资料,得到结论:该表一定程度上反映了显卡的运算速度,但并不是绝对按照数值大小区分性能的依据——大的架构版本差异之间的显卡对比明显,同一架构内的显卡比对意义不大;GPU的实际性能除了其采用的技术架构外,其芯片工艺等级、运算单元数量、“挤牙膏”的进度等其它因素有时候也会对其造成显著影响,故大家应当正确认识“NIVIDA显卡计算能力表”,不要把表中的数值当成性能的绝对指标。

较真:认真解读“NVIDA CUDA显卡计算能力表”相关推荐

  1. NVIDA CUDA显卡算力对照表

    来源:https://developer.nvidia.com/cuda-gpus ![Quadro显卡计算能力 cuda和显卡版本对应关系

  2. NVIDA CUDA显卡计算能力 GeForce RTX 2060 compute_capability

    2060的计算能力:compute_capability = 750,GPU: GeForce RTX 2060 下图为在测试训练数据时 打印的日志

  3. NVIDA CUDA显卡计算能力对应表

    来自;https://developer.nvidia.com/cuda-gpus 1) CUDA-Enabled Tesla Products Tesla Workstation Products ...

  4. 怎么用显卡计算_初试CUDA,入门显卡实现两千倍加速

    众所周知,Nvidia的CUDA计算平台可以实现数量惊人的并行运算,因此受各个流行的机器学习框架青睐.为了尝试人工智能,我最近组装了一台机器,配备了一块入门级的GeForce GTX 1060显卡. ...

  5. cuda第一次计算耗时_CUDA优化的冷知识10 | GPU卡和Jetson上显存优化的特色

    这一系列文章面向CUDA开发者来解读<CUDA C Best Practices Guide> (CUDA C最佳实践指南) 大家可以访问: 这是一本很经典的手册. CUDA优化的冷知识| ...

  6. Nvidia GPU信息nvidia-smi(Persistence-M持久性内存、Volatile Uncorr. ECC显存错误校正、GPU-Util显卡利用率、Compute M.显卡计算模式)

    文章目录 ubuntu20.04 nvidia-smi指令信息 C:\Users\SIQI>cd C:\Program Files\NVIDIA Corporation\NVSMIC:\Prog ...

  7. NVIDA CUDA

    Ubuntu服务器上的NVIDA CUDA 2017年11月3日 ubuntu server nvidia 在上一篇有关在Ubuntu上进行以太坊挖矿的文章中,我最后指出要获得NVIDIA的CUDA驱 ...

  8. HighNewTech:带你解读云计算、雾计算(Fog Computing)、边缘计算(Edge Computing)的前世今生

    High&NewTech:带你解读云计算.雾计算.边缘计算的前世今生 目录 云计算 CC核心技术 CC分类 雾计算(Fog Computing) 与CC比较 边缘计算(Edge Computi ...

  9. mtensor一个tensor计算库,支持cuda延迟计算

    1 mtensor mtensor是一个tensor计算库, 支持cuda的延迟计算, 项目地址为https://github.com/matazure/mtensor. 2 背景 延迟计算具有避免额 ...

最新文章

  1. CRichEdit小记
  2. 嵌入式开发有年龄限制吗_2021年考监理工程师有年龄限制吗?女生可以考监理工程师吗?...
  3. 苹果服务器修改主目录就打不开,苹果应用商店又挂了 App Store打不开怎么修复...
  4. ASP.NET Core的身份认证框架IdentityServer4(3)-术语的解释
  5. java基础-public/private/protected的具体区别
  6. 异步爬虫-aiohttp库、Twisted库简介
  7. TOMCAT8 设置 请求超时时间 和 最大连接数
  8. 软考软件设计师中级考试(二)——操作系统基本原理
  9. 惠普打印机,打印状态:需要注意,打印时显示:需要用户干
  10. python求平方函数图像_求平方 python
  11. html链接屏蔽了,js屏蔽广告/屏蔽网站元素/屏蔽网站超链接
  12. mongoDB 注册成开启自启动项
  13. 概率统计Python计算:学生分布分位点计算
  14. win10从旧的固态硬盘迁移系统到新的固态硬盘,开机黑屏LOGO处转圈,并启动不了,已解决,特写此贴,供急需解决该问题的有缘人参考!
  15. C++记录程序运行时间5大方法
  16. 保持青春的秘诀是有一颗不安份的心zz
  17. html调用wifi热点,笔记本如何做wifi热点
  18. 墨水屏(电子纸)刷新模式
  19. TOPPRA 时间优化算法的轨迹规划安装记录
  20. SaaS/大数据2019十大新闻出炉:我们不是“孤胆英雄”!

热门文章

  1. 存储过程拆分Patents表Inventor字段逗号分隔字符串
  2. 如何利用安卓手机运行JAVA代码?
  3. html5 围住神经猫,围住神经猫4步攻略 玩法技巧详解
  4. 服务和控制器应用CPU占用过高问题
  5. Rose2003执行出现 -2147417848 (80010108)#39;:Automation 错误
  6. 计算机考研复试面试常问问题 计算机网络篇(上)
  7. Python + Pyglet 视频播放器 日志 #1
  8. 什么企业可以申报高新技术企业
  9. asp:ScriptManager
  10. 合肥市直计算机知识pdf,事业单位计算机基础知识题库(全).pdf