GPU和CPU的区别

设计目标
CPU:处理各种不同的数据类型,同时又要逻辑判断又会引入大量的分支跳转和中断的处理
GPU:处理类型高度统一的、相互无依赖的大规模数据,不需要被打断的纯净的计算环境





GPU的主要参数解读

  • 显存占用
  • GPU利用率


核心(显示芯片)
性能好坏直接决定了显卡性能的好坏
主要任务就是处理系统输入的视频信息并将其进行构建、渲染等工作

核心频率
显示核心的工作频率
其工作频率在一定程度上可以反映出显示核心的性能

显存位宽
显存在一个时钟周期内所能传送数据的位数
位数越大则瞬间所能传输的数据量越大
显存的重要参数之一

显存频率
指默认情况下,显存在显卡上工作时的频率,以MHz(兆赫兹)为单位
显存频率一定程度上反应着该显存的速度
显存频率随着显存的类型、性能的不同而不同

显存大小
当模型越大或者训练时的批量越大时,所需要的显存就越多。

FLOPS
每秒浮点运算次数(亦称每秒峰值速度)是每秒所运行的浮点运算次数(英语:Floating-point operations per second;缩写:FLOPS)的简称,被用来估算电脑性能,尤其是在使用到大量浮点运算的科学计算领域中。

计算公式
MAX_FLOPS = cuda_cores * ((no of mul-add units*2) + ( no of mul units)) * clock speed in Hertz
no of mul-add units: ALU,计算乘法和加法,一秒可以执行一次乘法和一次加法
no of mul units: floating point unit, FPU, 一秒可以执行一次乘法

pytorch中使用GPU

  1. 模型转为cuda
  2. 数据转为cuda
  3. 输出数据去cuda,转为numpy

1+2

3

本主流GPU的选择

天梯排名

截止到 2020 年 2 月份,只有以下这几种 GPU 可以训练所有业内顶尖的语言和图像模型:
RTX 8000:48GB 显存,约 5500 美元
RTX 6000:24GB 显存,约 4000 美元
Titan RTX:24GB 显存,约 2500 美元
以下 GPU 可以训练大多数 SOTA 模型,但不是所有模型都能:
RTX 2080Ti:11GB 显存,约 1150 美元
RTX 1080Ti:11GB 显存,约 800 美元(二手)
RTX 2080:8GB 显存,约 720 美元
RTX 2070:8GB 显存,约 500 美元

性价比的角度

要你喜欢

最佳GPU:RTX 2070
避免的坑:所有Tesla、Quadro、创始人版(Founders Edition)的显卡,还有Titan RTX、Titan V、Titan XP
高性价比:RTX 2070(高端),RTX 2060或GTX 1060 (6GB)(中低端)
穷人之选:GTX 1060 (6GB)
破产之选:GTX 1050 Ti(4GB),或者CPU(原型)+ AWS / TPU(训练),或者Colab
Kaggle竞赛:RTX 2070
计算机视觉或机器翻译研究人员:采用鼓风设计的GTX 2080 Ti,如果训练非常大的网络,请选择RTX Titans
NLP研究人员:RTX 2080 Ti
已经开始研究深度学习:RTX 2070起步,以后按需添置更多RTX 2070
尝试入门深度学习:GTX 1050 Ti(2GB或4GB显存)

GPU概述_CodingPark编程公园相关推荐

  1. 数据分析调研报告_CodingPark编程公园

    文章结构速览 关系梳理 数据挖掘:从海量数据中找到隐藏的规则,数据分析:待分析的目标比较明确 数据分析更侧重业务,一般分析的目标比较明确,重点在观察数据,得出结论: 数据挖掘更侧重技术,利用统计学/机 ...

  2. 命名实体识别_CodingPark编程公园

    基本概念 概述 命名实体 文本中有一些描述实体的词汇.比如人名.地名.组织机构名.股票基金.医学术语等,称为命名实体.具有以下共性: 数量无穷.比如宇宙中的恒星命名.新生儿的命名不断出现新组合. 构词 ...

  3. 人工智能中神经网络与自然语言处理共生关系_CodingPark编程公园

    文章目录 神经网络知识大串联 1:第一代的神经元模型 3 2:从M-P模型到感知器模型 3 3:前馈神经网络 3 4:后向传播与BP算法神经网络 4 5:深度神经网络DNN 4 6:卷积神经网络CNN ...

  4. Gensim库生成与导入W2V模型_CodingPark编程公园

    Gensim库生成与导入W2V模型 语料目录 gensim函数库Word2Vec配置参数 gensim.models.word2vec.Word2Vec(sentences=None,size=100 ...

  5. Linux压缩|解压_CodingPark编程公园

    文章介绍 本文主要介绍: Linux的基础参数 Linux压缩 Linux解压缩 基础参数 tar - 5大参数 -c:压缩 -x:解压 -t:查看内容 -r:向压缩归档文件末尾追加文件 -u:更新原 ...

  6. anaconda-navigaotr出现adding featured channels并无法正常打开_CodingPark编程公园

    问题 navigator无法打开.停在adding featured channels状态下. 解决 在mac终端下更新navigator 输入 conda install navigator 即可解 ...

  7. 谈谈池化吧!_CodingPark编程公园

    引子 下采样和池化应该是包含关系,池化属于下采样,而下采样不局限于池化,如果卷积 stride=2,此时也可以把这种卷积叫做下采样. 池化 通常池化层紧跟在 CNN 的卷积层之后. 池化方法: max ...

  8. 词性标注_CodingPark编程公园

    基本概念 什么是词性 在语言学上,词性(Par-Of-Speech, Pos )指的是单词的语法分类,也称为词类.同一个类别的词语具有相似的语法性质,所有词性的集合称为词性标注集.不同的语料库采用了不 ...

  9. NLP高频面试_CodingPark编程公园

    NLP高频面试 1.LSTM 画图,写公式 计算一层的参数量 假设lstm层的一个时间点上的输入特征长度是n,输出长度是m, 那么参数量是4*((n+m)*m+m) https://www.cnblo ...

最新文章

  1. 【sql】实现分页查询
  2. springboot打成jar后获取classpath下的文件
  3. Linq 集合处理(Union)
  4. Could not generate DH keypair 解决方案
  5. 【转】ABP源码分析三十二:ABP.SignalR
  6. python中的文件数据保存
  7. 利用melendy插入参考文献_四苯基卟啉在改性磷酸锆层间的插入及荧光增强
  8. solaris mysql_配置Solaris下自带的MYSQL
  9. 【李宏毅2020 ML/DL】P1 introduction
  10. python测试脚本截图_Python+selenium实现截图图片并保存截取的图片
  11. 【正则表达式】正则表达式
  12. java自学之路-day19
  13. dart 语言中的列表(List)
  14. torch 深度学习(5)
  15. 扇贝有道180930每日一句
  16. soapui连接oracle,myeclipse 安装soapui插件
  17. Z-Stack 的应用层参数修改
  18. linux查看指定目录下各个文件大小以及总体大小
  19. 3D数学基础:正交矩阵
  20. PLSQL-Developer工具

热门文章

  1. matlab矩阵处理实验二,实验二MATLAB矩阵分析与处理
  2. Linux教程——操作系统是什么,操作系统概述
  3. objdump(Linux)反汇编命令使用指南
  4. 深入浅出TCP四次挥手 (多图详解)
  5. Android中的资源
  6. 高校物联网专业如何设置课程
  7. 7-2 N阶楼梯上楼问题 (15分) C++
  8. php %3f,url=http%3A%2F%2Fbbs.byr.edu.cn%2Fpc%2Findex.php%3Fid%3Dgootyking  豆瓣音乐humanSmall站...
  9. 我的2021年总结,从大专生到本科生。
  10. zadig安装部署接入k8s集群、ldap、jenkins、gitlab、项目配置管理、yaml模板管理