什么是CUDA和CUDNN?——GeForce NVIDIA显卡用于深度学习计算的GPU加速工具
1、什么是CUDA?
CUDA的概念
- 统一计算架构CUDA(Compute Unified Device Architecture)是为了让nvidia gpu可以完成通用计算任务的一种集成技术 ,通常可以使用的cuda框架有c,c++,fortran,python,java的,可以为数据大吞吐量的工作提供很好的加速功能。
- CUDA包括驱动,sdk,toolkit等。主要是用来进行计算加速,作为协处理器来进行使用 。同时cuda有很多的库 ,如cublas,cufft等计算库,在用于科学计算和人工智能领域 都有很好的加速效果。
- nvidia推出的cuda,也只有nvidia GPU有最优的效能,nvidia整个软硬件生态做的最好,现在几乎所有深度学习框架都首选cuda作为底层加速库 ,所以没得选只能用CUDA了。
- 有了cuda,可以让pytorch等框架直接在gpu上运行,速度更快
RTX光追系统和CUDA的关系?
- 之前买显卡的时候被安利,GTX1060没有光追系统,只有RTX2060及以上的系列才有,虽然不打游戏,然后光追跑深度学习也要用balabla的。
- 然而实际上,并没有直接关系。英伟达2018发布会上发布的新一代GPU架构——图灵(Turing),以及基于该架构设计的GPU——Quadro RTX系列 ,支持了两项全新的技术。分别是光线追踪(DXR)和深度学习超级采样(DLSS)。
- 光追(DXR)全程光线追踪 ,简单来讲就是一项渲染技术,它能够追踪画面里每一条光线的位置并进行计算,来渲染出更加趋近于真实的光影效果。
- Tensor Core是专为深度学习而设计的处理器 ,可用于AI计算,支持每秒500万亿次张量运算。这些新功能包括DLAA(深度学习抗锯齿),DLSS(超级采样抗锯齿)以及去噪、分辨率缩放和视频调速。
CUDA和CUDNN的关系?
- CUDA是在驱动之上提供给软件开发人员的一个编程库,现在多应用在并行计算等科学和工程研究领域。
- 还有一个叫做cudnn,是针对深度卷积神经网络的加速库。
2、如何使用CUDA
1、CUDA官网下载:
https://developer.nvidia.com/cuda-downloads
环境变量中可以酌情考虑添加
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.2\lib\x64
2、CUDA版本查看
打开控制面板,或者Win+S进行搜索,进入NVIDIA控制面板 。
系统信息中可以看到CUDA的版本。
3、判断自己是否成功安装:
cmd中输入
nvcc -V
3、如何使用CUDNN
1、CUDNN官网下载
https://developer.nvidia.com/rdp/cudnn-archive
2、下载完后安装
把 C:\Users<username>\Downloads\cuda\bin\cudnn64_7.dll 复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\bin
把 C:\Users<username>\Downloads\cuda\include\cudnn.h 复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\include
把 C:\Users<username>\Downloads\cuda\lib\x64\cudnn.lib 复制到 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.0\lib\x64
3、判断自己是否安装成功
import tensorflow as tf
import os
os.environ['TF_CPP_MIN_LOG_LEVEL']='2'
print(tf.__version__)
a = tf.constant(1.)
b = tf.constant(2.)
print(a+b)
print('GPU:', tf.test.is_gpu_available())
提示各种dll库找不到
Could not load dynamic library ‘cudart64_110.dll’;
Could not load dynamic library ‘cublas64_11.dll’;
Could not load dynamic library ‘cublasLt64_11.dll’;
Could not load dynamic library ‘cufft64_10.dll’;
Could not load dynamic library ‘curand64_10.dll’;
Could not load dynamic library ‘cusolver64_11.dll’;
Could not load dynamic library ‘cusparse64_11.dll’;
Could not load dynamic library ‘cudnn64_8.dll’;
附一张用开GPU优化跑的小数据MNIST的优化效果,快了将近两倍
什么是CUDA和CUDNN?——GeForce NVIDIA显卡用于深度学习计算的GPU加速工具相关推荐
- 没有Nvidia(英伟达)显卡对深度学习计算的影响
有很多电脑使用的都是集成显卡,而进行深度学习大都需要英伟达的显卡,那么没有Nvidia的显卡会有什么影响呢? cuda 提到深度学习cuda是一个绕不开的概念,CUDA(Compute Unified ...
- Ubuntu16.04 安装配置深度学习配置:GPU加速 Cuda+cudnn+opencv+caffe
目录 一. 电脑配置: 二. 安装过程 1.安装相关依赖项 2.安装NVIDIA驱动 一,下载安装驱动法 二.终端直接下载安装驱动法. 3.安装CUDA 4.配置cuDNN 5.安装opencv3.1 ...
- cuda, cudnn的升级,各种深度学习库的安装
新版本的tensorflow和keras已经要求cudnn v6了,并且将来会升级到cuda9 和 cudnn7. cudnn7最大的特点是支持group convolution, 这里原先的环境是 ...
- Linux和Windows系统下:安装Anaconda、Paddle、tensorflow、pytorch,GPU[cuda、cudnn]、CPU安装教学,以及查看CPU、GPU内存使用情况
Linux和Windows系统下安装深度学习框架所需支持:Anaconda.Paddlepaddle.Paddlenlp.pytorch,含GPU.CPU版本详细安装过程 1.下载 Anaconda ...
- Centos集成GTX-1080Ti显卡搭建深度学习环境全过程
Centos集成GTX-1080Ti显卡搭建深度学习环境全过程 在一个由N多台普通的不能再普通的机器攒凑起来的机箱中,搭载了最强核心--NVIDIA GeForce GTX 1080 Ti.我们的深度 ...
- 深度学习双显卡配置_linux(manjaro) tensorflow2.1 conda cuda10 双显卡笔记本深度学习环境搭建...
linux(manjaro) tensorflow2.1 conda cuda10 双显卡笔记本深度学习环境搭建 下学期要学tensorflow,看着我可怜的1050ti,流下了贫穷的泪水,但无奈要做 ...
- Ubuntu18 安装nvidia驱动进行深度学习训练
Ubuntu18 安装nvidia驱动进行深度学习训练 安装nvidia驱动 驱动不兼容而造成系统循环登录的解决方案 安装cuda 安装cudnn 下载anacoda3 找不到conda命令的解决方法 ...
- 深度学习 训练吃显卡_深度学习小钢炮攒机心得:规避一些你看不到的坑
------------------- 已经2017年了,从90年代初的品牌机流行,90年代末的组装机流行,2000-2010桌面级逐渐被移动PC/Mac取代,一直到现在移动终端大行其道,攒机似乎已经 ...
- 深度学习中的GPU与CUDA
对应视频教程:https://www.bilibili.com/video/BV1S5411X7FY/ 文章目录 1. 显卡(GPU)与驱动 2. 显卡与CUDA 3. 如何查看自己的显卡 1. 显卡 ...
最新文章
- Manage Jenkins管理界面提示“依赖错误: 部分插件由于缺少依赖无法加载...“问题解决办法
- 请求的转发:RequestDispatcher对象处理请求的两个方法--forward和include
- python编程入门----numpy不常见的小细节
- 如何使用Idea导入jar包
- 多人麻将源码 html5,新版大众麻将 H5版
- java正则表达式yyyymmdd_日期正则表达式yyyyMMdd
- 四旋翼飞行器结构和原理
- ssh框架的基本运用
- 麦客CEO李卉:实践证明肯钻营的“小而美”亦动人|企服三会系列报道
- java编程找出吸血鬼数字,找出四位數的所有吸血鬼數字(JAVA)
- 思维导图工具之Mindmeister
- Visual Studio 2008 (vs 2008)简体中文专业版、团队版及SP1下载地址
- 【HomeAssistant接入的设备实现天猫精灵】
- python idle快捷键
- [ pikachu ] 靶场通关之 XSS (一) --- 概述
- 闽南歌歌词有一句电子计算机,抖音wow you can really dance下一句是什么歌 歌词全文...
- java 循环里声明变量赋值_在Java中声明变量外部Foreach循环
- 天下手游卡在获取服务器信息,天下手游军资获取方法 获取和使用经验分析
- CentOS查看版本及架构信息
- 什么是无人值守机房防盗系统、无人值守基站远程监控系统?
热门文章
- Week 7 - Distributional Representations(分布表示)
- 耳机接口规则_耳机接口种类与标准
- Web网页制作——花店网站(彼岸の花 偏安一隅)
- 平面设计中的简约设计到底指什么?
- linux内存不足解决办法
- Go :运行linkx测试(附完整源码)
- 2021年金属非金属矿山(露天矿山)安全管理人员考试题及金属非金属矿山(露天矿山)安全管理人员考试技巧
- win8“400 bad request”能登QQ,无法上网解决办法d
- 手机建站系统php,zzzcms免费开源建站系统含手机
- Franka Emika 机械臂在ROS下控制