前言:

准备在实验室的一个服务器上用GPU的,但是这个服务器好久没有人用了,cuda还是10.0版本,需要重装cuda,嫌麻烦,然后发现Nvidia官网居然有anaconda安装CUDA的教程,所以考虑使用anaconda来做。

我是在Linux上安装的,但是理论上Windows和Linux用anaconda的部分是没有什么区别的。

安装好Anaconda和驱动的朋友可以直接跳到 安装cuda 的部分。

目录:

安装Anaconda:

安装Nvidia驱动:

安装cuda:

有一块GPU

检查Linux

有gcc compiler and toolchain

conda安装

验证CUDA安装是否成功

安装PyTorch

验证GPU是否能用

选修:

安装PyTorch-Lightning

安装TensorFlow


如果你的Anaconda、CUDA、Nvidia驱动全都安装好了,可以直接复制下面命令。没有的话,或者不确定的、或者想了解一下的可以往下看看

conda create -n python3.9 python=3.9 -y
conda activate python3.9
conda install cuda -c nvidia/label/cuda-11.3.0 -c nvidia/label/cuda-11.3.1 -y
conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch -ypython
import torch
print("cuda" if torch.cuda.is_available() else "cpu")

安装Anaconda:

这个教程太多啦,我就跳过了

安装之前还是建议新建一个虚拟环境,免得把base环境搞崩了,麻烦的要死。血和泪的教训啊!

安装Nvidia驱动:

我研究了半天为什么pytorch一直调用cuda失败,查了很多资料。我是万万没有想到,服务器上都有了cuda10.0了,居然还没有英伟达驱动。他们之前的人是没发现自己使用GPU失败了吗。。。

这个Windows上很简单啦,就自己解决一下

Linux上我是纯文本界面,参看的是这个:CentOS7服务器安装GPU显卡驱动和CUDA简单方法_Galaxy的博客-CSDN博客_centos安装gpu

不用手动编译什么的,还是挺简单的:

# 导入源
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh https://www.elrepo.org/elrepo-release-7.0-3.el7.elrepo.noarch.rpmyum install nvidia-detect
nvidia-detect
# 我的是kmod-nvidia# 安装
yum install $(nvidia-detect)# 重启
reboot#验证
nvidia-smi# 如下就是成功啦
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 470.94       Driver Version: 470.94       CUDA Version: 11.4     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:02:00.0 Off |                  N/A |
| 34%   36C    P8     7W / 257W |     18MiB / 11016MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------++-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|    0   N/A  N/A      1753      G   /usr/bin/X                          9MiB |
|    0   N/A  N/A      2329      G   /usr/bin/gnome-shell                6MiB |
+-----------------------------------------------------------------------------+

安装cuda:

详情可以看看英伟达的官网

具体步骤如下:

有一块GPU

lspci | grep -i nvidia

有输出基本上就ok啦,也可以去官网自己查一下自己的gpu支不支持。我的是一块2080Ti,就直接跳过了。

检查Linux

uname -m && cat /etc/*release

输出如下就ok

# 输出如下
x86_64
CentOS Linux release 7.9.2009 (Core)
NAME="CentOS Linux"
VERSION="7 (Core)"
ID="centos"
ID_LIKE="rhel fedora"
VERSION_ID="7"
PRETTY_NAME="CentOS Linux 7 (Core)"
ANSI_COLOR="0;31"
CPE_NAME="cpe:/o:centos:centos:7"
HOME_URL="https://www.centos.org/"
BUG_REPORT_URL="https://bugs.centos.org/"CENTOS_MANTISBT_PROJECT="CentOS-7"
CENTOS_MANTISBT_PROJECT_VERSION="7"
REDHAT_SUPPORT_PRODUCT="centos"
REDHAT_SUPPORT_PRODUCT_VERSION="7"CentOS Linux release 7.9.2009 (Core)
CentOS Linux release 7.9.2009 (Core)

有gcc compiler and toolchain

gcc --version

输出如下就ok

# 输出如下
gcc (GCC) 4.8.5 20150623 (Red Hat 4.8.5-44)
Copyright © 2015 Free Software Foundation, Inc.
本程序是自由软件;请参看源代码的版权声明。本软件没有任何担保;
包括没有适销性和某一专用目的下的适用性担保。

没有的话(CentOS):

yum install gcc gcc-c++ kernel-devel

conda安装

以下的步骤建议还是创建一个虚拟环境然后再来弄,免得搞崩base。

conda create -p /home/CV python=3.9 -y
conda activate /home/CV

直接conda install就ok了,但是下载的很慢。根据我的经验,要是你是在Windows上的话建议用cmd来弄,我总感觉anaconda prompt下载时间长了总是会自己结束了。我是服务器上面的,直接挂着就是了。

conda install cuda -c nvidia

指定版本:

conda install cuda -c nvidia/label/cuda-11.3.0
conda install cuda -c nvidia/label/cuda-11.3.0 -c nvidia/label/cuda-11.3.1

上面两个都是安装11.3版本,截至2021.12.16,CUDA最新版本已经到了11.5了,但是我看PyTorch只有 cudatoolkit 11.3的文件,所以保守起见我安装的是11.3。你也可以直接自己尝试一下11.5

验证CUDA安装是否成功

经过特别漫长的等待,测试一下安装是否成功

nvcc -V

我的输出如下:

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2021 NVIDIA Corporation
Built on Sun_Mar_21_19:15:46_PDT_2021
Cuda compilation tools, release 11.3, V11.3.58
Build cuda_11.3.r11.3/compiler.29745058_0

主要是看release后面是否正确啊,我安装的就是11.3版本。

安装PyTorch

官网

我是Linux CUDA=11.3 conda安装,都选好,指令如下:

conda install pytorch torchvision torchaudio cudatoolkit=11.3 -c pytorch

注意如果是安装1.10版本的PyTorch的话建议不要把 -c pytorch取消了,我之前翻清华源是没有1.10版本的,现在不确定了,你可以自己检查一下

验证GPU是否能用

# !/usr/bin/env pythonimport torch
print("cuda" if torch.cuda.is_available() else "cpu")

输出cuda,或者你直接

# !/usr/bin/env pythonimport torch
print(torch.cuda.is_available())

输出True

选修:

安装PyTorch-Lightning

最近发现Torch写了个高级API——pytorch-lightning,决定安装上学习一下

conda install -c conda-forge pytorch-lightning

我建议可以一起装上,万一就是下一个keras了呢

安装TensorFlow

conda install -c conda-forge tensorflow

然后就结束啦!可以从用CPU炼金到用GPU更快地炼金啦!

安装Nvidia驱动并使用Anaconda搭建GPU环境(安装CUDA)+ PyTorch + TensorFlow + PyTorch Lightning相关推荐

  1. Ubuntu搭建GPU环境(CUDA、cuDNN)

    前言 曾在Win10上搭建GPU环境,并使用Tensoflow-gpu训练卷积神经网络.现在使用Ubuntu运行项目,所以重新搭建一下GPU环境,下面记录一下过程. [TensorFlow]Windo ...

  2. Ubuntu18安装nvidia驱动QuadroP600

    Ubuntu18.04 安装nvidia驱动QuadroP600   写在前面:第一次安装的时候还算顺利,按照网上的教程,先在bios里面禁用Security boot,而后添加ppa源,然后直接点击 ...

  3. Mint系统使用介绍,Mint系统安装,在Mint系统上搭建GPU环境,在Mint系统上安装Pycharm、Anaconda等软件,在Mint系统上安装cuda和cudnn

    欢迎大家关注笔者,你的关注是我持续更博的最大动力 原创文章,转载告知,盗版必究 Mint系统使用介绍,Mint系统安装,在Mint系统上搭建GPU环境,在Mint系统上安装Pycharm.Anacon ...

  4. Ubuntu20.04安装NVIDIA驱动+cuda+cudnn+anaconda+pytorch+pycharm经验

    配置环境是深度学习的第一道门槛,也是必须迈过的一道门槛,之前一直在windows平台上跑pytorch,但很多包无法安装,必须要使用Linux.在经历了很多坑,无数次重装系统,崩溃,坚持后终于在Ubu ...

  5. (正确姿势)Centos7如何安装Nvidia驱动并安装Pytorch使用GPU

    准备工作 bios禁用secure boot,也就是设置为disable. yum install gcc,这个系统我是最小化安装的,默认没有,所以需要安装. yum install kernel*, ...

  6. ubuntu18.04 联想拯救者y9000 安装 Nvidia GeForce RTX 3070 Ti Laptop GPU显卡驱动问题吐血记录

    网上找了几天的贴子,各种方法都试了.结果只需要在启动时设置下显卡就行了 驱动下载地址 : 官方驱动 | NVIDIA下载适用于 GeForce.TITAN.NVIDIA RTX.数据中心.GRID 等 ...

  7. Ubuntu18 安装nvidia驱动进行深度学习训练

    Ubuntu18 安装nvidia驱动进行深度学习训练 安装nvidia驱动 驱动不兼容而造成系统循环登录的解决方案 安装cuda 安装cudnn 下载anacoda3 找不到conda命令的解决方法 ...

  8. ubuntu 18.04 安装NVIDIA驱动 cuda/cudnn + tensorflow-gpu + pytorch

    电脑换了华硕新主板,需要重装系统,用的Ubuntu18.04的系统,电脑用的显卡是GTX1080Ti.在新系统中装显卡驱动过程中遇到很多坑,中间无奈搞乱环境又重装了一次系统,再次尝试,终于成功.整个过 ...

  9. 在Fedora上安装NVIDIA驱动详细教程及解析

    写在前面:在经历了各种尝试和试错之后,发现并总结出了比较合适.安全且合理的NVIDIA驱动安装方案,本教程基于Fedora linux发行版,rhel,RockyOS等基本完全相同,deb系及其它li ...

最新文章

  1. 声卡硬件测试软件,RMAA声卡检测(RightMark Audio Analyzer)
  2. 关于 Intel 8253/8254
  3. mybatis$和#的区别
  4. 财务造假10年!贾跃亭被罚2.41亿
  5. php array_search多条件,php使用array_search与array_column函数实现二维数组内元素查找...
  6. Keras 实现 LSTM时间序列预测
  7. vue : 本地调试跨域问题的解决办法:proxyTable
  8. 谈谈写程序与学英语 --宋劲杉
  9. 求最大公约数欧几里得算法
  10. 【国科大】计算机类课程点评(更新中)
  11. CS academy Binary Flips(dp)
  12. android手机系统怎么刷机包,安卓系统怎么刷机?安卓系统手机通用刷机教程
  13. Partition Refinement
  14. 对于bugku中杂项啊哒题的尝试解法
  15. vb.net 同时给多个属性赋值_C++程序入门之——赋值操作符
  16. Makefile经典教程(掌握这些足够)
  17. 北京大学百年讲堂内听果宁法师讲人生——提得起、放得下的深刻含义(摘抄)
  18. 8psk星座图 matlab,两个8PSK信号叠加之后的星座图是怎么画的
  19. 移动端对比后端逐渐“式微”?在互联网大环境下如何避免久当生锈的”螺丝钉”去成为一个优秀的Android开发者?
  20. 统计元音字母——输入一个字符串,统计处其中元音字母的数量。更复杂点的话统计出每个元音字母的数量。

热门文章

  1. Weak1 Chapter2 Homework
  2. Ubuntu下apt-get连接超时问题解决方法
  3. SAP HANA HDBTable定义schema语法
  4. Django web开发系列(二)图书借阅管理系统之模型设计
  5. 编译Nexus 7 源码的流程
  6. 浏览器do not track(DNT)
  7. MMORPG - 战斗系统,概述设计
  8. 如何使用JAVA代码将WORD转成PDF.
  9. 怎么这虚拟服务器中加内存,如何增大主机的虚拟内存?
  10. [SetContextPropertiesRule]{Context} Setting property 'source' to 'org.eclipse.jst.j2ee.server:qqs' d