目录

  • 详细过程
    • 安装 anaconda3
      • 可能出现的问题
    • 安装 cuda
      • 安装前准备
      • 正式开始安装
      • 可能出现的问题
    • 安装 cudnn
    • 安装 pytorch
      • 可能出现的问题
  • 快速查询
    • 官网网址
    • 版本选择
    • 环境变量
    • 验证

办公室买了一台新电脑,又是安环境的一天……记录一下所有的过程。参考了很多很多很多的博客,已经很难找到链接了,感谢所有分享经验的大佬。

详细过程

安装 anaconda3

  1. 下载
    清华 anaconda 镜像源
    找到合适的版本,使用 wget 命令下载
    wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2021.11-Linux-x86_64.sh
  2. 安装
    可以安装在 /opt/ 目录下。(该目录一般存放大型软件)
    bash Anaconda3-2021.11-Linux-x86_64.sh
  3. 配置环境变量
    vim ~/.bashrc
    在文末加上 anaconda3/bin 的绝对路径
    export PATH=$PATH:/home/software/anaconda3/bin
    保存退出,运行以下命令使其生效:
    source ~/.bashrc
  4. 验证
    conda -V

可能出现的问题

  • 切换用户之后 conda 命令不存在
    解决方法:在新用户下设置环境变量。

安装 cuda

安装 cuda 是一个艰难的过程……加油!
注意:版本选择问题:首先,务必先在官网确认你想下载的pytorch版本对应的cuda版本,再确定你的驱动的版本,有些cuda版本是没有对应的 torch 版本的(比如 cuda11.2)

安装前准备

  1. 确认显卡驱动安装无误
    nvidia-smi
    出现下图是正确的。下面的 CUDA Version 指的是该版本的驱动支持的最高cuda版本

    如果没有出现上图,说明显卡驱动装错了。换一个驱动。
    在 Ubuntu 下更换驱动的方法:软件和更新 -> 附加驱动 -> 选择你的心动驱动 -> 应用更改。如果提示重启生效,请重启,不要做无谓的挣扎
  2. 下载对应的安装文件
    前往官网下载对应的 cuda 文件。请注意,如果需要下载以前的版本,在网页下端 Resources 部分有 Archive of Previous CUDA Releases 链接,点进去可以下之前的版本。如下图:
    [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ueN37MgK-1670298206967)(:/429b2e56152549958415b37bb13b03d0)]
    选好之后,下面会给出下载的链接,运行
    wget https://developer.download.nvidia.com/compute/cuda/11.5.0/local_installers/cuda_11.5.0_495.29.05_linux.run
  3. 确认依赖包已安装
    在安装 CUDA Toolkit 前,要确保系统安装了 gcc 和 make。如果希望使用 C++ 进行 CUDA 编程,需要安装 g++。如果想要运行 CUDA 例程序,需要安装相应的依赖库。(一般运行第二句就行了)
    sudo apt update # 更新 apt
    sudo apt install gcc g++ make # 安装 gcc g++ make
    sudo apt install libglu1-mesa libxi-dev libxmu-dev libglu1-mesa-dev freeglut3-dev # 安装依赖库
  4. 确认nouveau已经禁用
    输入 lsmod | grep nouveau,无事发生则可以。一般正确安装了 nvidia 驱动这个就已经被禁掉了。
  5. 关闭图形界面
    sudo telinit 3
    (可以通过 sudo systemctl start gdm3 回到图形界面)
    如果输入该命令后,黑屏,没有图形界面也没有命令界面,就是显示屏失去信号,那也许是显卡驱动的问题,请更换显卡驱动。

正式开始安装

  1. 运行 cuda 文件
    sudo chmod a+x cuda_9.2_linux.run # 给cuda文件可执行权限
    sudo ./cuda_9.2_linux.run --no-opengl-libs # 运行
    cuda主要有以下参数:

    • --no-opengl-libs:表示只安装驱动文件,不安装OpenGL文件。必需参数,原因同上。注意:不是-no-opengl-files。
    • --uninstall (deprecated):用于卸载CUDA Driver(已废弃)。
    • --toolkit:表示只安装CUDA Toolkit,不安装Driver和Samples
    • --help:查看更多高级选项。
  2. 安装注意事项
    1. 会先有个阅读声明,一直按D即可,然后accept。
    2. 选项install nvidia accelerated Graphics Driver,输入n,因为我们已经安装了nvidia的驱动。
    3. 选项install the OpenGL libraries,如果双显卡(集显+独显)选择n,如果只有独显可以选择y,如果双显卡选择y的话,会出现黑屏或者循环登录的问题,如果加了上面的参数就不会出现这个选项了。
    4. 后面的可以都选择yes,最后一个选项我们可以选择n,也就是不复制Samples,因为安装目录下有samples。
    5. 安装过程结束后会有以下信息:
      Driver :Installed
      Toolkit :Installed in /usr/local/cuda-9.2
      Samples :Installed in /home/vincent
  3. 修改环境变量
    这里可能需要重启一下。然后进入终端,修改环境变量
    vim ~/.bashrc
    在文末加上
    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
    export PATH=$PATH:/usr/local/cuda/bin
    export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
    保存退出,运行以下命令使其生效:
    source ~/.bashrc
    注意,我们这里写的环境变量是 /cuda 而不是 /cuda-11.2 之类的,这里可以通过软链接同时安装多个版本的 cuda 并进行管理。
    sudo rm -rf cuda # 删除之前的软链接
    sudo ln -s /usr/local/cuda-11.2 /usr/local/cuda # 创建新的软链接
  4. 验证是否安装成功
    nvcc -V

可能出现的问题

  • 切换用户之后 nvcc 命令不存在
    解决方法:在新用户下设置环境变量。
  • nvcc 命令不存在并且建议通过 apt 安装
    解决方法:这种很可能是因为环境变量没设置好,你已经安装过 cuda 了,所以不要再安一次。设置好环境再试试。记得设置好后用 source 命令使其生效。

安装 cudnn

  1. 下载文件
    根据 cuda 版本,在官网找到对应的 cuDNN 版本。
    需要账号。自己申请一个就行,没什么限制。
    复制cuDNN库的链接,使用 wget下载或者下载。
  2. 解压
    tar -xvf cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive.tar.xz
  3. 复制,授权
    cd cudnn-linux-x86_64-8.4.0.27_cuda11.6-archive
    sudo cp lib/* /usr/local/cuda-11.2/lib64/
    sudo cp include/* /usr/local/cuda-11.2/include/
    sudo chmod a+r /usr/local/cuda-11.2/lib64/*
    sudo chmod a+r /usr/local/cuda-11.2/include/*
  4. 验证安装成功
    通过下面的命令查看安装情况,如果结果如下图逐行显示版本号,则安装成功。
    旧版为 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2,新版为 cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

安装 pytorch

  1. 新建并进入虚拟环境
    conda create env_name python=3.9
    conda activate env_name
  2. 获得下载链接并下载安装
    去官网获取对应版本的下载链接。如果用 conda 命令下载,一直卡在检查环境那里,可能是版本对应不完美,就算了别纠结,换成 pip 命令下载。
  3. 验证安装成功
    进入 python,import torch
    torch.cuda.is_available()

可能出现的问题

如果报错 "ERROR: Could not find a version that satisfies the requirement … (from versions: …) "版本找不到,但是下载连接是从官网复制的,那么大概率是你的 python 版本太低或者太高,用 conda 命令改下 python 版本(至于改到哪个版本,你看你要下载的 pytorch 版本和报错信息中提供的版本,如果报错信息中有的版本比你要下载的基本都低,那就升高 python,具体升高到多少不确定,+0.2试试,不行再改):

  • python3 --version # 查看目前 python 版本
  • conda install python=x.x # 更新 python 版本

快速查询

官网网址

清华 anaconda 镜像源
nvidia cuda 官网
nvidia cudnn 官网
pytorch 官网

版本选择

首先,务必先在官网确认你想下载的pytorch版本对应的cuda版本,再确定你的驱动的版本,有些cuda版本是没有对应的 torch 版本的(比如 cuda11.2)
其次,如果想装 detectron2,先去官网看看目前有哪些可以下载。如果你的 torch 版本或者 cuda 版本过高,可能会没有适配的 detectron2。

环境变量

切换用户之后无法使用:暂时我也没搞清为什么,所以每个用户都是设置的单独的环境配置文件。

  1. vim ~/.bashrc
  2. 使用 export 加入对应的环境,保存退出。
  3. source ~/.bashrc

注意,最后这句不运行的话不起效

  • conda 环境变量
    export PATH=$PATH:/home/software/anaconda3/bin
  • cuda 环境变量
    export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64
    export PATH=$PATH:/usr/local/cuda/bin
    export CUDA_HOME=$CUDA_HOME:/usr/local/cuda
  • 切换 cuda 版本软链接
    sudo rm -rf cuda # 删除之前的软链接
    sudo ln -s /usr/local/cuda-11.2 /usr/local/cuda # 创建新的软链接

验证

  • 验证 conda
    conda --version
  • 验证显卡驱动
    nvidia-smi
    如果没有打印表,说明显卡驱动装错了。换一个驱动,如果提示重启生效,请重启,不要做无谓的挣扎。
  • 验证 cuda
    nvcc -V
    注意,这里如果显示无此命令,建议用 apt 安装,别信他的,这是因为没有配置好环境变量的原因,请按照环境变量那一节配置。
  • 验证 cudnn
    旧版为 cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
    新版为 cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
  • 验证 pytorch
    torch.cuda.is_available()

Linux Ubuntu 配置Anaconda3+cuda+cuDNN+torch相关推荐

  1. Ubuntu22 Linux 服务器安装显卡驱动,cuda,cudnn和pytorch

    Ubuntu22 Linux 服务器安装显卡驱动,cuda,cudnn和pytorch 1. 首先了解自己服务器的操作系统内核版本等信息: (1)查看操作系统的版本信息:cat /etc/issue或 ...

  2. 深度学习环境配置Win10+CUDA+cuDNN+Tensorflow2.0+PyTorch1.2+Python3.7.6

    系统环境:Win10 Python版本:3.7.6 CUDA版本:10.0 cuDNN版本:7.6.5 Tensorflow-gpu版本:2.0.1 PyTorch版本:1.2.0 深度学习环境配置W ...

  3. Windows环境配置Anaconda+cuda+cuDNN+pytorch+jupyter notebook

    Windows环境配置Anaconda+cuda+cuDNN+pytorch+jupyter notebook Anaconda 1.官网下载安装包 https://repo.anaconda.com ...

  4. 阿里云服务器vgn6i配置NVIDIA CUDA+cuDNN

    阿里云服务器vgn6i配NVIDIA CUDA+cuDNN 目录 阿里云服务器vgn6i配NVIDIA CUDA+cuDNN 前言 一.驱动安装 二.安装CUDA 三.cuDNN安装 总结 前言 本文 ...

  5. 作为一个小白的Python3 Pycharm Anaconda3 Cuda Cudnn的环境配置安装和pip下载安装tensorflow

    win10系统 链接:https://pan.baidu.com/s/1XHWpPNsyNub8qu3X6JiBhQ 提取码:4oc9 这是我的环境配置安装包,还有一个py文件是检测你是否安装好的了! ...

  6. tensorflow GPU环境配置 Nvidia+cuda+cudnn

    显卡安装 去官网下载显卡驱动https://www.nvidia.cn/ 删除旧的nvidia驱动(刚装的机子不需要这一步) sudo apt-get purge nvidia* sudo chmod ...

  7. Ubuntu20.04下NVIDIA驱动+anaconda3+cuda+cudnn+pytorch安装

    声明:此文章是在初步接触深度学习的时候,参考几位前辈的博客自己进行安装后整理的步骤,所参考博客链接如下: #https://blog.csdn.net/ashome123/article/detail ...

  8. Win10深度学习环境配置(CUDA+cuDNN+TensorFlow-gpu+Keras)

    安装时间:2018-05-19 软硬件配置 GTX 1060 6G Win10 64位专业版 Anaconda3 5.1.0 深度学习工具 CUDA 9.0 cuDNN v7.0 TensorFlow ...

  9. linux ubuntu配置要求,Ubuntu Server 14.04和Kylin 14.04 Enhanced Release amd64最低硬件配置要求...

    Ubuntu Server 14.04和Kylin 14.04 Enhanced Release amd64最低硬件配置要求 Ubuntu(乌班图)是一个以桌面应用为主的 Linux 操作系统.其名称 ...

最新文章

  1. 了解Netflix-zuul网关服务
  2. [architecture]-AMRV7和ARMV8中的一些细微差异
  3. IA-32 Intel手册学习笔记(一)系统架构概述
  4. 求教PHP+oracle的开发
  5. 跟我学Java(配光盘)(跟我学)
  6. 李宏毅机器学习——逻辑回归
  7. 第二阶段冲刺10天 第二天
  8. 自定义百度网盘提取码
  9. Matlab猜数字游戏GUI界面设计
  10. xshell5和xftp5安装教程
  11. 2022年湖北大学招生简章--成人高等教育高起专、专升本学历提升
  12. windows10双系统删除linux,双系统删除教程详解:Windows(linux)双系统,教你如何删除其中一个!...
  13. 第一次QMK编译记录(11.26)
  14. JS的浮点数计算精度丢失问题解决方案
  15. Android Banner Indicator 轮播图指示器
  16. 程序员的桌面画风竟然是酱紫的!
  17. 登录接口已修复梦想贩卖机V2 2.0.4 修复版,附带安装教程。
  18. 程序员在面试时,如何回答未来规划方面的问题
  19. HTML 样式style
  20. I帧、P帧、B帧、GOP、IDR 和PTS, DTS之间的关系

热门文章

  1. 地震图像处理基本理论(一)
  2. nlp学习--专家系统总结-专家系统基础
  3. JavaScript在函数中定义全局变量
  4. python中sorted(d.items(),key=lambda x:x[])
  5. 你不知道的斗破苍穹之python篇
  6. 《系统工程手册》中提及的Expert Choice软件
  7. HTML浪漫动态表白代码+音乐(附源码)
  8. 【2019】【1080P】【动作/奇幻/冒险】《地狱男爵:血皇后崛起》 Hellboy
  9. 地球坐标系与投影方式的理解(关于北京54,西安80,WGS84;高斯,兰勃特,墨卡托投影)
  10. R语言--map与reduce