ubuntu1804+CUDA10+cudnn7.4.2+TensorFlow2+Pytorch1.3 9700K+双路RTX 2080TI

硬件配置：
主板：微星（MSI）MPG Z390 GAMING PRO CARBON 暗黑板主板
CPU： Intel 9700K
内存：芝奇（G.SKILL）16GB 2666频率 DDR4 台式机内存条 Aegis/黑红色 x4
SSD：海康威视 1TB M.2接口 CRUIS系列C2000
HDD：东芝(TOSHIBA) 4TB 128MB 7200RPM
GPU：EVGA GeForce RTX 2080 Ti Black GAMING X2 双路2080ti

（需要注意主板上的PCI槽位距离太近，两张卡插上后距离只有25mm，上面一张卡温度太高，自己做了个风扇架子放了两个风扇对着吹。有条件还是用涡轮卡，或者用pci槽距离远的服务器主板，上水冷的话，怕漏液，个人不推荐）
电源：振华（SUPER FLOWER）额定1000W LEADEX G 1000 电源
散热：猫头鹰（NOCTUA）NH-D15

1、安装Ubuntu18.04系统
下载Ubuntu系统镜像，用UltralISO写入一个大于8GB的U盘
关机状态下插入电脑USB3.0接口，启动电脑，按DEL进入BIOS，设置为AHCI，UEFI only，关闭Secure Boot，U盘启动。
进入安装界面，选择第一个“使用ubuntu而不安装”，在试用版桌面选择“Install Ubuntu 16.04.4LTS”双击打开。
继续进行。不连接网络，最小安装，不安装更新，不安装第三方软件。在选择解压方式时，选自定义，我们自己配置磁盘分区。
进行分区，选择空闲分区，点击“+”创建4个主要的基础分区：
/efi 主分区    4097MB      从空间起始位置     用于挂载引导
/swap 交换分区 65536MB        （不小于内存大小）   虚拟内存
/     逻辑分区 204800MB    从空间起始位置     根目录
/home 逻辑分区（剩下所有）从空间起始位置     用户目录

将boot挂载在/efi分区，继续。选择Shanghai，继续。中文，继续。
设置计算机名字和密码，记住，重要，密码最好不要有特殊字符和数字。继续。重启，即可进入Ubuntu 18.04。

2、安装显卡驱动
https://www.nvidia.cn/Download/Find.aspx?lang=cn

按照自己的显卡型号和系统选择驱动程序，不推荐装最新的驱动，往前回滚几个版本的更稳定。（Ubuntu下求稳不求新）

这里笔者是双路2080ti，下载了418.43。(驱动版本貌似和后面CUDA的安装没关系，只是为了显示正常)。获得一个NVIDIA-Linux-x86_64-418.43.run的安装包。
禁用Ubuntu自带驱动nouveau：
Ubuntu默认安装了第三方开源的驱动程序nouveau，安装nvidia显卡驱动首先需要禁用nouveau，不然会碰到冲突的问题，导致无法安装nvidia显卡驱动。
编辑文件blacklist.conf
sudo gedit /etc/modprobe.d/blacklist.conf
在文件最后部分插入以下两行内容
blacklist nouveau
options nouveau modeset=0
更新系统
sudo update-initramfs -u

{修改一下grub文件，不然笔者遇到了启动失败，黑屏光标闪烁：
若已经黑屏，则在开机后进入安全模式，长按ESC或shift
修改grub文件：
sudo vim /etc/default/grub
在文中找到 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
将quiet splash改为nomodeset
保存关闭文件
更新：sudo update-grub
}

重启系统（一定要重启）
验证nouveau是否已禁用：lsmod | grep nouveau

卸载旧驱动，进入命令界面，Ctrl+Alt+Fx(x:1~6，控制台，随便一个进去就行)，输入用户名，密码（密码不会显示）,ubuntu16应该是要运行sudo service lightdm stop来关闭图形化界面的，但是Ubuntu18是基于gnome的显示，所以不需要这句命令，输了也没有用。执行以下三条命令卸载原有显卡驱动：
sudo apt-get remove --purge nvidia* #卸载所有nvidia驱动
sudo chmod +x NVIDIA-Linux-x86_64-418.93.run #赋予run文件权限
sudo ./NVIDIA-Linux-x86_64-418.93.run --uninstall #用run文件卸载驱动
安装新驱动：
sudo ./NVIDIA-Linux-x86_64-410.93.run
ctrl+c跳过需知，会有一些选项需要选择，记不住了，不要安装驱动，其他都是默认应该就可以
安装完成后，nvidia-smi 检查是否成功

也可以换源后在软件更新里直接安装驱动，对后续操作应该没有影响

3、安装cudn 10.0、pytorch==1.13、tensorflow-gpu==2.0，cudnn7.6.0
安装cuda：
https://developer.nvidia.com/cuda-toolkit-archive 下载对应的CUDA
笔者选的cuda 10.0
下载完成之后，给文件赋予执行权限：

chmod +x cuda_10.0.130_410.48_linux.run

执行安装包，开始安装：

./cuda_10.0.130_410.48_linux.run

开始安装之后，需要阅读说明，可以使用Ctrl + C直接阅读完成，或者使用空格键慢慢阅读。然后进行配置，我这里说明一下：

（是否同意条款，必须同意才能继续安装）
accept/decline/quit: accept
（这里不要安装驱动，因为已经安装最新的驱动了，否则可能会安装旧版本的显卡驱动，导致重复登录的情况）
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: n
Install the CUDA 10.0 Toolkit?（是否安装CUDA 10 ，这里必须要安装）
(y)es/(n)o/(q)uit: y
Enter Toolkit Location（安装路径，使用默认，直接回车就行）
[ default is /usr/local/cuda-10.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?（同意创建软链接）
(y)es/(n)o/(q)uit: y
Install the CUDA 10.0 Samples?（不用安装测试，本身就有了）
(y)es/(n)o/(q)uit: n
Installing the CUDA Toolkit in /usr/local/cuda-10.0 ...（开始安装）
（是否同意条款，必须同意才能继续安装）
accept/decline/quit: accept
（这里不要安装驱动，因为已经安装最新的驱动了，否则可能会安装旧版本的显卡驱动，导致重复登录的情况）
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: n
Install the CUDA 10.0 Toolkit?（是否安装CUDA 10 ，这里必须要安装）
(y)es/(n)o/(q)uit: y
Enter Toolkit Location（安装路径，使用默认，直接回车就行）
[ default is /usr/local/cuda-10.0 ]:
Do you want to install a symbolic link at /usr/local/cuda?（同意创建软链接）
(y)es/(n)o/(q)uit: y
Install the CUDA 10.0 Samples?（不用安装测试，本身就有了）
(y)es/(n)o/(q)uit: n
Installing the CUDA Toolkit in /usr/local/cuda-10.0 ...（开始安装）

安装完成之后，可以配置他们的环境变量，sudo gedit ~/.bashrc的最后加上以下配置信息：

export CUDA_HOME=/usr/local/cuda-10.0
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}

最后使用命令source ~/.bashrc使它生效。

可以使用命令nvcc -V查看安装的版本信息：

test@test:~$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130

测试安装是否成功
执行以下几条命令：
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
make
./deviceQuery

正常情况下输出：
./deviceQuery Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce RTX 2070"
CUDA Driver Version / Runtime Version          10.0 / 10.0
CUDA Capability Major/Minor version number:    7.5
Total amount of global memory:                 7950 MBytes (8335982592 bytes)
(36) Multiprocessors, ( 64) CUDA Cores/MP:     2304 CUDA Cores
GPU Max Clock rate:                            1620 MHz (1.62 GHz)
Memory Clock rate:                             7001 Mhz
Memory Bus Width:                              256-bit
L2 Cache Size:                                 4194304 bytes
Maximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)
Maximum Layered 1D Texture Size, (num) layers 1D=(32768), 2048 layers
Maximum Layered 2D Texture Size, (num) layers 2D=(32768, 32768), 2048 layers
Total amount of constant memory:               65536 bytes
Total amount of shared memory per block:       49152 bytes
Total number of registers available per block: 65536
Warp size:                                     32
Maximum number of threads per multiprocessor: 1024
Maximum number of threads per block:           1024
Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
Maximum memory pitch:                          2147483647 bytes
Texture alignment:                             512 bytes
Concurrent copy and kernel execution:         Yes with 3 copy engine(s)
Run time limit on kernels:                     Yes
Integrated GPU sharing Host Memory:            No
Support host page-locked memory mapping:       Yes
Alignment requirement for Surfaces:            Yes
Device has ECC support:                        Disabled
Device supports Unified Addressing (UVA):      Yes
Device supports Compute Preemption:            Yes
Supports Cooperative Kernel Launch:            Yes
Supports MultiDevice Co-op Kernel Launch:      Yes
Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0, CUDA Runtime Version = 10.0, NumDevs = 1
Result = PASS

安装Pytorch：
根据深度学习与TensorFlow 2入门实战中所说，如果先装pytorch会自动安装cudnn，

也可以进入https://pytorch.org/，选择stable、linux、conda、pip、pythonx、CUDAXX，命令行自动安装。这样安装不会自动装CUDA。
测试安装成功：
import torch
print(torch.cuda.is_gpu_available())

下载和安装CUDNN：
https://developer.nvidia.com/rdp/cudnn-archive，然后点击Download开始选择下载版本，当然在下载之前还有登录，选择版本界面如下，我们选择cuDNN Library for Linux
下载之后是一个压缩包，如下：
cudnn-10.0-linux-x64-v7.6.0.64.tgz
解压，解压之后可以得到以下文件：
cuda/include/cudnn.h
cuda/NVIDIA_SLA_cuDNN_Support.txt
cuda/lib64/libcudnn.so
cuda/lib64/libcudnn.so.7
cuda/lib64/libcudnn.so.7.6.0
cuda/lib64/libcudnn_static.a
使用以下两条命令复制这些文件到CUDA目录下：
cp cuda/lib64/* /usr/local/cuda-10.0/lib64/
cp cuda/include/* /usr/local/cuda-10.0/include/
拷贝完成之后，可以使用以下命令查看CUDNN的版本信息：
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

安装Tensorflow 2.0：
pip install tensorflow-gpu -U
test安装成功并能使用gpu：
In [1]: import tensorflow as tf
In [2]:tf.test.is_gpu_available()
Out[2]: True

ubuntu1804+CUDA10+cudnn7.4.2+TensorFlow2+Pytorch1.3 9700K+双路RTX 2080TI相关推荐

Ubuntu安装cuda10+cudnn7.5+Tensorflow2.0
Ubuntu安装cuda10+cudnn7.5+Tensorflow2.0 本文地址:https://blog.csdn.net/qq_31456593/article/details/9017070 ...
Ubuntu 18.04＋GTX 1050笔记本+Nvidia418＋CUDA10+CUDNN7.3.1
Ubuntu 18.04+GTX 1050笔记本+Nvidia418+CUDA10+CUDNN7.3.1 时隔小半年,这是我第二次尝试在Ubuntu18.04上安装Nvidia驱动.上学期安装失败,并 ...
Ubuntu18.04 安装NVIDIA驱动+CUDA10+cuDNN7.6
最正确的方法安装NVIDIA驱动+CUDA10+cuDNN7.6 话不多说直接开始平台: Ubuntu18.04 显卡 GTX1080TI**2+Quadro P6000*2 如果以前已经装有NVI ...
WIN10+RTX 2080Ti深度学习平台搭建，VS2019+CUDA11.0+cuDNN8.0+python3.8.7+Tensorflow2.4.0+Keras，以及各种科学包
WIN10+RTX 2080Ti深度学习平台搭建前置声明:博文中有一些图片来自网上截图(因为安装完成后做的记录,有些安装过程图嫌麻烦没有复现),侵删. 可选步骤: 如果之前有python环境,需要卸 ...
ubuntu18.04+cuda10.2+cudnn7.6.5+anaconda3+pytorch1.6
ubuntu(18.04)配置pytorch(cuda10.2+cudnn7.6.5)环境安装流程: 1安装显卡驱动 2安装CUDA 3安装CUDNN 4安装Anaconda3 5确定python版 ...
深度学习环境配置 (Ubuntu18.04 + CUDA10.0 + cuDNN7.6.5 + TensorFlow2.0)
@ Bergen, Norway 第一次安装 CUDA 的过程简直抓狂,中间出现了很多次莫名其妙的 bug,踩了很多坑.比如装好了 CUDA 重启后进不去桌面系统了,直接黑屏.比如鼠标键盘都不 wor ...
Win10配置CUDA10+cuDNN7（pytorch，tensorflow-gpu）记录
电脑:联系M4400,双显卡(集显和独显),开机过程长按F1进入BIOS,在设置显卡那里要选择独显类型(看英文提示选择) 环境:Python 3.6.5,pip方式安装包(使用的是winpython, ...
win10下TensorFlow-GPU安装（GTX1660+CUDA10+CUDNN7.4）
首先安装anaconda Anaconda下载地址:https://www.anaconda.com/download/ 注意在安装时勾上第一项: 安装CUDA10.0: CUDA下载地址:https ...
Jetson Nano （Cuda10.2）安装tensorflow2.1.0运行python程序及几个版本tensorflow aarch64下载分享
目录 1.本次遇到的问题 Segmentation fault (core dumped) 2.安装tensorflow2.1.0 3.Jetson Nano上各版本的tensorflow(pytho ...
win10下RTX 2080ti安装cuda10.0和cudnn7.6.5
1 安装显卡驱动在NVIDIA官网上下载显卡驱动,并进行安装 NVIDIA官网下载页面 2 安装cuda10.0 在cuda历史版本列表中下载cuda10.0 cuda10.0下载链接下载完成后安 ...

ubuntu1804+CUDA10+cudnn7.4.2+TensorFlow2+Pytorch1.3 9700K+双路RTX 2080TI

ubuntu1804+CUDA10+cudnn7.4.2+TensorFlow2+Pytorch1.3 9700K+双路RTX 2080TI相关推荐

最新文章

热门文章