硬件配置:
主板:微星(MSI)MPG Z390 GAMING PRO CARBON 暗黑板主板
CPU: Intel 9700K
内存:芝奇(G.SKILL)16GB 2666频率 DDR4 台式机内存条 Aegis/黑红色 x4
SSD:海康威视 1TB M.2接口 CRUIS系列C2000
HDD:东芝(TOSHIBA) 4TB 128MB 7200RPM
GPU:EVGA GeForce RTX 2080 Ti Black GAMING X2 双路2080ti

(需要注意主板上的PCI槽位距离太近,两张卡插上后距离只有25mm,上面一张卡温度太高,自己做了个风扇架子放了两个风扇对着吹。有条件还是用涡轮卡,或者用pci槽距离远的服务器主板,上水冷的话,怕漏液,个人不推荐)
电源:振华(SUPER FLOWER)额定1000W LEADEX G 1000 电源
散热:猫头鹰(NOCTUA)NH-D15

1、安装Ubuntu18.04系统
下载Ubuntu系统镜像,用UltralISO写入一个大于8GB的U盘
关机状态下插入电脑USB3.0接口,启动电脑,按DEL进入BIOS,设置为AHCI,UEFI only,关闭Secure Boot,U盘启动。
进入安装界面,选择第一个“使用ubuntu而不安装”,在试用版桌面选择“Install Ubuntu 16.04.4LTS”双击打开。
继续进行。不连接网络,最小安装,不安装更新,不安装第三方软件。在选择解压方式时,选自定义,我们自己配置磁盘分区。
进行分区,选择空闲分区,点击“+”创建4个主要的基础分区:
/efi  主分区    4097MB      从空间起始位置     用于挂载引导
/swap 交换分区  65536MB        (不小于内存大小)   虚拟内存
/     逻辑分区  204800MB    从空间起始位置     根目录
/home 逻辑分区 (剩下所有) 从空间起始位置     用户目录

将boot挂载在/efi分区,继续。选择Shanghai,继续。中文,继续。
设置计算机名字和密码,记住,重要,密码最好不要有特殊字符和数字。继续。重启,即可进入Ubuntu 18.04。

2、安装显卡驱动
https://www.nvidia.cn/Download/Find.aspx?lang=cn

按照自己的显卡型号和系统选择驱动程序,不推荐装最新的驱动,往前回滚几个版本的更稳定。(Ubuntu下求稳不求新)

这里笔者是双路2080ti,下载了418.43。(驱动版本貌似和后面CUDA的安装没关系,只是为了显示正常)。获得一个NVIDIA-Linux-x86_64-418.43.run的安装包。
禁用Ubuntu自带驱动nouveau:
Ubuntu默认安装了第三方开源的驱动程序nouveau,安装nvidia显卡驱动首先需要禁用nouveau,不然会碰到冲突的问题,导致无法安装nvidia显卡驱动。
编辑文件blacklist.conf
sudo gedit /etc/modprobe.d/blacklist.conf
在文件最后部分插入以下两行内容
blacklist nouveau
options nouveau modeset=0
更新系统
sudo update-initramfs -u

{修改一下grub文件,不然笔者遇到了启动失败,黑屏光标闪烁:
若已经黑屏,则在开机后进入安全模式,长按ESC或shift
修改grub文件:
sudo vim /etc/default/grub
在文中找到 GRUB_CMDLINE_LINUX_DEFAULT="quiet splash"
将quiet splash改为nomodeset
保存关闭文件
更新:sudo update-grub
}

重启系统(一定要重启)
验证nouveau是否已禁用:lsmod | grep nouveau

卸载旧驱动,进入命令界面,Ctrl+Alt+Fx(x:1~6,控制台,随便一个进去就行),输入用户名,密码(密码不会显示),ubuntu16应该是要运行sudo service lightdm stop来关闭图形化界面的,但是Ubuntu18是基于gnome的显示,所以不需要这句命令,输了也没有用。执行以下三条命令卸载原有显卡驱动:
sudo apt-get remove --purge nvidia* #卸载所有nvidia驱动
sudo chmod +x NVIDIA-Linux-x86_64-418.93.run #赋予run文件权限
sudo ./NVIDIA-Linux-x86_64-418.93.run --uninstall #用run文件卸载驱动
安装新驱动:
sudo ./NVIDIA-Linux-x86_64-410.93.run
ctrl+c跳过需知,会有一些选项需要选择,记不住了,不要安装驱动,其他都是默认应该就可以
安装完成后,nvidia-smi 检查是否成功

也可以换源后在软件更新里直接安装驱动,对后续操作应该没有影响

3、安装cudn 10.0、pytorch==1.13、tensorflow-gpu==2.0,cudnn7.6.0
安装cuda:
https://developer.nvidia.com/cuda-toolkit-archive 下载对应的CUDA
笔者选的cuda 10.0
下载完成之后,给文件赋予执行权限:

chmod +x cuda_10.0.130_410.48_linux.run

执行安装包,开始安装:

./cuda_10.0.130_410.48_linux.run

开始安装之后,需要阅读说明,可以使用Ctrl + C直接阅读完成,或者使用空格键慢慢阅读。然后进行配置,我这里说明一下:

(是否同意条款,必须同意才能继续安装)
accept/decline/quit: accept
(这里不要安装驱动,因为已经安装最新的驱动了,否则可能会安装旧版本的显卡驱动,导致重复登录的情况)
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: n
Install the CUDA 10.0 Toolkit?(是否安装CUDA 10 ,这里必须要安装)
(y)es/(n)o/(q)uit: y
Enter Toolkit Location(安装路径,使用默认,直接回车就行)
 [ default is /usr/local/cuda-10.0 ]: 
Do you want to install a symbolic link at /usr/local/cuda?(同意创建软链接)
(y)es/(n)o/(q)uit: y
Install the CUDA 10.0 Samples?(不用安装测试,本身就有了)
(y)es/(n)o/(q)uit: n
Installing the CUDA Toolkit in /usr/local/cuda-10.0 ...(开始安装)
(是否同意条款,必须同意才能继续安装)
accept/decline/quit: accept
(这里不要安装驱动,因为已经安装最新的驱动了,否则可能会安装旧版本的显卡驱动,导致重复登录的情况)
Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: n
Install the CUDA 10.0 Toolkit?(是否安装CUDA 10 ,这里必须要安装)
(y)es/(n)o/(q)uit: y
Enter Toolkit Location(安装路径,使用默认,直接回车就行)
 [ default is /usr/local/cuda-10.0 ]: 
Do you want to install a symbolic link at /usr/local/cuda?(同意创建软链接)
(y)es/(n)o/(q)uit: y
Install the CUDA 10.0 Samples?(不用安装测试,本身就有了)
(y)es/(n)o/(q)uit: n
Installing the CUDA Toolkit in /usr/local/cuda-10.0 ...(开始安装)

安装完成之后,可以配置他们的环境变量,sudo gedit ~/.bashrc的最后加上以下配置信息:

export CUDA_HOME=/usr/local/cuda-10.0
export LD_LIBRARY_PATH=${CUDA_HOME}/lib64
export PATH=${CUDA_HOME}/bin:${PATH}

最后使用命令source ~/.bashrc使它生效。

可以使用命令nvcc -V查看安装的版本信息:

test@test:~$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130

测试安装是否成功
执行以下几条命令:
cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
make
./deviceQuery

正常情况下输出:
./deviceQuery Starting...

CUDA Device Query (Runtime API) version (CUDART static linking)

Detected 1 CUDA Capable device(s)

Device 0: "GeForce RTX 2070"
  CUDA Driver Version / Runtime Version          10.0 / 10.0
  CUDA Capability Major/Minor version number:    7.5
  Total amount of global memory:                 7950 MBytes (8335982592 bytes)
  (36) Multiprocessors, ( 64) CUDA Cores/MP:     2304 CUDA Cores
  GPU Max Clock rate:                            1620 MHz (1.62 GHz)
  Memory Clock rate:                             7001 Mhz
  Memory Bus Width:                              256-bit
  L2 Cache Size:                                 4194304 bytes
  Maximum Texture Dimension Size (x,y,z)         1D=(131072), 2D=(131072, 65536), 3D=(16384, 16384, 16384)
  Maximum Layered 1D Texture Size, (num) layers  1D=(32768), 2048 layers
  Maximum Layered 2D Texture Size, (num) layers  2D=(32768, 32768), 2048 layers
  Total amount of constant memory:               65536 bytes
  Total amount of shared memory per block:       49152 bytes
  Total number of registers available per block: 65536
  Warp size:                                     32
  Maximum number of threads per multiprocessor:  1024
  Maximum number of threads per block:           1024
  Max dimension size of a thread block (x,y,z): (1024, 1024, 64)
  Max dimension size of a grid size    (x,y,z): (2147483647, 65535, 65535)
  Maximum memory pitch:                          2147483647 bytes
  Texture alignment:                             512 bytes
  Concurrent copy and kernel execution:          Yes with 3 copy engine(s)
  Run time limit on kernels:                     Yes
  Integrated GPU sharing Host Memory:            No
  Support host page-locked memory mapping:       Yes
  Alignment requirement for Surfaces:            Yes
  Device has ECC support:                        Disabled
  Device supports Unified Addressing (UVA):      Yes
  Device supports Compute Preemption:            Yes
  Supports Cooperative Kernel Launch:            Yes
  Supports MultiDevice Co-op Kernel Launch:      Yes
  Device PCI Domain ID / Bus ID / location ID:   0 / 1 / 0
  Compute Mode:
     < Default (multiple host threads can use ::cudaSetDevice() with device simultaneously) >

deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 10.0, CUDA Runtime Version = 10.0, NumDevs = 1
Result = PASS

安装Pytorch:
根据 深度学习与TensorFlow 2入门实战 中所说,如果先装pytorch会自动安装cudnn,

也可以进入https://pytorch.org/,选择stable、linux、conda、pip、pythonx、CUDAXX,命令行自动安装。这样安装不会自动装CUDA。
测试安装成功:
import torch
print(torch.cuda.is_gpu_available())

下载和安装CUDNN:
https://developer.nvidia.com/rdp/cudnn-archive,然后点击Download开始选择下载版本,当然在下载之前还有登录,选择版本界面如下,我们选择cuDNN Library for Linux
下载之后是一个压缩包,如下:
cudnn-10.0-linux-x64-v7.6.0.64.tgz
解压,解压之后可以得到以下文件:
cuda/include/cudnn.h
cuda/NVIDIA_SLA_cuDNN_Support.txt
cuda/lib64/libcudnn.so
cuda/lib64/libcudnn.so.7
cuda/lib64/libcudnn.so.7.6.0
cuda/lib64/libcudnn_static.a
使用以下两条命令复制这些文件到CUDA目录下:
cp cuda/lib64/* /usr/local/cuda-10.0/lib64/
cp cuda/include/* /usr/local/cuda-10.0/include/
拷贝完成之后,可以使用以下命令查看CUDNN的版本信息:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

安装Tensorflow 2.0:
pip install tensorflow-gpu -U
test安装成功并能使用gpu:
In [1]: import tensorflow  as tf
In [2]:tf.test.is_gpu_available()
Out[2]: True

ubuntu1804+CUDA10+cudnn7.4.2+TensorFlow2+Pytorch1.3 9700K+双路RTX 2080TI相关推荐

  1. Ubuntu安装cuda10+cudnn7.5+Tensorflow2.0

    Ubuntu安装cuda10+cudnn7.5+Tensorflow2.0 本文地址:https://blog.csdn.net/qq_31456593/article/details/9017070 ...

  2. Ubuntu 18.04+GTX 1050笔记本+Nvidia418+CUDA10+CUDNN7.3.1

    Ubuntu 18.04+GTX 1050笔记本+Nvidia418+CUDA10+CUDNN7.3.1 时隔小半年,这是我第二次尝试在Ubuntu18.04上安装Nvidia驱动.上学期安装失败,并 ...

  3. Ubuntu18.04 安装NVIDIA驱动+CUDA10+cuDNN7.6

    最正确的方法安装NVIDIA驱动+CUDA10+cuDNN7.6 话不多说直接开始 平台: Ubuntu18.04 显卡 GTX1080TI**2+Quadro P6000*2 如果以前已经装有NVI ...

  4. WIN10+RTX 2080Ti深度学习平台搭建,VS2019+CUDA11.0+cuDNN8.0+python3.8.7+Tensorflow2.4.0+Keras,以及各种科学包

    WIN10+RTX 2080Ti深度学习平台搭建 前置声明:博文中有一些图片来自网上截图(因为安装完成后做的记录,有些安装过程图嫌麻烦没有复现),侵删. 可选步骤: 如果之前有python环境,需要卸 ...

  5. ubuntu18.04+cuda10.2+cudnn7.6.5+anaconda3+pytorch1.6

    ubuntu(18.04)配置pytorch(cuda10.2+cudnn7.6.5)环境 安装流程: 1安装显卡驱动 2安装CUDA 3安装CUDNN 4安装Anaconda3 5确定python版 ...

  6. 深度学习环境配置 (Ubuntu18.04 + CUDA10.0 + cuDNN7.6.5 + TensorFlow2.0)

    @ Bergen, Norway 第一次安装 CUDA 的过程简直抓狂,中间出现了很多次莫名其妙的 bug,踩了很多坑.比如装好了 CUDA 重启后进不去桌面系统了,直接黑屏.比如鼠标键盘都不 wor ...

  7. Win10配置CUDA10+cuDNN7(pytorch,tensorflow-gpu)记录

    电脑:联系M4400,双显卡(集显和独显),开机过程长按F1进入BIOS,在设置显卡那里要选择独显类型(看英文提示选择) 环境:Python 3.6.5,pip方式安装包(使用的是winpython, ...

  8. win10下TensorFlow-GPU安装(GTX1660+CUDA10+CUDNN7.4)

    首先安装anaconda Anaconda下载地址:https://www.anaconda.com/download/ 注意在安装时勾上第一项: 安装CUDA10.0: CUDA下载地址:https ...

  9. Jetson Nano (Cuda10.2)安装tensorflow2.1.0运行python程序及几个版本tensorflow aarch64下载分享

    目录 1.本次遇到的问题 Segmentation fault (core dumped) 2.安装tensorflow2.1.0 3.Jetson Nano上各版本的tensorflow(pytho ...

  10. win10下RTX 2080ti安装cuda10.0和cudnn7.6.5

    1 安装显卡驱动 在NVIDIA官网上下载显卡驱动,并进行安装 NVIDIA官网下载页面 2 安装cuda10.0 在cuda历史版本列表中下载cuda10.0 cuda10.0下载链接 下载完成后安 ...

最新文章

  1. C语言清空输入缓冲区的N种方法对比
  2. Jquery 之Ajax方法$.get() 的运用,扩展链接模型的天地
  3. shell中sed命令的用法
  4. OpenCV线性搅拌机linear blender的实例(附完整代码)
  5. 【机器学习】opencv-摄像头中的人脸采集
  6. mysql _bin编码_mysql中utf8_bin、utf8_general_ci、utf8_general_cs编码区别
  7. java jackson_Jackson 框架的高阶应用
  8. 计算机网络基础系列(一)概述、计算机网络性能
  9. struts2——快速入门
  10. sublime livereload插件
  11. 为什么Audition CC2017扫描不了电音插件,你需要这个工具
  12. 虚拟服务器搭建棋牌,棋牌开源游戏服务器框架
  13. 网页设计Dreamweaver【2】
  14. StoryBoard故事版之ViewController与实体类的关联和不同StoryBoard 跳转
  15. android ae动画教程,AE动画转Web代码工具指北-Lottie
  16. elementUI表格头添加图标-鼠标移入显示el-tooltip提示信息
  17. android用来管理通知,Android 中通知的基本使用
  18. OCA/OCP Oracle 数据库12c考试指南读书笔记:第31章:Multitenant Container and Pluggable Database Architecture
  19. matplotlib 色带_30多种高质量的色带字体可增强您的设计
  20. 秒表计时器怎么读_秒表应该怎么读?

热门文章

  1. 《吐血整理》-顶级程序员书单集
  2. 【项目】08年度科创项目“绘图助手工具箱”项目成果发布
  3. win10出现的异常解决
  4. 原生滑动选择器 html,自已开发完美的触摸屏网页版仿app弹窗型滚动列表选择器/日期选择器 - j.king...
  5. 关于雷霄骅博士的博客FFMPEG+SDL的音频播放器播放有杂音的问题
  6. [Unity2D]实现人物动画帧的导入以及左右移动
  7. c语言图像对比度增强,图像对比度增强实验分析报告.doc
  8. 原生ajax上传获取进度,ajax上传图片获取进度
  9. 兄弟打印机内存已满清零方法_兄弟打印机打印时显示内存已满怎么处理
  10. ADB的下载安装和基本命令