Ubuntu 16.04 Nvidia Driver+tensorflow-gpu+cuda+cudnn 安装文档

本文采用 CUDA 一站式驱动安装方案,文末附有安装常见问题解决方法

RTX 2080 Ti 请按本文指定版本安装,更改相对应的安装文件名, 本文默认执行 GTX 1080 Ti 配置

[Github 原文档] @Bobby Chen 记得留下小星星

Ubuntu 16.04 Deep Learning Environment Setup


GTX 1080 Ti 配置方案


RTX 2080 Ti 配置方案


0. 确认 Kernel Version 内核版本

 $ uname -a

若不符合要求请先升级或降级内核,或下载相应内核 (注意修改所需内核版本后进入相应内核版本 ubuntu)

GTX 1080 Ti

wget https://kernel.ubuntu.com/~kernel-ppa/mainline/v4.10/linux-headers-4.10.0-041000_4.10.0-041000.201702191831_all.deb
wget https://kernel.ubuntu.com/~kernel-ppa/mainline/v4.10/linux-headers-4.10.0-041000-generic_4.10.0-041000.201702191831_amd64.deb
wget https://kernel.ubuntu.com/~kernel-ppa/mainline/v4.10/linux-image-4.10.0-041000-generic_4.10.0-041000.201702191831_amd64.debsudo dpkg -i *.deb

RTX 2080 Ti

wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-headers-4.15.7-041507_4.15.7-041507.201802280530_all.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-headers-4.15.7-041507-generic_4.15.7-041507.201802280530_amd64.deb
wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-image-4.15.7-041507-generic_4.15.7-041507.201802280530_amd64.debsudo dpkg -i *.deb

1. 卸载所有原驱动

$ sudo apt-get purge nvidia*

2. 禁用nouveau

• 新建-blacklist-nouveau.conf 输⼊指令:
$ sudo vi /etc/modprobe.d/blacklist-nouveau.conf
• 往 blacklist-nouveau.conf 文件中写⼊:
blacklist nouveau
options nouveau modeset=0

禁 Ubuntu 自带开源驱动nouveau,写入后保存重启

$ sudo reboot
• 重启后在终端执行行命令:(Terminal)
$ lsmod | grep nouveau
查看nouveau模块是否被加载,若无输出,则执行下一步

3. 下载并安装 Cuda 和 Nvidia 驱动

(请确认内核版本 Kernel Version 是否达到 CUDA 版本安装要求,否则 CUDA 安装将出错)

Download Installer for Linux Ubuntu 16.04 x86_64
GTX 1080 - Download CUDA: CUDA Toolkit 9.0 (Sept 2017) [CUDA Link]
RTX 2080 - Download CUDA: CUDA Toolkit 10.0 (Sept 2018) [CUDA Link]


Ctrl + Alt + F1-( Enter virtual consoles )进入tty1命令行界面安装CUDA
Ctrl + Alt + F7-( Return back to GUI )回到桌面系统界面

禁⽤X服务 - Kill your current X server session by typing

$ sudo service lightdm stop

安装 CUDA 和 NVIDIA 驱动

注意:确定下载的 cuda 版本后执行指令

$ sudo chmod 777 cuda_9.0.176_384.81_linux.run
$ sudo ./cuda_9.0.176_384.81_linux.run --no-opengl-libs
...

进入 CUDA 安装中同意安装 Nvidia 驱动

accept #同意安装
y #安装Driver,将自动安装CUDA版本相匹配的Nvidia驱动
y #安装CUDA Toolkit install
<Enter> #安装到默认目录
y #创建安装目录的软链接
n #不复制Samples,因为在安装目录下有/samples

安装完成后会显示 CUDA 和 Nvidia 驱动成功安装

A. vim 打开.bashrc 在末行加⼊以下命令
export PATH="/usr/local/cuda/bin:$PATH"
export LD_LIBRARY_PATH=“/usr/local/cuda/ lib64:$LD_LIBRARY_PATH”
执行指令更新 .bashrc 文件 - Reload .bashrc with
$ source .bashrc
B. Nvidia 驱动安装完成
$ nvidia-smi

C. 安装及路径测试,CUDA安装完成
$ nvcc -V

编译并测试设备 deviceQuery:
$ cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
$ sudo make
$ ./deviceQuery
编译并测试带宽 bandwidthTest:
$ cd ../bandwidthTest
$ sudo make
$ ./bandwidthTest

如果两个测试的结果都是 Result = PASS CUDA 安装成功

4. 安装 cuDNN

GTX 1080 - cuDNN v7.1.4 (May 16, 2018), for CUDA 9.0 [cuDNN Link]

RTX 2080 - cuDNN v7.5.0 (May 16, 2018), for CUDA 10.0 [cuDNN Link]

RTX 2080 Ti 请按指定版本安装 cuDNN 以及更改以下相对应的安装文件名默认执行 gtx 1080 Ti

解压后的 cudnn-9.0-linux-x64-v7.1.tgz ⽂文件cuda,执行以下指令安装:
$ tar -zxvf cudnn-9.0-linux-x64-v7.1.tgz
$ cd cuda $ sudo cp lib64/lib* /usr/local/cuda/lib64/
$ sudo cp include/cudnn.h /usr/local/cuda/include/
然后更新网络连接:
$ cd /usr/local/cuda/lib64/ $ sudo chmod +r libcudnn.so.7.1.4
$ sudo ln -sf libcudnn.so.7.1.4 libcudnn.so.7
$ sudo ln -sf libcudnn.so.7 libcudnn.so $ sudo ldconfig

_5. 安装Tensorflow-gpu

GTX 1080

 $ pip install --user tensorflow-gpu==1.8.0

RTX 2080

 $ pip install --user tensorflow-gpu==1.13.0

6. 测试 - Testing


7. 常见配置问题 - Issues

登⼊界⾯死循环问题: Login loop issue

1. 进入文本界面: CTRL+ALT+F1

2. Uninstall any previous drivers: - 删除 nvidia 相关文件

$ sudo apt-get remove nvidia-*
$ sudo apt-get autoremove

3. Uninstall the drivers from the .run file: - 卸载 nvidia 驱动

$ sudo nvidia-uninstall

4. 此时,重启 - Reboot -> login normally

5. 驱动重新安装 - Driver reinstall


NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running issue

0. 确认 Kernel 版本是否高于 4.10

$ uname -a#目前使用版本为 4.15
Linux CAI 4.15.0-50-generic #54~16.04.1-Ubuntu SMP Wed May 8 15:55:19 UTC 2019 x86_64 x86_64 x86_64 GNU/Linux

若版本低于 4.10 必须升级, 升级方法如下

wget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-headers-4.15.7-041507_4.15.7-041507.201802280530_all.debwget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-headers-4.15.7-041507-generic_4.15.7-041507.201802280530_amd64.debwget http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.15.7/linux-image-4.15.7-041507-generic_4.15.7-041507.201802280530_amd64.debsudo dpkg -i *.deb

升级完成后 nvidia-smi 出现 GPU 使用狀況栏可不用重新安装 Driver, 若未出现可按步骤重新安装 Driver

1. 确认是否插入显卡

$ lspci | grep 'VGA'#找到卡后,显示显卡讯息
01:00.0 VGA compatible controller: NVIDIA Corporation Device 1b06 (rev a1)

2. 确认 security boot 是否为disable的状态

a. 开机后, 进入Bios 设定画面(若是Acer的电脑, 按Del 或是F2 即可进入Bios)
b. 改成disable 后, 重新开机

调整屏幕分辨率: Display resolution issue

METHOD1:

1.添加 /etc/X11/xorg.conf 文件,将此模式保存为默认分辨率。

$ sudo gedit /etc/X11/xorg.conf

2.粘贴以下内容: - copy below -> paste to xorg.conf

Section "Monitor"
Identifier "Configured Monitor"
Modeline "1920x1080_60.00" 173.00 1920 2048 2248 2576 1080
1083 1088 1120 -hsync +vsync
Option "PreferredMode" "1920x1080_60.00"
EndSection
Section "Screen"
Identifier "Default Screen"
Monitor "Configured Monitor"
Device "Configured Video Device"
EndSection
Section "Device"
Identifier "Configured Video Device"
EndSection

METHOD2:

1.生成指定分辨率 (one-off)

$ cvt 1920 1080
# 1920x1080 59.96 Hz (CVT 2.07M9) hsync: 67.16 kHz; pclk: 173.00 MHz
Modeline "1920x1080_60.00"  173.00  1920 2048 2248 2576  1080 1083 1088 1120 -hsync +vsync

2.使用xrandr创建new mode (make newmode)

$ sudo xrandr --newmode "1920x1080_60.00"  173.00  1920 2048 2248 2576  1080 1083 1088 1120 -hsync +vsync

3.添加newmode,终端输入xrand查看显示器名称 (add mode)

$ sudo xrand --addmode [THE NAME OF YOUR DISPLAY] "1920x1080_60.00"

4.将分辨率应用到输出设备 (output display)

$ sudo xrand --output [THE NAME OF YOUR DISPLAY] --mode "1920x1080_60.00"

Uninstall - 卸载

卸载 nvidia - uninstall nvidia

$ sudo apt-get purge nvidia*

卸载 Cuda - uninstall Cuda:

$ cd /usr/local/cuda/bin
$ sudo ./uninstall_cuda_7.5.pl

卸载 Cudnn - uninstall Cudnn:

$ sudo rm -rf /usr/local/cuda/include/cudnn.h
$ sudo rm -rf /usr/local/cuda/lib64/libcudnn

Ubuntu16.04 CUDA和GPU的最简最全安装方案及常见问题解决方法,GTX1080 Ti 和 RTX2080 Ti 亲测!相关推荐

  1. VMware12安装虚拟机教程、Ubuntu16.04安装教程、常见问题解决方法

    虚拟机.Linux操作系统介绍及下载地址 虚拟机VMware Workstation Pro 12.1.0 for Windows下载地址: http:// www. vmware.com/cn/ ( ...

  2. Ubuntu16.04 搜狗输入法输入汉字时候选栏是一串字符数字乱码问题解决方法

    转载自:https://blog.csdn.net/liudahanghang/article/details/80494851 1. 如果是刚装完搜狗输入法,则输入命令: sudo apt-get ...

  3. Caffe + Ubuntu 15.04/16.04 + CUDA 7.5/8.0 在服务器上安装配置及卸载重新安装(已测试可执行)

    本文参考如下: caffe 安装所需的所有资源可在百度网盘下载 链接: http://pan.baidu.com/s/1jIRJ6mU 提取密码:xehi 在服务器上为每个子用户拷贝caffe 使用 ...

  4. win10+Ubuntu16.04+Quadro P600双系统安装以及独显驱动安装

    win10+Ubuntu16.04+Quadro P600双系统安装以及独显驱动安装 终于装完了双系统并完成了显卡配置这一步.安装双系统可以说是巨坑无数,这里从头记录一下 烧录镜像 首先是制作镜像,在 ...

  5. GPU环境配置指南(Ubuntu16.04+CUDA+CUDNN)

    前言 这两天由于种种原因,反复重装系统并配置了深度学习开发环境,无意中便总结了一份环境配置指南出来,所幸再稍加整理,和大家分享出来. 本指南确认无误的环境是: 系统是Ubuntu16.04 GPU是N ...

  6. YOLO学习-3:ubuntu16.04+ yolov3(darknet)+GPU(nvidia 1080ti)+opencv2.4.11 摄像头测试实践

    一 硬件条件:工作站 大版本主机 +4块 invidia  1080ti的gpu  实际测试,只能用一个,不知道四个都用的话如何设置,有知道的请告诉一下. ./darknet detect cfg/y ...

  7. Anaconda ubuntu16.04 Cuda 8.0安装pytorch

    Pytorch 安装 Pytorch安装真的太让人省心了,在anaconda的环境下进行安装,只需要一个命令 具体命令请查看官网pytorch 找到适合你的版本进行安装 本机环境: anaconda3 ...

  8. Ubuntu16.04安装Caffe史上最详细教程(CPU),亲测三次!!!

    一.前言 为了安装caffe,本人已经在centos7.x上试错了1次,目前弃疗~:在Ubuntu18.04上试错了3次,目前也弃疗~不是我懒,说实话,bug是真tm多,问问度娘,自己体会体会~我一向 ...

  9. Win10 安装 Ubuntu16.04 双系统及 Ubuntu 下常用软件的安装(2022.3更新)

    Win10 安装 Ubuntu 16.04 双系统 下载 Ubuntu 镜像文件:官网,选择 ubuntu-16.04.5-desktop-amd64.iso (1)下载 UltraISO软碟通,对一 ...

最新文章

  1. ABP理论学习之授权(Authorization)
  2. 线程:synchronized
  3. 小明学习Linux运维课后习题实战A
  4. 迎.NET6,今日先送200P全新视频教程 / 源码
  5. 贷款购房 房贷 每月还款额是如何计算出来的? 每月还款额计算步骤/方法
  6. 【linux】linux 安装 redis
  7. xhr请求python_Python爬虫进阶必备!关于某电商网站的加密请求头!
  8. 中文信息处理(二)—— 分词
  9. 停止、删除所有的docker容器和镜像
  10. kubenetes 1.4 修改kubelet启动参数修改方法
  11. 机器学习算法时间复杂度的考虑
  12. 熊猫Pivot_table()– DataFrame数据分析
  13. Java EE eclipse 优化配置(2020)
  14. Log4j漏洞及解决方案,亲测
  15. 深度解析volatile关键字,就是这么简单
  16. 2018太原理工计算机二级,太原理工大学2018年度全面绩效考核结果和发放考核绩效的通知...
  17. mac开机启动mysql_mac 设置mysql开机自启动
  18. matlab解算平差实例,MATLAB软件在测量平差解算中的应用
  19. 谷歌升级商业搜索软件
  20. 在SAGE系列期刊上发表论文

热门文章

  1. 利用Java实现福彩双色球项目(支持单式/复式购买)
  2. 7-1 判断回文字符串
  3. Cesium开发:调整3dtile高度
  4. Slurm学习笔记(二)
  5. Python反反爬虫 - Frida破解某安卓社区token反爬虫
  6. html显示隐藏域的值,JavaScript获取文本框/编辑框/隐藏域的值
  7. 2019天下3最新服务器,天下3:2019标准号全民竞技赛【太虚】门派定位解析及入门讲解...
  8. 听说首映的复联4,卖的就是情怀?爬取豆瓣复联4评论 !
  9. 红米8A/redmi8A刷入Magisk
  10. Redis支持php版本,redis支持windows吗