文章目录

  • 准备工作
  • 安装前部署
    • 1. 关闭SELinux
      • 检查状态
    • 2. 添加rpm软件源
      • 安装
    • 3. 安装Nvida GPU驱动
  • 安装CUDA
    • 确认CUDA环境
      • 1. 检查GPU
      • 2. 检查GCC编译器
      • 3. 自行检查系统内核版本
    • 安装CUDA
  • 安装cuDNN
  • 注意问题
    • 1. file missing
    • 2. 安装显卡驱动提示Nothing to do

准备工作

  • 环境:CentOS7.5 +(带开发工具的部署)
  • GPU:1 * Nvidia Tesla P4
  • CPU:Intel Xeon E5-2682v4 (2.5 GHz)
  • RAM:8Gib
  • CUDA:版本8.0或以上
  • cuDNN:与CUDA版本应对应,且不能低于图形训练框架需要版本

安装前部署

1. 关闭SELinux

修改/etc/selinux/config的内容,使SELINUX的值为disabled

检查状态

重启生产环境后,执行下列命令,返回值应为DIsabled

getenforce

2. 添加rpm软件源

执行前,请先检查是否已存在相关源(EPEL、REMI)

yum repolist

安装

yum install -y http://rpms.famillecollet.com/enterprise/remi-release-7.rpm
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
yum makecache #建立缓存

3. 安装Nvida GPU驱动

安装显卡检测程序包

yum install -y nvidia-detect

检测显卡型号

nvidia-detect -v

若安装正常,应看到类似如下代码

$ nvidia-detect -v
Probing for supported NVIDIA devices...
[10de:06dd] NVIDIA Corporation GF100GL [Quadro 4000]
This device requires the current 346.47 NVIDIA driver kmod-nvidia

以上信息解读:

  1. 设备PCIE号:10de:06dd
  2. 显卡名称:NVIDIA Corporation GF100GL
  3. 显卡处理器:Quadro 4000
  4. 安装驱动版本:346.47 NVIDIA driver kmod-nvidia

否则应如下:

$ nvidia-detect -v
Probing for supported NVIDIA devices...
[15ad:0405] VMware SVGA II Adapter
No NVIDIA devices were found.

若驱动版本不低于400.00,则应安装最新的驱动

yum install -y dia-x11-drv nvidia-x11-drv-32bit && yum remove xorg-x11-glamor

以上操作操作完成后,需要重启生产环境。

安装CUDA

以下讲述安装CUDA驱动,在安装CUDA工具包前,请确认已经安装完成Nvida驱动。

确认CUDA环境

1. 检查GPU

lspci

2. 检查GCC编译器

rpm -qa | grep “gcc*”

3. 自行检查系统内核版本

此处不做讲解。

安装CUDA

https://developer.nvidia.com/cuda-downloads

若下载的CUDA为最新版,直接选择对应系统版本即可,若为旧版本,则进入Legacy Releases下载其他历史版本。

按照下图所示指引,进行rpm在线安装

将rpm源或.run文件上载到生产环境,准备开始安装。


按照上一步所讲的步骤开始安装cuda,安装时请注意跳过NIVDA驱动安装(字样为 Install for Linux)

安装完成后,请部署环境变量:

export PATH=$PATH:/usr/local/cuda-9.0/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64

切换到用户根目录,并使其生效

cd ~
source .bashrc

若要提升为系统变量,请将上述添加至/etc/profile

安装cuDNN

https://developer.nvidia.com/rdp/form/cudnn-download-survey

需要登录

登录完成后,请按照下图指引下载

其他下载步骤此处不做讲解。


将下载完成的cuDNN上载到生产环境并解压

tar -xzvf cudnn-9.0-linux-x64-v7.1.tgz

复制相关文件到cuda特定目录下(/usr/local/cuda-9.0/,9.0为版本号)

cp cuda/include/cudnn.h /usr/local/cuda-9.0/include && chmod a+r
/usr/local/cuda-9.0/include/cudnn.h

cp cuda/lib64/libcudnn* /usr/local/cuda-9.0/lib64 && chmod a+r
/usr/local/cuda-9.0/lib64/libcudnn*

注意问题

1. file missing

若执行图形训练框架出现 ******.so.6缺失,则为cuDNN版本错误

so.6 即为 cuDNN 6.0
so.5 即为 cuDNN 5.0

2. 安装显卡驱动提示Nothing to do

检查是否配置好对应yum源

CentOS7 从零安装NVIDA、CUDA、cuDNN相关推荐

  1. Darknet_Yolov4实战(一)_安装Ubuntu+cuda+cudnn

    Darknet_Yolov4实战(一)_安装Ubuntu+cuda+cudnn 安装Ubuntu18.04 安装显卡驱动 安装cuda 安装cudnn 安装Ubuntu18.04 首先关闭你要安装 U ...

  2. 真实机下 ubuntu 18.04 安装GPU +CUDA+cuDNN 以及其版本选择(亲测非常实用)【转】...

    本文转载自:https://blog.csdn.net/u010801439/article/details/80483036 ubuntu 18.04 安装GPU +CUDA+cuDNN : 目前, ...

  3. 【centos】安装nvida CUDA平台附带安装cudnn库及TensorRT8

    目录 1.安装 CUDAToolKit 2.安装cudnn库 3.附录:关于CUDA 4.英伟达GPU相关术语 1.安装 CUDAToolKit 使用 lspci | grep -i nvidia 列 ...

  4. cuda cudnn tensorflow对应_Ubuntu18.04下安装Tensorflow+cuda+cudnn+pytorch

    大体思路按照下面的链接完成 Ubuntu18.04安装TensorFlow-gpu2.0_dl_None-CSDN博客_ubuntu安装tensorflow2.0​blog.csdn.net 记录几点 ...

  5. 从头开始安装Ubuntu,cuda,cudnn,caffe,tensorflow,ROS

    前言 安装ubuntu一直是一件特别特别麻烦的事情,以前常常因为换一台主机就得完全重新安装一遍,每次安装都要折腾特别久,总会遇到各种各样的问题.因此很有必要写一个Blog完整记录整个过程及遇到的问题. ...

  6. tensorflow 深度学习 前期准备之 1080Ti显卡驱动安装 及 CUDA CUDNN 安装

    终于开始进军深度学习了,所用到的是tensorflow 在一位资深的NLP朋友的帮助下,幸运的找到了一台显卡是1080ti 内存是16G的不错的电脑 , 然后参考此文 https://www.cnbl ...

  7. win10环境下一键安装TensorFlow-gpu+cuda+cudnn

    这里主要介绍tensorflow-gpu版本的安装,如果需要安装Tensorflow CPU版本的,只需要将以下步骤中的tensorflow-gpu换成tensorflow就行了. 重点!!! 此方法 ...

  8. win10安装配置CUDA+cuDNN+Tensorflow2.0

    转载请注明作者和出处:http://blog.csdn.net/john_bh/ 文章目录 1. 概念说明 2. CUDA 3. cuDNN 1. 概念说明 CUDA(Compute Unified ...

  9. 小米Pro安装驱动+CUDA+CuDNN

    参照出处 一 安装驱动 下载驱动:https://www.geforce.com/Drivers 选择自己显卡的驱动 run文件权限更改 sudo chmod a+x NVIDIA-Linux-x86 ...

最新文章

  1. ubuntu连有线网 无法连接外网
  2. 极限挑战—C#100万条数据导入SQL SERVER数据库仅用4秒 (附源码)
  3. 来,聊聊程序员的爱情
  4. 转换汉字为unicode形式的字符串和转换unicode形式字符串转换成汉字
  5. 847. Shortest Path Visiting All Nodes(三)
  6. SCI论文写作训练营笔记汇总01_概述+文献检索与管理
  7. 10W+集群规模下,美团点评如何优化改造K8s?
  8. pthon-递归实战-操作文件
  9. Visual Studio 2015正式企业(Enterprise)版
  10. [译] 如何学习 CSS
  11. 《MFC游戏开发》笔记六 图像双缓冲技术:实现一个流畅的动画
  12. Linux安装docker-ce教程 centos依赖包安装
  13. PHP案例 许愿墙 PHP许愿墙
  14. 【转】Java技能清单
  15. VB图片分割器九宫格
  16. TC358775XBG是一颗将MIPI DSI信号转换成single/ dual -link LVDS的芯片,最高分辨率支持到1920x1200
  17. Parsing error: No Babel config file detected for xxx Either disable config file checking with requir
  18. 银行测试(8)-支付测试用例
  19. mysql left join 三表查询_MySql的join(连接)查询 (三表 left join 写法)
  20. 第四天 hadoop HDFS上传下载原理

热门文章

  1. postman调试http接口挑战鉴权Authorization
  2. 如何让电脑带双显示屏,显示不同的内容
  3. QT 多语言 字库 编码 文字方向相关问题
  4. 计算机毕业设计之仿12306火车票购票平台
  5. error: cannot lock ref 'refs/remotes/origin/test/pressure-test': 'refs/remotes/origin/test' exists;
  6. 创建一个TCP流式套接字
  7. 【Altium designer】新手入门(PCB layout设计)
  8. Mysql-可重复读的隔离级别在什么情况下会出现幻读
  9. 技术干货 | 人大金仓KFS基于分区索引的分片入库技术解析
  10. android的图形旋转与点内判断