写在前面,抛开nvidia驱动和tf-gpu版本谈cuda及cudnn的安装都是耍流氓。大家一定要注意版本对应关系,我遇到了几个典型的因版本不对应导致的问题,我会写在本文后面。

机器显卡为tesla t4.安装的驱动为418.81.07;安装的cuda版本为cuda10.0 ;cudnn版本为7.6.5;tf-gpu版本为1.14.0

1.卸载旧版本:
cuda的默认安装在 /usr/local/下,用下面的命令卸载:

sudo /usr/local/cuda-x.x/bin/uninstall_cuda-x.x.plsudo rm -rf /usr/local/cuda-x.x

2.安装新版本:
下载自己对应的cuda,链接:https://developer.nvidia.com/cuda-toolkit-archive
下载.run文件后上传到/usr/local/ 文件下,这里为了方便直接下载到了/usr/local

第一部分,安装命令:

cd /usr/local/sudo chmod a+x cuda_10.0.130_410.48_linux.runsudo ./cuda_10.0.130_410.48_linux.run --no-opengl-libs

接下来就输入accept,然后除了提示安装opengl链接库的时候和拷贝samples输入n外,其余输入y。安装完成,重启机器。
第二部分,环境变量(注意换成自己的路径):

export PATH="/usr/local/cuda-10.0/bin:$PATH"
export LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH" 

或者使用命令打开.bashrc,即
sudo gedit ~/.bashrc
在最后面添加(注意换成自己的路径):

export CUDA_HOME=/usr/local/cuda-10.0
export LD_LIBRARY_PATH=/usr/local/cuda-10.0/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-10.0/bin:$PATH

完后,利用nvcc -V查看,输出正常即可。

3.我遇到的问题(按顺序来):

首先,我全部装完后(注意这时我的驱动版本不是418.181.07,而是410.129).运行代码后发现第一个问题:

failed call to cuInit: CUDA_ERROR_UNKNOWN

我查阅博客发现有可能是cuda没正确安装,测试我的cuda是否正确安装,通过下列指令:

cd /usr/local/cuda-10.0/samples/1_Utilities/deviceQuery
sudo make
./deviceQuery

报错 cudaGetDeviceCount returned 30 -> unknown error Result = FAIL

注意这里,我以为是我的cuda没有正确安装,但是通过nvcc -V是可以查出来版本的,证明cuda没有装错,有可能是驱动不对劲。我挣扎了好久终于决定,装一个新的驱动,即将410.129变为418.181.07.装完后,发现上述两个问题都解决了。所以我的问题根本就是:驱动版本与cuda不匹配。但是但是但是,我在搜素驱动的时候,cuda版本一栏我勾选的是10.0,然后推荐的就是410.129这个,为什么会不行呢,很奇怪(这也告诉我们,推荐的不一定好用)。第二把,在勾选的时候我选择了cuda10.1,推荐的驱动版本为418.181.07.因为是向下兼容的,然后就可以用了。

4.cudnn的安装:

下载链接:https://developer.nvidia.com/rdp/cudnn-archive
相对简单,去官网下载对应版本的cudnn(需注册账号),比如我下载后是:cudnn-10.0-linux-x64-v7.6.5.32.solitairetheme8,放在了 ' / ' 路径下

cp  cudnn-10.0-linux-x64-v7.6.5.32.solitairetheme8 cudnn-10.0-linux-x64-v7.6.5.32.tgz # 换后缀
tar -xvf cudnn-10.0-linux-x64-v7.6.5.32.tgz  # 解压

解压后,会产生cuda文件夹:

sudo cp cuda/include/cudnn.h    /usr/local/cuda-xx.x/include # 按需更改cuda路径
sudo cp cuda/lib64/libcudnn*    /usr/local/cuda-xx.x/lib64   # 按需更改cuda路径
sudo chmod a+r /usr/local/cuda-xx.xx/include/cudnn.h   /usr/local/cuda-xx.xx/lib64/libcudnn*

到这里nvidia驱动,cuda以及cudnn全部安装完毕。本文注重记录问题,有些步骤不是很详细,这里有几篇博客,可以说是保姆级教程,建议初学者使用:

cuda安装:https://blog.csdn.net/qq_29720657/article/details/109076087
                  https://blog.csdn.net/zbr794866300/article/details/106574704

驱动安装:https://blog.csdn.net/qq_30163461/article/details/80314630

linux服务器cuda,cudnn的安装与卸载相关推荐

  1. linux服务器nvidia驱动的安装与卸载

    一.卸载 有两种方式: (1)sudo apt-get install autoremove --purge nvidia* 有的时候这个命令会不好用,本人暂不知道原因,可以采用方式二 (2)sudo ...

  2. linux下cuda cudnn安装 没有权限的安装

    linux下cuda cudnn安装 cuda 10.2:https://developer.nvidia.com/cuda-10.2-download-archive?target_os=Linux ...

  3. anaconda+cuda+cudnn+pytorch安装踩坑大全

    windows环境下anaconda+pycharm+cuda+cudnn+pytorch安装踩坑大全 anaconda安装 pycharm安装 cuda cudnn pytorch gym环境安装 ...

  4. Linux操作系统下软件的安装与卸载

    在Windows下安装软件时,只需运行软件的安装程序(setup.install等)或者用zip等解压缩软件解开即可安装,运行反安装程序(uninstall.unware."卸载" ...

  5. Linux Centos下软件的安装与卸载方法

    参考文档https://blog.csdn.net/zolalad/article/details/11368879 linux下软件的安装与卸载 第一章 linux下安装软件,如何知道软件安装位置 ...

  6. linux 下的软件的安装与卸载

    linux下安装软件,如何知道软件安装位置 注:一般的软件的默认安装目录在/usr/local或者/opt里,可以到那里去找找. 指令名称:whereis 功能介绍:在特定目录中查找符合条件的文件.这 ...

  7. 第十章 Linux下RPM软件的安装与卸载

    第十章 Linux下RPM软件的安装与卸载 第一节 RPM软件包安装 rpm命名原则 如: vsftpd-3.0.2-9.el7.x86_64.rpm vsftpd 3.0.2 9 e17 x86_6 ...

  8. win11(amd)+cuda+cudnn+pytorch安装过程

    win11(amd)+cuda+cudnn+pytorch安装过程 Anaconda环境配置 "此电脑"右键属性,然后选择"高级系统设置"里的"环境变 ...

  9. **阿里云ECS Linux服务器图形化界面安装方法 Ubuntu**

    阿里云ECS Linux服务器图形化界面安装方法 Ubuntu 一.远程连接 二.登录后进入终端界面 三.更新服务器,安装图形化界面 apt-get update apt-get upgrade -y ...

  10. linux下.run文件的安装与卸载

    转载地址:http://www.2cto.com/os/201205/130236.html linux下.run文件的安装与卸载 .run文件的安装很简单,只需要为该文件增加可执行属性,即可执行安装 ...

最新文章

  1. 【SQL】sql语句LEFT JOIN(拼接表)详解
  2. shell之冒号的作用
  3. 谷歌提出「卷积+注意力」新模型,超越ResNet最强变体!
  4. P1984 [SDOI2008]烧水问题
  5. LInux CentOS6 无人值守安装实例(原作)
  6. java 调用python脚本过程_通过Java调用Python脚本
  7. 协程的挂起、恢复和调度的原理 (二)
  8. 怎么实现页面友好跳转_如何实现软,友好和一致的UI设计
  9. HTML5 绘制动画
  10. mysql中的字符是多长_mysql中的varchar到底能存多长的字符
  11. idea展现目录清晰方式
  12. vscode ubuntu18.04安装失败
  13. 【无标题】iTunes更新报错1110错误代码
  14. python docx 合并文档 图片_Python合并word文档制作电子书
  15. Openlayers 6 零基础教程
  16. 国产操作系统银河麒麟V10-sp1-0521桌面系统文件共享配置
  17. 【论文阅读|深读】 GraphSAGE:Inductive Representation Learning on Large Graphs
  18. 美通社企业新闻汇总 | 2019.1.9 | 直销巨头雅芳出售广州工厂,美团合作海外公司发展无人配送...
  19. 2-Arduino小车测速模板安装与测试
  20. 通过百度API实现图片车牌号识别

热门文章

  1. SQL-left(right,inner) join
  2. 网站性能优化之HTTP请求过程简述!
  3. 诗歌rails 之with_options
  4. Request header field Content-Type is not allowed by Access-Control-Allow-Headers跨域
  5. 【数据结构与算法】之深入解析“相交链表”的求解思路与算法示例
  6. 【数据结构与算法】之深入解析“打家劫舍”的求解思路与算法示例
  7. PaddlePaddle训练营——公开课——AI核心技术掌握——第1章迈入现代人工智能的大门——多层感知机网络模型
  8. Spring Boot (一)Spring Boot 概述
  9. ROS探索总结(五)——创建简单的机器人模型smartcar
  10. 【Linux系统编程】进程间通信之共享内存