问题背景

服务器的Nvidia-Driver的版本与CUDA版本不一致,导致gpu计算无法使用。

问题查询

  • 查询Nvidia-Driver版本:
nvidia-smi

正常的版本对应(别的机器):

错误的版本对应(出问题的机器):

  • 查询CUDA版本:
[root@my]$ cat /usr/local/cuda/version.txt
CUDA Version 10.1.243

根据CUDA与Nvidia-Driver的对应关系(官方链接):

发现确实是我们的Driver版本过低,与CUDA不匹配造成。

方法一:降低cuda版本(不详细介绍了,因为我希望升级驱动)

方法二:升级Nvidia-Driver(本文方法)

解决方法

  1. 卸载原有驱动

    方法一:找到显卡驱动.run文件:

$ sh NVIDIA-Linux-x86_64-418.126.02.run --uninstall

   方法二:清除所有nvidia相关文件和依赖

$ yum remove nvidia-*

   为了删除干净还可以(目标就是把nvidia-driver的相关组件都清理掉):

rpm -qa|grep -i nvid|sort
yum  remove kmod-nvidia-*

值得注意的是,由于内核系统的不同,所采取的命令方法不同
apt-get属于ubuntu、Debian的包管理工具
yum则属于Redhat、Centos包管理工具
在选择利用什么命令删除时,应先确定自己的系统是什么。
如sudo apt-get purge nvidia-* 代替yum remove nvidia-*

在卸除驱动后一定记得重启

sudo reboot
  1. 下载安装新驱动
    驱动版本以及下载地址:官方
wget 相应下载地址
sh NVIDIA-Linux-x86_64-418.126.02.run

   然后按照提示框一步步ok就行了

最终结果

其他

  • 可以使用如下代码测试gpu计算是否可以使用(pytorch):
import torch
a = torch.cuda.is_available()
print(a)ngpu= 1
# Decide which device we want to run on
device = torch.device("cuda:0" if (torch.cuda.is_available() and ngpu > 0) else "cpu")
print(device)
print(torch.cuda.get_device_name(0))
print(torch.rand(3,3).cuda())
  • 显卡,显卡驱动,nvcc, cuda driver,cudatoolkit,cudnn到底是什么?
    链接

CentOS.7卸载与安装Nvidia Driver相关推荐

  1. CentOS 7版本下安装NVIDIA显卡驱动

    文件准备:根据自己的硬件配置需求,去NVIDIA官网下载符合显卡的驱动文件和cuda文件,笔者这里以CentOS 7.6下安装RTX 3090为实例. 1.拷贝文件 在系统安装完以后并且确保能上网的情 ...

  2. centos 8 卸载anaconda_Centos7安装JDK1.8

    本文将介绍JDK 1.8在Centos 7下的安装使用. 我们需要卸载干净Centos本身携带的OpenJDK,使用命令rpm -qa | grep jdk查看当前安装的JDK,如下图所示 ​ 使用y ...

  3. 卸载并安装NVIDIA显卡驱动

    之前安装过显卡驱动,但是过一段时间就会出现显卡出现问题,输入NVIDIA-smi总会有报错信息,提示无法连接上显卡驱动等问题,无奈就只好重新安装 1.卸载 首先卸载原有的NVIDIA驱动 sudo a ...

  4. CentOS-6.2安装Nvidia显卡驱动

    Nvidia显卡驱动不支持带xen的内核. 1. 安装kernel: 查看自己的内核版本 #uname -r #yum install kernel kernel-devel 重启电脑. 2. 下载显 ...

  5. CentOS 安装Nvidia驱动+CUDA+cuDNN+Anaconda3

    文章目录 一.安装Nvidia显卡驱动 1.1 添加 ELRepo 源: 1.2 删除已安装的驱动,如果是之前没有安装过显卡驱动的这步可以跳过 1.3 安装显卡检查程序: 1.4 检测显卡型号,并选择 ...

  6. linux安装p100驱动,CentOS安装Nvidia驱动和CUDA ToolKit

    配置有GPU的云服务器或物理机需要安装正确的驱动软件才能够使用,以NVIDIA Tesla GPU为例,需要安装Tesla显卡驱动作为硬件驱动程序,还需要安装CUDA作为上层应用程序所需要的库. 本文 ...

  7. [Tensorflow] Ubuntu下NVIDIA Driver+CUDA+cuDNN 安装踩坑总结

    最近安装了3台workstation, 显卡分布是Quadro P2000, Quadro K220和Quadro 2000.其中第一台工作站是去年新入的,另外两台都是3-5年历史的旧机器了. 第一台 ...

  8. 史上最全的ubuntu16.04安装nvidia驱动+cuda9.0+cuDnn7.0

    本文参考了 http://www.cnblogs.com/5211314jackrose/p/7081020.html https://jingyan.baidu.com/article/4853e1 ...

  9. 在Fedora上安装NVIDIA驱动详细教程及解析

    写在前面:在经历了各种尝试和试错之后,发现并总结出了比较合适.安全且合理的NVIDIA驱动安装方案,本教程基于Fedora linux发行版,rhel,RockyOS等基本完全相同,deb系及其它li ...

最新文章

  1. Java基础super关键字、final关键字、static关键字、匿名对象整理
  2. python模块xlwt怎么用不了_python中使用 xlwt 操作excel的常见方法与问题
  3. POJ-1845 Sumdiv 逆元,特殊情况
  4. 河南职称计算机啥时间考试,河南省2020年高级职称考试时间与具体安排
  5. Linux GCC简明教程(编写c语言程序)
  6. [Git高级教程 (一)] 通过 Tag 标签回退版本修复 bug
  7. 深入理解Magento – 第七章 – 自定义Magento系统配置
  8. 现代测试技术与软件关系大吗,现代测试技术及应用学习心得
  9. 制药企业BI系统方案整体设计分享
  10. NIS服务的基本配置----视频下载
  11. HTML之一天学会html(常用标签+网页架构)
  12. 京东面试撞上重感冒(纯粹面试之感)。。。。。。
  13. 计算机网络计算1g等于多少MB,1g是多少mb(1g等于多少兆)
  14. html页面字体缩小模糊怎么解决,ps字体模糊怎么变清晰 设置一下字体大小,是否一样...
  15. UltraCompare for Mac(文件内容对比神器)v22
  16. QQ快速登录的实现原理
  17. uniapp实现上传图片
  18. flink本地运行及访问webui
  19. 工业互联网:7  项目生命周期管理(1)
  20. Rabbit的基本概念

热门文章

  1. 二进制数与十六进制数之间如何互相转换
  2. PDF图片怎么提取?看完这篇你就会了
  3. error: ‘stol’ was not declared in this scope
  4. 【IoT】 产品设计之α、β、λ测试
  5. 1396:病毒 (拓扑序)
  6. 使用docker安装mysql8及mysql5.7
  7. 割平面算法求解整数规划
  8. JAVA javaweb JSP水果管理系统源码(水果进销存管理系统水果管理系统(水果进销存)
  9. 无线网可拼服务器吗6,当WiFi 6遇到了WiFi 6+,我们的网速真的变快了吗?
  10. DataFrame中小数的保留小数点后两位