ps:训练模型时xgb的GPU不支持了,报系统错误。一顿神操作,nvidia-smi突然不能用了,(手动狗头)查看原因。。。尼玛有两个版本nvidia-driver互相冲突,不知道为嘛它自己就给更新了嘛。。驱动报废,GPU也用不了,模型训练CPU不给力,心塞。那就驱动卸载,卸不干净,新的也装不上,凉凉。。
Markdown编辑贴上图比现实怎么搞。??
在我考虑把GPU环境弄进docker里怎么操作的时候发现神预言blog,完美解决我的问题。
奉上链接:https://blog.csdn.net/physuleo/article/details/97493900
我没他那么复杂的套路,思路就一个,卸载残留、安装驱动两步。

1、卸载

通常对旧的环境看一遍心中有数

查看 CUDA 版本
cat /usr/local/cuda/version.txt
查看 CUDNN 版本:
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
显卡驱动所使用的内核版本
cat /proc/driver/nvidia/version
查看电脑驱动
cat /var/log/dpkg.log | grep nvidia

开始卸载:

sudo apt-get remove --purge nvidia*
# 提示有残留可以接 sudo apt-get autoremove --purge nvidia*
## 一般情况下都会遇到卸载失败。
sudo rmmod nvidia
$ sudormmodnvidiarmmod:ERROR:Modulenvidiaisinuseby:nvidiamodeset nvidiauvm12

上面报错有没有眼熟?这时,就要一点一点的卸载整个驱动了,首先要知道现在kernel mod 的依赖情况,从错误信息中知道,nvidia_modeset nvidia_uvm 这两个 mod 依赖于 nvidia, 所以要先卸载他们
lsmod | grep nvidia 查看NVIDIA占用情况(下图是我后面截取的,卸载时占用160)
![image.png](https://img-blog.csdnimg.cn/img_convert/c6ef085e04ccace643a97ffe776a5e76.png#align=left&display=inline&height=163&margin=[object Object]&name=image.png&originHeight=326&originWidth=1530&size=586601&status=done&style=none&width=765)
sudo lsof -n -w /dev/nvidia* 查看下有哪些进程使用了 nvidia*
通常看上去好多进程在占用,但是进程号就一个, kill -9
继续卸载依赖:

sudo rmmod nvidia_uvm
sudo rmmod nvidia_modeset
sudo rmmod nvidia

在这一步,可能一直卸载不掉,所以请重复前两句多卸几次就干净了,等到执行最后一句不报异常就ok了,到了这里就真的卸载完成了。
2、安装合适的驱动
NVIDIA官网驱动:https://www.nvidia.com/Download/index.aspx?lang=cn
我的显卡是Tesla所以如图,其他自己看着办
![image.png](https://img-blog.csdnimg.cn/img_convert/90112352f3d78d65182c429d3a24b6bb.png#align=left&display=inline&height=266&margin=[object Object]&name=image.png&originHeight=532&originWidth=1108&size=65745&status=done&style=none&width=554)
下载好文件应是:NVIDIA-Linux-x86_64-460.91.03.run
把文件上传到服务器一个目录。

cd ~
sudo chmod 777 NVIDIA-Linux-x86_64-460.91.03.run
sudo bash NVIDIA-Linux-x86_64-460.91.03.run

执行上面命令就开始安装了
中间有几个选项
The distribution-provided pre-install script failed! Are you sure you want to continue?
选择 【yes】 继续。
Would you like to register the kernel module souces with DKMS? This will allow DKMS to automatically build a new module, if you install a different kernel later?
选择 【No】 继续
install … 一堆, 唯一项 【OK】
Nvidia’s 32-bit compatibility libraries? 选择 【No】 继续。
Would you like to run the nvidia-xconfigutility to automatically update your x configuration so that the NVIDIA x driver will be used when you restart x? Any pre-existing x confile will be backed up. 选择 【Yes】 继续
等它结束这就装好了。

快来试试 nvidia-smi
![image.png](https://img-blog.csdnimg.cn/img_convert/133088b6770cf4bc998d313c39190d29.png#align=left&display=inline&height=393&margin=[object Object]&name=image.png&originHeight=786&originWidth=1658&size=1022852&status=done&style=none&width=829)
熟悉的手感回来了,少一点套路,多一点真诚,世界会更美好。
ps:换了新工作遇到太多问题,头发日渐稀少,而CSDN、博客园等常用的blog,充斥着大量抄袭、灌水实际解决问题的blog太少,看这些东西浪费时间,问题还依旧在。发奋以后不再乱更blog,以前的在那摆着吧,后面所有心得记录在本地笔记、闲得无聊再更,无需关注。
支持原创、支持VPN翻墙、Google去搜索解决问题。

NVIDIA驱动重装经历相关推荐

  1. 【服务器】nvidia驱动重装

    文章目录 卸载旧驱动 下载安装驱动 安装过程 重启 提升nvidia-smi运行速度 完成 在重启服务器的时候,发现nvidia驱动自动升级,使用 nvidia-smi 命令会报错如下,故重装nvid ...

  2. UEFI模式创建Grub2引导ubuntu16.04和windows10,并安装Linux Nvidia驱动

    目录 Table of Contents 目录 说明:正如EasyBCD官网文档https://neosmart.net/wiki/easybcd/uefi/ 说的那样: ​ 1.Linux的安装 2 ...

  3. Ubuntu + nvidia驱动+ cuda安装教程以及重装问题

    操作系统:ubuntu 18 nvidia驱动版本: 515 cuda: 11.7 在此方面掉过坑,写此篇文章mark一下.如果遇到同样问题的小伙伴可以参考一下. 第一次在ubuntu上尝试安装nvi ...

  4. HP Zbook 15重装ubantu18后,安装Nvidia驱动(踩坑实录,不推荐尝试)

    电脑型号:HP Zbook 15  G6 显卡:nvidia Quadro T1000 安装方式: 使用官方的NVIDIA驱动进行手动安装(经过安装方式和结果对比,强烈不推荐手动安装的方式,这就是一篇 ...

  5. ubuntu18.04安装NVIDIA驱动的心酸(失败)经历及解决方法(换系统成功)

    问题描述: ubuntu18.04系统安装Nvidia驱动,nvidia-smi能够输出GPU显卡信息,但sudo reboot后,黑屏,不能进入图形界面,无法开机.进入tty界面删除nvidia驱动 ...

  6. ubuntu 18.04重装+Nvidia驱动+Anaconda

    真是服气!!!!配环境的时候系统崩了!!!系统装好后又崩了!!!!Ubuntu18.04 系统重启时黑屏启动不了!!! 一.系统重装 原因:ubuntu 默认安装了第三方开源的驱动程序nouveau, ...

  7. ubuntu20.04重装nvidia驱动之后无法正常进入图形化界面

    ubuntu20.04内核自动升级之后,nvidia-smi显示NVIDIA-SMI has failed because it couldn't communicate with the NIVID ...

  8. 重装NVIDIA驱动遇到的一个问题(已解决)

    重装NVIDIA驱动遇到的一个问题(已解决) 今天开机时发现Ubuntu图形界面循环登录了,本打算按之前配置caffe时的装NVIDIA驱动的方法重装一下驱动(参照小白:手把手教你在Ubuntu 16 ...

  9. Nvidia驱动失效,采用官方的方法重装更快

    一.说明 我在GTX1060笔记本上安装ubuntu20.04系统后,几乎隔几个月会出现显卡驱动程序失效,分辨率下降,干扰正常工作.因此 要不断重新安装nvidia驱动.在重新安装时候又出现提示:   ...

  10. win10 linux uefi启动不了系统安装教程,【从踩坑到教程】win10下ubuntu18.04双系统UEFI模式安装、Nvidia驱动安装...

    欢迎转载,转载请说明出处 前言 之前(旧笔记本电脑)装过Ubuntu,按照经验贴一次就成功了,所以我以为不就是装系统嘛,很简单马上就能完事. 结果--这次(新笔记本电脑)花了 4天时间才装好.配好环境 ...

最新文章

  1. Python培训讲解二叉树的三种深度
  2. 三、Ubuntu16.04 安装Jira8.2.2(自带中文包)和破解
  3. LNK1136报错解决方法
  4. Pascal VOC 数据集国内下载
  5. Atitit 图像资料文档分类器 netpic image 网络图片与人像图片分类 微信图片分类 D:\0workspace\atiplat_img\src\com\attilax\img\ut
  6. mysql 建模工具 mac_MySQL Workbench for Mac 6.0 下载 - Mac上优秀的数据库建模工具 | 玩转苹果...
  7. 进程间通信之CreatePipe
  8. 滑动窗口(java)
  9. 数据库备份的几种方式的详细步骤
  10. 【矩阵论】矩阵微积分的一些公式
  11. 【最强实习生】20场Android面试斩获大厂offer,来看看我都会些什么
  12. 电脑重装系统后数据恢复的方法
  13. 网络协议之Netflow与sFlow协议
  14. 【Python CI】圈复杂度 lizard
  15. 2022双非计算机保研经验(西电,北邮,厦大,浙软)
  16. matlab中screen函数,13 PTB Screen 函数
  17. VI 之快速查找定位
  18. excel高级功能-分级显示
  19. 微服务实施笔记(一)
  20. Android webview Input type=file 文件上传 解决方法

热门文章

  1. MIT Place Pulse数据集及google街景图片爬取
  2. 当电子工程师十余年,感慨万千
  3. Mysql中使用IF
  4. JQuery.BlockUI弹框插件
  5. Android11 下载APK并安装
  6. 数字电路与逻辑设计——加法器实现
  7. element-ui表单中的文本域 调整高度
  8. java 噪声信道模型_噪声信道模型zz
  9. JAVA对接SAP接口使用sapjco3的见解
  10. java疯狂讲义精粹第2版_疯狂Java讲义精粹(第2版)(含CD光盘1张)