问题:实验室深度学习tesla k40c工作站GPU突然不能使用

表现:跑神经网络模型特别慢,内存爆满,但是显存却空着

原因:显卡驱动程序不兼容,导致显卡GPU不可用。

备注:

实验室显卡驱动型号:NVIDIA-Linux-x86_64-384.111.run

下载地址:https://www.nvidia.cn/Download/driverResults.aspx/128768/cn

还可以在nvidia官网上下载相应型号的显卡驱动,官网地址为:https://www.nvidia.cn/Download/index.aspx

解决方案:重装Linux显卡驱动,具体步骤如下所示:

(1),准备驱动程序(通常是.run文件或者是.deb文件,本次实验中采用的是.run文件)。

(2),屏蔽nouveau驱动。Ubuntu系统集成的显卡驱动程序是nouveau,它是第三方为NVIDIA开发的开源驱 动,我们需要先将其屏蔽才能安装NVIDIA官方驱动。 所以我们要先把驱动加到黑名单blacklist.conf里。我们要先修改该文件的属性才能编辑,

修改属性:

$sudo chmod 666 /etc/modprobe.d/blacklist.conf

修改文件:

$sudo vi /etc/modprobe.d/blacklist.conf

在文件的最后几行插入如下代码块:

blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist rivatv
blacklist nvidiafb

更新文件:

sudo update-initramfs -u

(3),安装驱动

$sudo service lightdm stop  # 关闭图形界面
$cd /home/xxx/Nvidia                    # 进入下载的.run文件目录中
$sudo chmod a+x NVIDIA-Linux-x86_64-xxx.run        # 修改权限
$sudo ./NVIDIA-Linux-x86_64-xxx.run -no-x-check -no-nouveau-check -no-opengl-files
# 安装驱动

驱动程序安装过程中会有一些选项,可以参考:https://blog.csdn.net/wangsidadehao/article/details/70255754

比如:是否同意使用DKMS自动的build一个新模块,选择否。以及是否加入nvidia 32位编译库,也选择否。

(4),测试是否安装成功

sudo service lightdm start    //启动图形界面

使用nvidia-smi命令查看显卡型号,并查看显存具体使用情况:

过程所学

输出显卡具体型号:cat /proc/driver/nvidia/version。(如上,nvidia-smi同样可以查看显卡型号)

查看显卡是否安装好:lshw -c video看configurure字段有没有driver字样,若有内容,则显卡驱动装好了。

查看cuda版本:cat /usr/local/cuda/version.txt

查看cudnn版本:cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2

可能需要的教程

NVIDIA-Docker安装:https://blog.csdn.net/sinat_26917383/article/details/78728215

#Install nvidia-docker and nvidia-docker-plugin
$ wget -P /tmp https://github.com/NVIDIA/nvidia-docker/releases/download/v1.0.1/nvidia-docker_1.0.1-1_amd64.deb
$ sudo dpkg -i /tmp/nvidia-docker*.deb
$ sudo nvidia-docker run –rm nvidia/cuda nvidia-smi  #Test nvidia-smi

linux安装cuda和cudnn:https://blog.csdn.net/cs24k1993/article/details/78936856

深度学习工作站由于显卡驱动问题导致不能使用GPU相关推荐

  1. Ubuntu深度学习环境部署——显卡驱动、CUDA、cuDNN、pytorch

    第一步:显卡驱动 装最新版驱动 查看显卡信息 nvidia-smi 第二步:CUDA 1.查看CUDA官方文档,安装与显卡驱动版本相符合的CUDA. https://docs.nvidia.com/c ...

  2. 深度学习工作站环境搭建 ubantu16.04 安装显卡驱动 CUDA8.0 cuDNN6 anaconda tensorflow1.4.0 opencv3.4 含泪总结

    深度学习工作站环境搭建 ubantu16.04 安装显卡驱动 CUDA8.0 cuDNN6 anaconda tensorflow opencv 1 安装ubantu16.04 安装时不要在线更新,在 ...

  3. windows上配置本地深度学习工作站

    文章目录 前言 1. 安装Anaconda 2. 创建python环境 3. 安装Jetbrains Toolbox 4. 安装Pycharm Professional/Community 5. 安装 ...

  4. 如何配置一台深度学习工作站?

    这篇文章主要介绍的是家用的深度学习工作站,典型的配置有两种,分别是一个 GPU 的机器和四个 GPU的机器.如果需要更多的 GPU 可以考虑配置两台四个 GPU 的机器. 如果希望一台机器同时具备 6 ...

  5. 【保姆级教程】个人深度学习工作站配置指南

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 作者:稚晖,电子科技大学,编辑:极市平台 来源丨https://zhuanlan.zhihu. ...

  6. 实践操作--云端深度学习工作站配置指南(转)

    转载地址:https://zhuanlan.zhihu.com/p/336429888 https://mp.weixin.qq.com/s?__biz=MzI5MDUyMDIxNA==&mi ...

  7. 【深度学习】如何配置一台深度学习工作站?

    极市导读 本文介绍了家用的深度学习工作站的两种典型配置,以及各类硬件的参数介绍和选择方案,可以作为选购时的参考. 这篇文章主要介绍的是家用的深度学习工作站,典型的配置有两种,分别是一个 GPU 的机器 ...

  8. 收藏 | 个人深度学习工作站配置指南

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:稚晖,电子科技大学,编辑:极市平台 AI博士笔记系列推荐 周志华<机器学习>手推笔记正式开源!可打 ...

  9. 教程:个人深度学习工作站配置指南

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍ 来源丨https: ...

最新文章

  1. 真相!30K拿到互联网大厂offer,网友:我服了!
  2. source insight(SI)C/C++符号标记含义
  3. 在使用线程池时应特别注意对ThreadLocal的使用
  4. 达内php吾爱_2018年达内c++全套视频课程(不加密)
  5. 『ACM-算法-数据结构』信息竞赛进阶指南--树状数组 (模板)
  6. Python自动化--语言基础5--面向对象、迭代器、range和切片的区分
  7. 计算机英语阅读路线,高考英语阅读理解真题解析·计算机运用
  8. 《CCIE路由和交换认证考试指南(第5版) (第1卷)》——1.6节虚拟交换系统
  9. 朋友圈设置成昨天发的_如何让你的朋友圈骚到脱颖而出?
  10. java的一些小知识总结
  11. c语言上机考试设计题及答案,C语言程序设计基础上机考试一题目及参考答案.doc...
  12. 【Vegas原创】SQL Server 2005部署备份任务
  13. NLP学习—13.Seq2eq在机器翻译中的实战(bleu指标的代码实现)
  14. 设置三个按钮等宽分布
  15. navicat8 for mysql注册码
  16. 项目——网络对战五子棋(Web-Gobang)
  17. poi创建数据透视表_从数据透视表创建自定义报告
  18. 清华大学ISATAP访问IPv6设置
  19. android 学习笔记 (for 黎活明讲师)
  20. 老家农村的结婚(二)——故事篇

热门文章

  1. 《蓝桥杯CT107D单片机竞赛板》:蜂鸣器模块
  2. 常用HTTP抓包工具Fiddler使用的12个小技巧,值得收藏!
  3. 【JZOJ】【匈牙利算法】【二分】 导弹
  4. Markdown For Typora
  5. 武汉市洪山区高新技术企业认定奖励标准及申请材料、条件、要求
  6. MUR60120PT-ASEMI大功率高耐压二极管
  7. VS2012中--查找定义后从未被使用的函数
  8. <<人性的弱点>>读后感
  9. 摄影入门-之一-什么是单反
  10. HTML:路径的写法