环境说明:
Centos7 +Nvidia T4显卡
问题现象:
运行一段时间后,显卡掉卡,需要重新安装驱动解决。并且日志中报错:

Apr 9 12:03:32  kernel: NVRM: GPU 0000:b2:00.0: rm_init_adapter failed,
device minor number 7
Apr 9 12:03:48  kernel: NVRM: GPU 0000:14:00.0: Failed to copy vbios to
system memory.
Apr 9 12:03:48  kernel: NVRM: GPU 0000:14:00.0: RmInitAdapter failed!
(0x30:0xffff:755)
Apr 9 12:03:48  kernel: NVRM: GPU 0000:14:00.0: rm_init_adapter failed,
device minor number 0
Apr 9 12:03:48  kernel: NVRM: GPU 0000:15:00.0: Failed to copy vbios to
system memory.
Apr 9 12:03:48  kernel: NVRM: GPU 0000:15:00.0: RmInitAdapter failed!
(0x30:0xffff:755)
Apr 9 12:03:48  kernel: NVRM: GPU 0000:15:00.0: rm_init_adapter failed,
device minor number 1

问题解决:
显卡使用时会加载驱动,未使用时会卸载显卡驱动,驱动循环加载导致系统bug,出现掉卡,宕机等情况。所以需要把显卡驱动持久化,保持加载状态。

显卡持久化介绍:
启用持久性模式后,即使没有活动的客户端 (such as X11 or nvidia-smi),NVIDIA 驱动程序也会保持加载状态。这样可以最大程度地减少与运行依赖的应用程序 (例如 CUDA 程序) 相关的驱动程序加载延迟。适用于所有支持 CUDA 的产品。仅 Linux。

Persistence-M (Persistence Mode)
persistence mode 持续模式默认关闭。persistence mode 能够让 GPU 更快响应任务,待机功耗增加。关闭 persistence mode 同样能够启动任务。

启动命令:

nvidia-smi -pm 1

启动之前:

启动之后:

参考链接:
https://www.freesion.com/article/4201198085/

Linux下显卡掉卡,报错提示: rm_init_adapter failed, device minor number 7 Failed to copy vbios to system memory相关推荐

  1. linux下编译make文件报错“/bin/bash^M: 坏的解释器,使用grep快速定位代码位置

    一.linux下编译make文件报错"/bin/bash^M: 坏的解释器 参考文章:http://blog.csdn.net/liuqiyao_01/article/details/415 ...

  2. Linux下MySql插入汉字报错解决(/etc/my.cnf不存在)

    2019独角兽企业重金招聘Python工程师标准>>> Linux下MySql插入汉字报错解决(/etc/my.cnf不存在) 看了很多帖子,大多数是说修改my.cnf,如 http ...

  3. Linux下安装Docker,报错docker: unrecognized service的两种解决方案

    Linux下安装Docker,报错docker: unrecognized service的两种解决方案 参考文章: (1)Linux下安装Docker,报错docker: unrecognized ...

  4. Linux下Tomcat项目启动报错

    Linux下Tomcat项目启动报错 org.springframework.beans.factory.CannotLoadBeanClassException: Error loading cla ...

  5. linux下unzip解压报错“symlink error: File name too long”怎么办?提供解决方案。

    点击上方↑↑↑蓝字[协议分析与还原]关注我们 " 分享unzip工具的一个bug." 最近在研究菠菜站,中间用到了Spidermonkey,碰到一些小波折,在这里分享出来,以便大家 ...

  6. Linux下安装Tomcat启动报错

    一.报以下错误: Using CATALINA_BASE:   /home/apache-tomcat-7.0.72 Using CATALINA_HOME:   /home/apache-tomca ...

  7. linux下启动 Tomcat的报错cannot touch '/usr/local/tomcat.../logs/catalina.out' Permission denied.

    在完成Tomcat的安装后,启动tomcat时出现了日志文件无法修改的报错.cannot touch '/usr/local/tomcat.../logs/catalina.out'  Permiss ...

  8. mmcv包在linux下无法使用inshow展示报错:qt.qpa.xcb: could not connect to display

    错误 qt.qpa.xcb: could not connect to display qt.qpa.plugin: Could not load the Qt platform plugin &qu ...

  9. Linux下MySQL登录报错1045,linux下 root 登录 MySQL 报错的问题

    最近在centos 7上,通过yum安装了mysql,安装成功后,使用root登录,出现了如下报错: error 1045 (28000): access denied for user 'root' ...

最新文章

  1. python nameerror import_Python-ImportError:无法导入名称X
  2. hdu 1511(dp)
  3. percona-xtrabackup-8.0.7简单快捷使用
  4. factorybean 声明_阿里面试题:BeanFactory与FactoryBean的区别
  5. Wondows环境下配置Tomat
  6. 如何从零开始开发一个实时联机游戏?
  7. Spring Boot Admin的使用
  8. Filter过滤器~~~编码过滤和登陆验证
  9. Oracle date日期类型使用
  10. override和new的区别
  11. 2018-11-08
  12. 实验5 数独游戏界面设计
  13. jmeter压力测试的辅助插件和实操技巧
  14. 计算机教室维护内容,高校多媒体教室计算机维护措施
  15. 猿创征文|弃文从工,从小白到蚂蚁工程师,我的 Java 成长之路
  16. 用计算机研究唐诗,妙哉!用文言文编程 竟从 28 万行唐诗中找出了对称矩阵
  17. 脱壳之aspack压缩壳
  18. 苹果服务器维护2017.12,2017年12月28日维护公告
  19. pytorch学习笔记——2.4torch.nn模块简介
  20. 移动电子商务:五个技术标准与Trustonic TEE解决方案【转】

热门文章

  1. 川大c程序设计语言1在线作业,川大《C语言程序设计0008》19春在线作业1
  2. 计算机语言中的计数器是什么,如何使用PLC计数器(CNT)指令
  3. 阿里巴巴python教程_阿里云免费推出Python零基础入门在线教程视频
  4. 2021数据通信技术-初级工程师-认证题库
  5. 仿苹果手机通讯录按字母定位
  6. spring boot在vscode运行弹出“no such file or directory”
  7. 现在培训IT技术出来还能就业吗?
  8. windows自带硬盘测速以及移动硬盘格式选择
  9. 关于elementUI,dialog中使用无限滚动失效的原因
  10. Rstudio的拓展包下载问题