Linux下显卡掉卡,报错提示: rm_init_adapter failed, device minor number 7 Failed to copy vbios to system memory
环境说明:
Centos7 +Nvidia T4显卡
问题现象:
运行一段时间后,显卡掉卡,需要重新安装驱动解决。并且日志中报错:
Apr 9 12:03:32 kernel: NVRM: GPU 0000:b2:00.0: rm_init_adapter failed,
device minor number 7
Apr 9 12:03:48 kernel: NVRM: GPU 0000:14:00.0: Failed to copy vbios to
system memory.
Apr 9 12:03:48 kernel: NVRM: GPU 0000:14:00.0: RmInitAdapter failed!
(0x30:0xffff:755)
Apr 9 12:03:48 kernel: NVRM: GPU 0000:14:00.0: rm_init_adapter failed,
device minor number 0
Apr 9 12:03:48 kernel: NVRM: GPU 0000:15:00.0: Failed to copy vbios to
system memory.
Apr 9 12:03:48 kernel: NVRM: GPU 0000:15:00.0: RmInitAdapter failed!
(0x30:0xffff:755)
Apr 9 12:03:48 kernel: NVRM: GPU 0000:15:00.0: rm_init_adapter failed,
device minor number 1
问题解决:
显卡使用时会加载驱动,未使用时会卸载显卡驱动,驱动循环加载导致系统bug,出现掉卡,宕机等情况。所以需要把显卡驱动持久化,保持加载状态。
显卡持久化介绍:
启用持久性模式后,即使没有活动的客户端 (such as X11 or nvidia-smi),NVIDIA 驱动程序也会保持加载状态。这样可以最大程度地减少与运行依赖的应用程序 (例如 CUDA 程序) 相关的驱动程序加载延迟。适用于所有支持 CUDA 的产品。仅 Linux。
Persistence-M (Persistence Mode)
persistence mode 持续模式默认关闭。persistence mode 能够让 GPU 更快响应任务,待机功耗增加。关闭 persistence mode 同样能够启动任务。
启动命令:
nvidia-smi -pm 1
启动之前:
启动之后:
参考链接:
https://www.freesion.com/article/4201198085/
Linux下显卡掉卡,报错提示: rm_init_adapter failed, device minor number 7 Failed to copy vbios to system memory相关推荐
- linux下编译make文件报错“/bin/bash^M: 坏的解释器,使用grep快速定位代码位置
一.linux下编译make文件报错"/bin/bash^M: 坏的解释器 参考文章:http://blog.csdn.net/liuqiyao_01/article/details/415 ...
- Linux下MySql插入汉字报错解决(/etc/my.cnf不存在)
2019独角兽企业重金招聘Python工程师标准>>> Linux下MySql插入汉字报错解决(/etc/my.cnf不存在) 看了很多帖子,大多数是说修改my.cnf,如 http ...
- Linux下安装Docker,报错docker: unrecognized service的两种解决方案
Linux下安装Docker,报错docker: unrecognized service的两种解决方案 参考文章: (1)Linux下安装Docker,报错docker: unrecognized ...
- Linux下Tomcat项目启动报错
Linux下Tomcat项目启动报错 org.springframework.beans.factory.CannotLoadBeanClassException: Error loading cla ...
- linux下unzip解压报错“symlink error: File name too long”怎么办?提供解决方案。
点击上方↑↑↑蓝字[协议分析与还原]关注我们 " 分享unzip工具的一个bug." 最近在研究菠菜站,中间用到了Spidermonkey,碰到一些小波折,在这里分享出来,以便大家 ...
- Linux下安装Tomcat启动报错
一.报以下错误: Using CATALINA_BASE: /home/apache-tomcat-7.0.72 Using CATALINA_HOME: /home/apache-tomca ...
- linux下启动 Tomcat的报错cannot touch '/usr/local/tomcat.../logs/catalina.out' Permission denied.
在完成Tomcat的安装后,启动tomcat时出现了日志文件无法修改的报错.cannot touch '/usr/local/tomcat.../logs/catalina.out' Permiss ...
- mmcv包在linux下无法使用inshow展示报错:qt.qpa.xcb: could not connect to display
错误 qt.qpa.xcb: could not connect to display qt.qpa.plugin: Could not load the Qt platform plugin &qu ...
- Linux下MySQL登录报错1045,linux下 root 登录 MySQL 报错的问题
最近在centos 7上,通过yum安装了mysql,安装成功后,使用root登录,出现了如下报错: error 1045 (28000): access denied for user 'root' ...
最新文章
- python nameerror import_Python-ImportError:无法导入名称X
- hdu 1511(dp)
- percona-xtrabackup-8.0.7简单快捷使用
- factorybean 声明_阿里面试题:BeanFactory与FactoryBean的区别
- Wondows环境下配置Tomat
- 如何从零开始开发一个实时联机游戏?
- Spring Boot Admin的使用
- Filter过滤器~~~编码过滤和登陆验证
- Oracle date日期类型使用
- override和new的区别
- 2018-11-08
- 实验5 数独游戏界面设计
- jmeter压力测试的辅助插件和实操技巧
- 计算机教室维护内容,高校多媒体教室计算机维护措施
- 猿创征文|弃文从工,从小白到蚂蚁工程师,我的 Java 成长之路
- 用计算机研究唐诗,妙哉!用文言文编程 竟从 28 万行唐诗中找出了对称矩阵
- 脱壳之aspack压缩壳
- 苹果服务器维护2017.12,2017年12月28日维护公告
- pytorch学习笔记——2.4torch.nn模块简介
- 移动电子商务:五个技术标准与Trustonic TEE解决方案【转】
热门文章
- 川大c程序设计语言1在线作业,川大《C语言程序设计0008》19春在线作业1
- 计算机语言中的计数器是什么,如何使用PLC计数器(CNT)指令
- 阿里巴巴python教程_阿里云免费推出Python零基础入门在线教程视频
- 2021数据通信技术-初级工程师-认证题库
- 仿苹果手机通讯录按字母定位
- spring boot在vscode运行弹出“no such file or directory”
- 现在培训IT技术出来还能就业吗?
- windows自带硬盘测速以及移动硬盘格式选择
- 关于elementUI,dialog中使用无限滚动失效的原因
- Rstudio的拓展包下载问题