错误:OOM ResourceExhaustedError

本文记录ResourceExhaustedError出错过程,提出解决方案。

1.问题描述
在学习keras时,运行从GitHub上down下来的官方自带的demo,结果出现OOM ResourceExhaustedError错误。
2.尝试解决
(1)在终端命令行用“nvidia-smi”查看GPU使用情况,如下图:

(2)用“fuser -v /dev/nvidia*” 查找占用GPU 资源的PID,如下图:

(3)分析:GPU Memory-Usage几乎被用完了,想kill掉某个进程,但苦于不太清楚进程,没敢kill。
(4)查资料分析:
A.整个显卡是不是有别的模型在跑?
B.模型逻辑出错?(没错可能也会gg)
C.对于TensorFlow,可以设置CUDA_VISIBLE_DEVICES=1(, 2 …),数字代表显卡序号。如若感觉显卡不够或者希望程序跑快一点,可以多设置几块显卡。CUDA_VISIBLE_DEVICES该命令是用来确定CUDA允许TensorFlow发现的显卡。若不设置,TensorFlow默认利用所有可以利用的资源。
3.结论
运行demo之前有个模型在跑着,那根据资料来看,应该错在此。本来想着可以搞快点,结果gg,不过也算学习了。
4.参考文献
(1)ResourceExhaustedError解决方法
https://blog.csdn.net/lics999/article/details/78517638
(2)关于错误:OOM ResourceExhaustedError 的完美解决方法
https://blog.csdn.net/skj1995/article/details/82828753
(3)ResourceExhaustedError :OOM when allocating tensor with shape
https://www.jianshu.com/p/c0e42d863fc9

OOM ResourceExhaustedError相关推荐

  1. 关于错误:OOM ResourceExhaustedError 的完美解决方法

    遇到的问题: 我使用MobileNet训练图片分类器,参数大概有几百万个并不是很多,然而报错OOM ResourceExhaustedError 分析: 这样的话可能有两个原因: (1)batchsi ...

  2. 人工智能ai内容阅读_用人工智能打击非法内容

    人工智能ai内容阅读 "As the amount of user-generated content that platform users upload, continues to ac ...

  3. 报错解决:ResourceExhaustedError: OOM when allocating tensor with shape

    报错解决:ResourceExhaustedError: OOM when allocating tensor with shape 早上在使用tensorflow时遇到如下报错: Traceback ...

  4. FakeAPP训练时错误【ResourceExhaustedError: OOM】解决方法

    背景 在使用FakeApp训练的时候出错,表现为点击"train"按钮后一段时间就报错,且没有训练预览窗口弹出. log文件里显示 undefinedUsing GPU0 for ...

  5. 报错:ResourceExhaustedError OOM when allocating

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) 报错:ResourceExhaustedError OOM w ...

  6. linux内核oom,linux OOM killer分析

    基本概念 Linux 内核有个机制叫OOM killer(Out-Of-Memory killer),该机制会监控那些占用内存过大,尤其是瞬间很快消耗大量内存的进程,为了防止内存耗尽而内核会把该进程杀 ...

  7. java并发读取相同的文件_高效读取大文件,再也不用担心 OOM 了!

    最近阿粉接到一个需求,需要从文件读取数据,然后经过业务处理之后存储到数据库中.这个需求,说实话不是很难,阿粉很快完成了第一个版本. 内存读取 第一个版本,阿粉采用内存读取的方式,所有的数据首先读读取到 ...

  8. java程序员遇到的问题_Java 程序员平时最常遇到的故障:系统OOM (一)

    作为 Java 程序员而言,先不考虑自己系统外部依赖的缓存.消息队列.数据库等等东西挂掉,就我们自己系统本身而言,最常见的挂掉的原因是什么? 其实就是系统OOM,也就是所谓的内存溢出! 什么是内存溢出 ...

  9. MyBatis中使用流式查询避免数据量过大导致OOM

    欢迎关注方志朋的博客,回复"666"获面试宝典 今天mybatis查询数据库中大量的数据,程序抛出: java.lang.OutOfMemoryError: Java heap s ...

最新文章

  1. 使用硬盘,安装双系统,Win7+CentOS
  2. 重磅:Python/Java/C 2020年之争!谁是你心中的NO.1?
  3. python大众点评网应该涉及哪些参考文献及其出版社_python小练习(052):爬取大众点评网美食版块+数据库储存+大数据分析(二)...
  4. 单例模式双重校验锁_被面试官虐过之后,他轻蔑的问我:你还说你了解单例模式吗?...
  5. WebTrends Log Analyzer
  6. php图片上传方案,php图片上传
  7. C# 虚方法与抽象方法区别
  8. codeforces 734A-C语言解题报告
  9. 让计划任务生成的文件中包含当前日期
  10. Android9编程一:安装开发环境
  11. 关联分析(二)--FP-Growth算法
  12. LoadRunner 11安装Micosoft Visual C++ 2005 SP1时提示命令行选项语法错误
  13. xmind8完整版下载(超详解 图文预警)
  14. 计算机大作业论文意义,重庆大学数理统计大作业——论文
  15. web前端开发面试题(七)
  16. LeetCode1619删除某些元素后的数组均值(java)
  17. python的单行注释以什么开头_python中单行注释以什么开头,
  18. 关于HMM(隐马尔可夫模型)
  19. 学生表、班级表、成绩表
  20. Vue(Vue脚手架)

热门文章

  1. 身份证号码的严格校验(非正则)
  2. 中国生物降解塑料行业市场运营态势及发展趋势研究报告2022~2028年
  3. Notepad++的第三方插件介绍中文翻译
  4. win10 损坏的映像 0xc000012f
  5. 当 Spring Cloud 遇上 SOFAStack | Meetup#2 回顾
  6. 熊猫人表情包python 代码,Python熊猫替换特殊字符
  7. 阿里云大数据——搭建企业级数据分析平台
  8. 最近整理的一些常见的面试题,面试大全,黑马程序员面试宝典题库---框架--篇
  9. 插上u盘显示格式化怎么办?
  10. dnf台服空白mysql文件夹_关于雨泪大神的架设教程遇到的各种问题的解决办法