问题背景:

用paddle做ocr识别训练,每隔一段时间后的训练,会自动评估(eval)一次,之前都好好的,训练一整晚都不会报错。
结果打美赛打了5天之后再弄,就出现了一些奇奇怪怪的错误。

问题重述:


问题简洁明了,发生在评估之后,直接告诉你0号显卡进程终止。没有任何错误提示。就连log里面也没写什么有用的东西。

模型建立:

解决之路:

最开始怀疑是用了LMDB数据集的问题,重新用回了简单数据集,还是报错。

怀疑是数据集出bug了,换了个少一点的测试集,问题没能解决。

美赛期间安装了很多python库,怀疑是版本不兼容。重装了numpy、opencv等,没有解决问题。然后我重装了paddle,也没能解决问题。

----------------------------------------------情绪失控分割线-------------------------------------------------------

找了很多别的办法,都没能解决问题。这个时候偶然发现,我的C盘满了。
我:?
本来还有18多个G,怎么突然满了。我运行了系统盘自动清理程序,腾出来2个G,还有16个G不知道被谁吃了。
找了好久,罪魁祸首终于被我揪出来了:

是python的错误报告文件,一个就1.6个G,好家伙这个文件夹里有10个。

一看时间,就是我刚刚我调试产生的。我好奇的打开它看了一下。(恰巧我电脑有Visual Studio)
然后找到了问题原因。

大概意思是,线程访问了一个地址,而这个地址不让它访问,于是线程就崩溃了。
然后我用管理员权限打开cmd运行eval,还是没能解决问题。

----------------------------------------------绝望分割线-------------------------------------------------------

吃了个午饭回来接着debug。一个1.6G的错误报告不应该只有这些信息。观察了一下VS,发现了这个按钮:

启动后,系统加载了发生错误时的模块,直到出现了一个异常:

未经处理的异常发生在动态链接库msvcp110.dll中,就是它:

注意文件大小604KB
由于我用的Utools的everything搜索,同时还能看到好多其他msvcp110.dll文件

他们的大小居然不一样?
我找了一个大一点的(也许是功能全的新版本),复制进system32文件夹内当做新的msvcp110.dll(注意源文件备份)

然后进行了eval,
问题解决了。

PaddlePaddle eval后报错terminate all the procs的解决方法相关推荐

  1. 【笔记】虚拟机用Xshell登陆报错“ssh服务器拒绝了密码”解决方法

    [笔记]虚拟机用Xshell登陆报错"ssh服务器拒绝了密码"解决方法 参考文章: (1)[笔记]虚拟机用Xshell登陆报错"ssh服务器拒绝了密码"解决方法 ...

  2. eclipse中同步代码PULL报错checkout conflict with files的解决方法

    eclipse中同步代码PULL报错checkout conflict with files的解决方法 参考文章: (1)eclipse中同步代码PULL报错checkout conflict wit ...

  3. js中报错“Maximum call stack size exceeded“解决方法

    js中报错"Maximum call stack size exceeded"解决方法 参考文章: (1)js中报错"Maximum call stack size ex ...

  4. ajax上传文件 获取失败,Ajax上传文件/照片时报错TypeError :Illegal invocation的解决方法...

    本篇文章给大家带来的内容是关于Ajax上传文件/照片时报错TypeError :Illegal invocation的解决方法,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 问题 A ...

  5. 手机系统安装打印机服务器错误代码,OKI打印机报错?各型号代码故障解决方法...

    原标题:OKI打印机报错?各型号代码故障解决方法 这一期干货贴邀请大家一起看看OKI打印机常见报错代码↓↓↓ 1.报错代码 610/611/612/613 黄色/品红色/青色/黑色碳粉盒未安装 产生原 ...

  6. DeepFaceLab报错,CUDA driver is insufficient 解决方法!

    DeepFaceLab报错,CUDA driver is insufficient 解决方法! 参考文章: (1)DeepFaceLab报错,CUDA driver is insufficient 解 ...

  7. python3中input()方法报错traceback变量未定义的解决方法

    python3中input()方法报错traceback变量未定义的解决方法 参考文章: (1)python3中input()方法报错traceback变量未定义的解决方法 (2)https://ww ...

  8. phpredis 报错 “Function Redis::setTimeout() is deprecated” 解决方法

    phpredis 报错 "Function Redis::setTimeout() is deprecated" 解决方法 参考文章: (1)phpredis 报错 "F ...

  9. Maven 手动安装JAR包到本地maven仓库后,但在项目中依旧报错找不到JAR包解决方法

    Maven 手动安装JAR包到本地maven仓库后,但在项目中依旧报错找不到JAR包解决方法 参考文章: (1)Maven 手动安装JAR包到本地maven仓库后,但在项目中依旧报错找不到JAR包解决 ...

最新文章

  1. CentOS 7.0,启用iptables防火墙
  2. Nature综述:真菌的多样性:真菌的高通量测序及鉴定
  3. c++连接oracle数据库程序,无法从c++程序连接到我的oracle数据库
  4. Python学习---Django路由系统【all】
  5. python代码覆盖率怎么统计的_Python代码覆盖率统计工具coverage.py用法详解
  6. 方程组的直接解法和迭代法 python_数据与算法总结——基本数值算法2(线性方程组)...
  7. Flutter 之 StatefulWidget和StatelessWidget
  8. LG新能源新设首席数字官 首任是英伟达前数据科学家
  9. 【Flink】Flink时间是如何设计的
  10. 风控做得好,离不开这一项核心能力
  11. CSS3属性calc函数(CSS3)
  12. 肝毒净-道格拉斯实验室
  13. OCR测试——字体和背景颜色
  14. PS教程 | 美女面部剥落碎片效果
  15. 基于新浪云服务器的微信公众号
  16. Python使用在线接口SDK模块(baidu-aip)实现人脸识别
  17. Python自动化小米手环运动数据导出
  18. Linux(CentOS 7)、Windows双系统安装图文教程(超详细)适合初学者
  19. 安卓嵌入式开发教程!Android开发热门前沿知识,2年以上经验必看
  20. 汽车标准:全球EMC试验标准汇总。

热门文章

  1. 【蜕变之路】第31天 Spring Tool Suite和IntelliJ (2019年3月21日)
  2. zabbix   数据采集方法
  3. [原]C++头文件的包含顺序研究
  4. windows 2003 远程桌面记录登陆IP的方法
  5. [转]BT种子文件格式
  6. 不能不说的C#特性-迭代器(下),yield以及流的延迟计算
  7. 关于SharePoint V3网站老弹出“此网站需要运行以下载项:'Microsoft Corporation'中的'name.dll'......”的3种解决办法...
  8. 02205微型计算机原理与接口技术自考,2012年微型计算机原理与接口技术自考题模拟(2)...
  9. 我对象说陪我过七夕,象说没时间,我一怒给女神做了一个某音上很火的3D旋转相册
  10. electron 改变窗体 大小_「Science子刊」约翰·霍普金斯大学创造灰尘大小设备,可协助药物在胃肠道停留24小时之久...