第三个大坑:在python多进程中使用pytorch加载模型时报错:

THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=50 error=3 : initialization error
Process Process-12:
Traceback (most recent call last):File "/usr/lib/python3.6/multiprocessing/process.py", line 258, in _bootstrapself.run()File "/usr/lib/python3.6/multiprocessing/process.py", line 93, in runself._target(*self._args, **self._kwargs)File "/home/data/user1/intergration_test/recog/recognition.py", line 410, in recog_outputseg_net = infer.load_model(net_arc=args.seg_network, pre_model=args.seg_model)File "/home/data/user1/intergration_test/recog/recognition.py", line 115, in load_modelreturn torch.nn.DataParallel(net, device_ids=range(args.ngpu)).cuda()File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 305, in cudareturn self._apply(lambda t: t.cuda(device))File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 202, in _applymodule._apply(fn)File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 202, in _applymodule._apply(fn)File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 202, in _applymodule._apply(fn)File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 224, in _applyparam_applied = fn(param)File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 305, in <lambda>return self._apply(lambda t: t.cuda(device))File "/home/user1/.local/lib/python3.6/site-packages/torch/cuda/__init__.py", line 193, in _lazy_inittorch._C._cuda_init()
RuntimeError: cuda runtime error (3) : initialization error at /pytorch/aten/src/THC/THCGeneral.cpp:50

或者是下面这个:

THCudaCheck FAIL file=../aten/src/THC/THCGeneral.cpp line=51 error=3 : initialization error
Process Process-4:
Traceback (most recent call last):File "/home/data/conda_envs/thpj/lib/python3.6/multiprocessing/process.py", line 258, in _bootstrapself.run()File "/home/data/conda_envs/thpj/lib/python3.6/multiprocessing/process.py", line 93, in runself._target(*self._args, **self._kwargs)File "/home/pj/frm_v3/frmwork3_all_q/frmwork3_all_q/recog_v3.py", line 445, in recog_outputseg_net = infer.load_model(net_arc=args.seg_network, pre_model=args.seg_model)File "/home/pj/frm_v3/frmwork3_all_q/frmwork3_all_q/recog_v3.py", line 124, in load_modelreturn torch.nn.DataParallel(net, device_ids=range(args.ngpu)).cuda()File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 265, in cudareturn self._apply(lambda t: t.cuda(device))File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 193, in _applymodule._apply(fn)File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 193, in _applymodule._apply(fn)File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 193, in _applymodule._apply(fn)File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 199, in _applyparam.data = fn(param.data)File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 265, in <lambda>return self._apply(lambda t: t.cuda(device))File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/cuda/__init__.py", line 163, in _lazy_inittorch._C._cuda_init()
RuntimeError: cuda runtime error (3) : initialization error at ../aten/src/THC/THCGeneral.cpp:51

原因(个人判断):theano不能和pytorch运行在同一个gpu上。可以让他们分别运行在两个gpu上,或者一个在gpu,另一个在cpu

可能的解决办法:

1,gpu充足的情况下,将theano和pytorch分别运行在不同的GPU上有可能解决这个问题。如果硬件不允许,则将theano运行在cpu, pytorch运行在gpu。

2,在运行过程中,先使用pytorch加载模型,再使用theano加载模型,保证这个先后顺序有可能能解决问题

3,其他可能的解决方法见参考github链接2。

4,这是一个bug。这个问题在pytorch 1.2及之后的版本中修复了?参考github链接1。

参考:

1 https://github.com/pytorch/pytorch/issues/17357

2 https://github.com/pytorch/pytorch/issues/15734

RuntimeError: cuda runtime error (3) : initialization error at /pytorch/aten/src/THC/THCGeneral.cpp:相关推荐

  1. RuntimeError: cuda runtime error (11) : invalid argument at /pytorch/aten/src/THC/THCGeneral.cpp

    RuntimeError: cuda runtime error (11) : invalid argument at /pytorch/aten/src/THC/THCGeneral.cpp cud ...

  2. [debug]THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=405 error=11 : invalid argume

    解决 THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=405 error=11 : invalid argument 完 ...

  3. 解决RuntimeError: cuda runtime error (30) : unknown error at /pytorch/aten/src/THC/THCGeneral.cpp:70N

    解决两个问题: (1)RuntimeError: cuda runtime error (30) : unknown error at /pytorch/aten/src/THC/THCGeneral ...

  4. RuntimeError: cuda runtime error (30) : unknown error at /pytorch/aten/src/THC/THCGeneral.cpp:50

    RuntimeError: cuda runtime error (30) : unknown error at /pytorch/aten/src/THC/THCGeneral.cpp:50 在运行 ...

  5. pytorch在调用GPU的时候出现cuda runtime error (2) : out of memory at ..\aten\src\THC\THCGeneral.cpp:50

    这是因为GPU中的显存占满了,在任务管理器中关闭程序即可 @[TOC](pytorch在调用GPU的时候出现cuda runtime error (2) : out of memory at -\at ...

  6. python出现THCudaCheck FAIL file=/pytorch/aten/src/THC/ThCGeneral.cpp line=405 error=11 : 情况

    python出现THCudaCheck FAIL file=/pytorch/aten/src/THC/ThCGeneral.cpp line=405 error=11 : invalid argum ...

  7. pytorch 报错“THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=663 error=11“解决方案

    今天使用pysot测试数据,pytorch出现下面报错: THCudaCheck FAIL file=/opt/conda/conda-bld/pytorch_1535493744281/work/a ...

  8. file=/pytorch/aten/src/THC/THCGeneral.cpp line=383 error=8 : invalid device

    这个错误通常出现在使用CUDA加速的PyTorch代码中.这个错误表示在GPU设备上执行的某个函数不是一个有效的设备函数.其中的错误代码"error=8"是CUDA runtime ...

  9. PyTorch报错:RuntimeError: CUDA error: device-side assert triggered at /pytorch/aten/src/THC/generic

    训练模型报错 RuntimeError: cuda runtime error (710) : device-side assert triggered at /pytorch/aten/src/TH ...

最新文章

  1. 【数据结构与算法】之深入解析“戳气球”的求解思路与算法示例
  2. sql倒序排列取第一条_从零学会SQL·三——汇总分析
  3. mysql 5.7 mts_mysql5.7 中启用MTS后error log中大量Note日志分析
  4. 恒大汽车向技术人员等授出3.24亿股购股权:占公司股本的3.31%
  5. 在Power BI Desktop中实施星型架构
  6. 学习Lambda 表达式
  7. NOIP2017提高组初赛选择题解析
  8. AMD Ryzen Threadripper PRO 5000 series now available for the DIY market, 64 Zen3 cores for $6500
  9. 十个 Python 自动化常用操作
  10. ISCC2021-部分题目再现
  11. 用了TCP协议,就一定不会丢包吗?
  12. Go实战--Gorilla web toolkit使用之gorilla/sessions(iris+sessions)
  13. 栈和队列的定义、特点和用途
  14. CGB2104-Day20
  15. 滴答清单支持订阅哪些日历?
  16. html用frontpage编写,在FrontPage2000用HTML
  17. html如何设置填充,CSS填充距离怎么设置?
  18. oracle数据库12c安装教程,Oracle12c安装教程|Oracle Database 12C安装及配置教程
  19. CAD软件中如何自定义CAD快捷键?
  20. PCA,AE,VAE,RPCA,概率PCA之间的联系与区别

热门文章

  1. 转载:微信的智能心跳方案
  2. PCA主成分分析(PCA降维)
  3. discuz发帖机-免费discuz发帖机
  4. 下班后,有哪些副业可以做?
  5. 推荐14款强大的Mac修图利器,简约创意,让你随心所欲的创作
  6. 面向初学者的 MQL4 语言系列之2——MQL4语言入门深入
  7. 关于模拟文本域iview textarea文本域:autosize=quot;{minRows: 3,maxRows: 7}quot;这个属性的好处
  8. Andorid SELinux策略、te语法、avc权限总结
  9. 《Real Time Rendering》第四章 图形变换
  10. 春季在农村,有哪些赚钱的途径,能每月收入七八千的?