RuntimeError: cuda runtime error (3) : initialization error at /pytorch/aten/src/THC/THCGeneral.cpp:
第三个大坑:在python多进程中使用pytorch加载模型时报错:
THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=50 error=3 : initialization error
Process Process-12:
Traceback (most recent call last):File "/usr/lib/python3.6/multiprocessing/process.py", line 258, in _bootstrapself.run()File "/usr/lib/python3.6/multiprocessing/process.py", line 93, in runself._target(*self._args, **self._kwargs)File "/home/data/user1/intergration_test/recog/recognition.py", line 410, in recog_outputseg_net = infer.load_model(net_arc=args.seg_network, pre_model=args.seg_model)File "/home/data/user1/intergration_test/recog/recognition.py", line 115, in load_modelreturn torch.nn.DataParallel(net, device_ids=range(args.ngpu)).cuda()File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 305, in cudareturn self._apply(lambda t: t.cuda(device))File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 202, in _applymodule._apply(fn)File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 202, in _applymodule._apply(fn)File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 202, in _applymodule._apply(fn)File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 224, in _applyparam_applied = fn(param)File "/home/user1/.local/lib/python3.6/site-packages/torch/nn/modules/module.py", line 305, in <lambda>return self._apply(lambda t: t.cuda(device))File "/home/user1/.local/lib/python3.6/site-packages/torch/cuda/__init__.py", line 193, in _lazy_inittorch._C._cuda_init()
RuntimeError: cuda runtime error (3) : initialization error at /pytorch/aten/src/THC/THCGeneral.cpp:50
或者是下面这个:
THCudaCheck FAIL file=../aten/src/THC/THCGeneral.cpp line=51 error=3 : initialization error
Process Process-4:
Traceback (most recent call last):File "/home/data/conda_envs/thpj/lib/python3.6/multiprocessing/process.py", line 258, in _bootstrapself.run()File "/home/data/conda_envs/thpj/lib/python3.6/multiprocessing/process.py", line 93, in runself._target(*self._args, **self._kwargs)File "/home/pj/frm_v3/frmwork3_all_q/frmwork3_all_q/recog_v3.py", line 445, in recog_outputseg_net = infer.load_model(net_arc=args.seg_network, pre_model=args.seg_model)File "/home/pj/frm_v3/frmwork3_all_q/frmwork3_all_q/recog_v3.py", line 124, in load_modelreturn torch.nn.DataParallel(net, device_ids=range(args.ngpu)).cuda()File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 265, in cudareturn self._apply(lambda t: t.cuda(device))File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 193, in _applymodule._apply(fn)File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 193, in _applymodule._apply(fn)File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 193, in _applymodule._apply(fn)File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 199, in _applyparam.data = fn(param.data)File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/nn/modules/module.py", line 265, in <lambda>return self._apply(lambda t: t.cuda(device))File "/home/data/conda_envs/thpj/lib/python3.6/site-packages/torch/cuda/__init__.py", line 163, in _lazy_inittorch._C._cuda_init()
RuntimeError: cuda runtime error (3) : initialization error at ../aten/src/THC/THCGeneral.cpp:51
原因(个人判断):theano不能和pytorch运行在同一个gpu上。可以让他们分别运行在两个gpu上,或者一个在gpu,另一个在cpu
可能的解决办法:
1,gpu充足的情况下,将theano和pytorch分别运行在不同的GPU上有可能解决这个问题。如果硬件不允许,则将theano运行在cpu, pytorch运行在gpu。
2,在运行过程中,先使用pytorch加载模型,再使用theano加载模型,保证这个先后顺序有可能能解决问题
3,其他可能的解决方法见参考github链接2。
4,这是一个bug。这个问题在pytorch 1.2及之后的版本中修复了?参考github链接1。
参考:
1 https://github.com/pytorch/pytorch/issues/17357
2 https://github.com/pytorch/pytorch/issues/15734
RuntimeError: cuda runtime error (3) : initialization error at /pytorch/aten/src/THC/THCGeneral.cpp:相关推荐
- RuntimeError: cuda runtime error (11) : invalid argument at /pytorch/aten/src/THC/THCGeneral.cpp
RuntimeError: cuda runtime error (11) : invalid argument at /pytorch/aten/src/THC/THCGeneral.cpp cud ...
- [debug]THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=405 error=11 : invalid argume
解决 THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=405 error=11 : invalid argument 完 ...
- 解决RuntimeError: cuda runtime error (30) : unknown error at /pytorch/aten/src/THC/THCGeneral.cpp:70N
解决两个问题: (1)RuntimeError: cuda runtime error (30) : unknown error at /pytorch/aten/src/THC/THCGeneral ...
- RuntimeError: cuda runtime error (30) : unknown error at /pytorch/aten/src/THC/THCGeneral.cpp:50
RuntimeError: cuda runtime error (30) : unknown error at /pytorch/aten/src/THC/THCGeneral.cpp:50 在运行 ...
- pytorch在调用GPU的时候出现cuda runtime error (2) : out of memory at ..\aten\src\THC\THCGeneral.cpp:50
这是因为GPU中的显存占满了,在任务管理器中关闭程序即可 @[TOC](pytorch在调用GPU的时候出现cuda runtime error (2) : out of memory at -\at ...
- python出现THCudaCheck FAIL file=/pytorch/aten/src/THC/ThCGeneral.cpp line=405 error=11 : 情况
python出现THCudaCheck FAIL file=/pytorch/aten/src/THC/ThCGeneral.cpp line=405 error=11 : invalid argum ...
- pytorch 报错“THCudaCheck FAIL file=/pytorch/aten/src/THC/THCGeneral.cpp line=663 error=11“解决方案
今天使用pysot测试数据,pytorch出现下面报错: THCudaCheck FAIL file=/opt/conda/conda-bld/pytorch_1535493744281/work/a ...
- file=/pytorch/aten/src/THC/THCGeneral.cpp line=383 error=8 : invalid device
这个错误通常出现在使用CUDA加速的PyTorch代码中.这个错误表示在GPU设备上执行的某个函数不是一个有效的设备函数.其中的错误代码"error=8"是CUDA runtime ...
- PyTorch报错:RuntimeError: CUDA error: device-side assert triggered at /pytorch/aten/src/THC/generic
训练模型报错 RuntimeError: cuda runtime error (710) : device-side assert triggered at /pytorch/aten/src/TH ...
最新文章
- 【数据结构与算法】之深入解析“戳气球”的求解思路与算法示例
- sql倒序排列取第一条_从零学会SQL·三——汇总分析
- mysql 5.7 mts_mysql5.7 中启用MTS后error log中大量Note日志分析
- 恒大汽车向技术人员等授出3.24亿股购股权:占公司股本的3.31%
- 在Power BI Desktop中实施星型架构
- 学习Lambda 表达式
- NOIP2017提高组初赛选择题解析
- AMD Ryzen Threadripper PRO 5000 series now available for the DIY market, 64 Zen3 cores for $6500
- 十个 Python 自动化常用操作
- ISCC2021-部分题目再现
- 用了TCP协议,就一定不会丢包吗?
- Go实战--Gorilla web toolkit使用之gorilla/sessions(iris+sessions)
- 栈和队列的定义、特点和用途
- CGB2104-Day20
- 滴答清单支持订阅哪些日历?
- html用frontpage编写,在FrontPage2000用HTML
- html如何设置填充,CSS填充距离怎么设置?
- oracle数据库12c安装教程,Oracle12c安装教程|Oracle Database 12C安装及配置教程
- CAD软件中如何自定义CAD快捷键?
- PCA,AE,VAE,RPCA,概率PCA之间的联系与区别
热门文章
- 转载:微信的智能心跳方案
- PCA主成分分析(PCA降维)
- discuz发帖机-免费discuz发帖机
- 下班后,有哪些副业可以做?
- 推荐14款强大的Mac修图利器,简约创意,让你随心所欲的创作
- 面向初学者的 MQL4 语言系列之2——MQL4语言入门深入
- 关于模拟文本域iview textarea文本域:autosize=quot;{minRows: 3,maxRows: 7}quot;这个属性的好处
- Andorid SELinux策略、te语法、avc权限总结
- 《Real Time Rendering》第四章 图形变换
- 春季在农村,有哪些赚钱的途径,能每月收入七八千的?