AssertionError: Invalid device id 和RuntimeError: CUDA error: invalid device ordinal
我在使用torch多卡并行时出现了这个两个问题。
##问题一:AssertionError: Invalid device id,即无效的设备id
出现的原因:结合代码解释:
import ...os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"model = model(...)torch.cuda.set_device(2)
model = torch.nn.DataParrel(model, device_ids=[2,3])
错误原因:os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"这个语句将原本的divice:2和device:3的编号映射为device:0和device:1,因此在set_device时汇报错,无效的设备id
解决办法:方法一:将os.environ删除。若是某些卡被占用不得不使用os.environ来设置可用设备,则使用方法二:按照重新映射的编号进行操作,例set_device(0)
##问题二:RuntimeError: CUDA error: invalid device ordinal
出现的原因:结合代码
import ...os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"model = model(...)model = torch.nn.DataParrel(model, device_ids=[2,3])
错误原因:与上文一致,os.environ["CUDA_VISIBLE_DEVICES"] = "2,3"这个语句将原本的divice:2和device:3的编号映射为device:0和device:1,因此在执行torch.nn.DataParrel时会报错
解决办法:方法一:将os.environ删除。若是某些卡被占用不得不使用os.environ来设置可用设备,则使用方法二:按照重新映射的编号进行操作,例:
model = torch.nn.DataParrel(model, device_ids=[0,1])
推荐一篇文章,简单实现多卡并行:
https://muzhan.blog.csdn.net/article/details/109318226
https://www.codeleading.com/article/2345206500
https://blog.csdn.net/weixin_34233421/article/details/91396978
AssertionError: Invalid device id 和RuntimeError: CUDA error: invalid device ordinal相关推荐
- cuda error invalid argument
用pytorch训练时报的错 在loss.backward时报错 估计应该是loss出现了异常值. 网上其他答案: 问题: RuntimeError: CUDA error: invalid conf ...
- RTX 3090运行报错:RuntimeError: CUDA error: no kernel image is available for execution on the device
RuntimeError: CUDA error: no kernel image is available for execution on the device 安装适用于GeForce RTX ...
- [debug] RuntimeError: CUDA error: no kernel image is available for execution on the device
问题描述 运行程序时出现报错: RuntimeError: CUDA error: no kernel image is available for execution on the device ( ...
- RuntimeError: CUDA error: no kernel image is available for execution on the device
导致的原因一般都是显卡算力和cuda或者torch版本不匹配 比如在conda中安装的pytorch=1.5.0 cuda=10.2 错误:RuntimeError: CUDA error: no k ...
- 出现错误(已解决)RuntimeError: CUDA error: no kernel image is available for execution on the device CUDA ker
出现问题(已解决)RuntimeError: CUDA error: no kernel image is available for execution on the device CUDA ker ...
- (ubuntu)YOLOv5报错:RuntimeError: CUDA error: no kernel image is available for execution on the ...
笔者之前在另一台电脑成功跑通了自己修改的yolov5,但在新系统运行时报了如下错误 RuntimeError: CUDA error: no kernel image is available for ...
- 【bug记录】RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling `cublasSgemm
问题 在训练到一定迭代次数之后报错: RuntimeError: CUDA error: CUBLAS_STATUS_EXECUTION_FAILED when calling cublasSgemm ...
- RuntimeError: CUDA error: out of memory
写在前面( 已解决) 记录一下很诡异的情况,实验室两台同样的电脑做服务器,相同的代码在一直使用的机子上是 ok 的,移到另一台配置好的电脑就开始在 model=model.cuda()的地方报错 正式 ...
- Debug Pytorch: RuntimeError: CUDA error: device-side assert triggered
报错信息 RuntimeError: CUDA error: device-side assert triggered /pytorch/aten/src/THC/THCTensorScatterGa ...
最新文章
- [Android应用]《花界》V1.0 正式版隆重发布!
- 60亿元高新项目落户西安
- 淮海工学院linux实验报告三,作业三 实验报告
- fclose会写入硬盘吗 linux_Qt linux文件同步写入
- app启动页数秒加载 代码_iOS 底层探索 - 应用加载
- C语言学习之购房从银行贷了一笔款d,准备每月还款额为p,月利率为r,计算多少月能还清。
- SWISHMAX2脚本整理及Swishmax使用技巧
- Android进程间通信之socket通信
- HTTPS时代全面到来,你准备好了吗?
- JVM初识之垃圾回收机制(GC)
- FCPX字幕插件、转场插件、效果插件、MG动画、调色插件、AE模板、AE插件、PR插件
- DOS命令:color
- SIM868_GNSS结果解析
- java游戏英雄时代攻略_军团战棋英雄时代战役攻略 战役全关卡通关攻略
- dns检测工具命令总结
- 企业微信需不需要养号
- A blockchain‑based smart home gateway architecture for preventing data forgery
- 丰巢“羊毛”,出在快递身上,让用户买单!
- 手机浏览器类型ua php,通过userAgent判断手机浏览器类型(示例代码)
- android 谷歌定位demo,android实现定位与目的地的导航示例代码
热门文章
- 【ubuntu】中文输入法安装二三事
- Pro Android学习笔记(二九):用户界面和控制(17):include和merge
- TFS2010迁移后Web工作项访问提示:error HRESULT E_FAIL has been returned from a call to a COM component....
- 嗯?原来if可以调用方法的?
- [Python人工智能] 二十一.Word2Vec+CNN中文文本分类详解及与机器学习(RF\DTC\SVM\KNN\NB\LR)分类对比
- OpenGL ES之GLSL实现仿抖音“分屏滤镜”效果
- Go + Excel 学习 Excelize rows.go
- 数据结构和算法 —— 时间复杂度+空间复杂度
- 2015年第六届蓝桥杯 - 省赛 - C/C++大学A组 - I. 垒骰子
- 信息学奥赛一本通(C++)在线评测系统——基础(三)数据结构—— 1338:【例3-3】医院设置