RuntimeError: CUDA error: device-side assert triggered和Unable to get repr for <class ‘torch.Tensor
项目场景:
一个深度学习模型,主要包括GCN与CNN两个部分
问题描述
跑代码的时候发现他一直出现RuntimeError: CUDA error: device-side assert triggered问题,显示是relu激活函数那一行报错
原因分析:
根据百度得来的方法,这个问题一般是出现了nan数据导致的,于是单步调试,查看relu激活函数之前的数据,但是显示Unable to get repr for <class ‘torch.Tensor’> 完全不知道什么原因,而且进一步发现,print也不起作用,已经可以确定是GCN的输出有问题,进一步导致relu激活函数出问题
解决方案:
根据进一步的实验发现,是由于GCN的边节点数目大于输入的特征矩阵大小,导致了index查询不到,但是他并没有报错,所以本次错误是由于index 越界导致的。
RuntimeError: CUDA error: device-side assert triggered和Unable to get repr for <class ‘torch.Tensor相关推荐
- RuntimeError: cuda runtime error (59) : device-side assert triggered
问题 在训练 Transformer 的过程中,pytorhc出现的问题:RuntimeError: cuda runtime error (59) : device-side assert trig ...
- Debug Pytorch: RuntimeError: CUDA error: device-side assert triggered
报错信息 RuntimeError: CUDA error: device-side assert triggered /pytorch/aten/src/THC/THCTensorScatterGa ...
- 已解决RuntimeError: CUDA error: device-side assert triggered异常的正确解决方法,亲测有效!!!
已解决RuntimeError: CUDA error: device-side assert triggered异常的正确解决方法,亲测有效!!! 文章目录 报错问题 解决方法 福利 报错问题 粉丝 ...
- 解决:RuntimeError: CUDA error: device-side assert triggered
@[TOC]解决办法:RuntimeError: CUDA error: device-side assert triggered CUDA kernel errors might be asynch ...
- PyTorch报错:RuntimeError: CUDA error: device-side assert triggered at /pytorch/aten/src/THC/generic
训练模型报错 RuntimeError: cuda runtime error (710) : device-side assert triggered at /pytorch/aten/src/TH ...
- 完美解决-RuntimeError: CUDA error: device-side assert triggered
网上的解决方案意思是对的,但并没有给出相应的实际解决方法: 问题描述: 当使用ImageFolder方式构建数据集的时候: train_data = torchvision.datasets.Imag ...
- Faster rcnn 训练coco2017数据报错 RuntimeError: CUDA error: device-side assert triggered
Faster rcnn 训练coco2017数据报错 RuntimeError: CUDA error: device-side assert triggered 使用faster rcnn训练自己的 ...
- cuda runtime error (59) : device-side assert triggered when running transfer_learning_
cuda runtime error (59) : device-side assert triggered when running transfer_learning_ 参考:https://bl ...
- AssertionError: Invalid device id 和RuntimeError: CUDA error: invalid device ordinal
我在使用torch多卡并行时出现了这个两个问题. ##问题一:AssertionError: Invalid device id,即无效的设备id 出现的原因:结合代码解释: import ...os ...
最新文章
- Python可迭代的对象与迭代器
- AngularJs 键盘事件和鼠标事件
- html渐变不兼容,CSS3实现文字渐变效果,兼容性最强系列!
- LG状告索尼侵权招致荷兰停息出口PS3
- php控制文本换行,css如何控制文字换行方式?(代码示例)
- 多模态语义分析_情感分析、多模态NLP、多语言翻译...这场NLP知识盛宴不可错过!...
- 关于在用异步消息处理机制使用Message.Obtain()方法(而非New Message)获得一个Message对象的好处
- opencv特征提取1-Harris角点检测
- Android(Fragment和Activity之间通信)
- 高德地图10.0版本正式发布,升级为国民出行平台
- UNIX环境高级编程之第8章:进程控制-习题
- 把一个SVN项目的目录结构 导入到另外一个空白的SVN项目里
- Linux安装MySQL可视化工具Workbench
- 银行业如何搭建自服务的数据平台?
- 注册码生成器及加密程序
- 图像处理Task05图像分割/二值化
- XPath Extractor的使用
- leetcode 803.打砖块(C/C++/Java/python)
- 关于百度地图定位出现5e-324的解决办法
- VR旅游应用案例解析,世界那么大用VR去看看!