BUG如下

ImportError: /home/hadoop-cvml/.conda/envs/masktrackrcnn_cu102/lib/python3.8/site-packages/mmcv/_ext.cpython-38-x86_64-linux-gnu.so: undefined symbol: _ZN6caffe28TypeMeta21_typeMetaDataInstanceIdEEPKNS_6detail12TypeMetaDataEv

RuntimeError: CUDA error: no kernel image is available for execution on the device

问题描述

在workstation机器上完成maskrcnn的单卡和多卡训练调试后,移植到docker服务器的过程中出现了如下所示n多bug


经过 pytorch版本,MMCV版本,和CUDA版本地不停调试,结合workstation和docker GPU的型号和CUDA版本差异,定位到问题出在了GPU架构的差异对MMCV框架的影响

详见

  1. MMCVBUG

  2. pytorch/pytorch#47585

  3. Nvidia-GPU-feature_list

workstation的GPU为GeForce RTX 2080 Ti,为Turing架构,而docker内的GPU为Tesla V100-SXM2-32GB,为Volta架构,因此根据起架构特性在安装MMCV时需要添加架构参数

TORCH_CUDA_ARCH_LIST=7.0 pip install mmcv-full

【BUG】MMCV的坑:ImportError: /xxxx/mmcv/_ext.cpython-38-x86_64-linux-gnu.so: undefined symbol: _ZN6caffe相关推荐

  1. ImportError: /opt/ros/kinetic/lib/python2.7/dist-packages/cv2.so: undefined symbol: PyCObject_Type

    1. 问题描述 使用ananconda安装好opencv之后发现出现了这种问题: import cv2 ------------------------------------------------ ...

  2. ImportError: .xx/elsa/elsa_ext.cpython-37m-x86_64-linux-gnu.so: undefined symbol: _ZNK2at10TensorBas

    具体报错如下: ImportError:./ELSA/det/mmdet/models/backbones/elsa/elsa_ext.cpython-37m-x86_64-linux-gnu.so: ...

  3. /mmcv/_ext.cpython-37m-x86_64-linux-gnu.so: undefined symbol

    跑mmdetection的Demo,碰见这个错误: ImportError: XX/python3.7/site-packages/mmcv/_ext.cpython-37m-x86_64-linux ...

  4. mmcv NCCL 报错 mmcv/_ext.cpython-37m-x86_64-linux-gnu.so: undefined symbol, RuntimeError: NCCL error i

    报错: mmcv/_ext.cpython-37m-x86_64-linux-gnu.so: undefined symbol RuntimeError: NCCL error in: /pytorc ...

  5. mmcv/_ext.cpython-36m-x86_64-linux-gnu.so: undefined symbol: _ZN6caffe28Type

    /mmcv/_ext.cpython-36m-x86_64-linux-gnu.so: undefined symbol: _ZN6caffe28TypeMeta21_typeMetaDataInst ...

  6. ImportError:undefined symbol: _Z27points_in_boxes_cpu_forwardN2at6TensorES0_S0_

    报错 ImportError: /home/lk/anaconda3/envs/DeepInteraction/lib/python3.7/site-packages/mmcv/_ext.cpytho ...

  7. ImportError:undefined symbol: _ZN2at5sliceERKNS_6TensorElN3c108optionalIlEES5_l

    报错 ImportError:undefined symbol: _ZN2at5sliceERKNS_6TensorElN3c108optionalIlEES5_l 解决方案 "undefi ...

  8. SDK ..\OBJ\XXX.axf: Error: L6218E: Undefined symbol XXXX (referred from XXX.o).

    STM32 MDK 编译时出现: 主要时变量传递问题,中断函数B,调用主函数main中的变量,虽然B中用了extern main.c中 int main(void) { u16 a=1200; } e ...

  9. ImportError: /home/yang/anaconda3/envs/sar/bin/../lib/libgio-2.0.so.0: undefined symbol: g_unix_get_

    ImportError: /home/yang/anaconda3/envs/sar/bin/-/lib/libgio-2.0.so.0: undefined symbol: g_unix_get_p ...

最新文章

  1. HTML5+PhoneGap相机拍照
  2. 数据恢复错误卡住 linux,如何处理ORA-00376错误的恢复问题
  3. 输入某年某月某日,判断这一天是这一年的第几天?(使用python语言)
  4. ie11浏览器不能显示最新修改的程序,调试出现代码逻辑错误却依旧执行
  5. Knoll Light Factory 3.2 for mac完整汉化版|灯光工厂 for mac中文版
  6. Adobe Dreamweaver 2021下载与安装教程
  7. 【OpenCV】58 二值图像分析—寻找最大内接圆
  8. 【更新】VMware虚拟机黑群晖7.1.1 RC(懒人包)
  9. 心中无码便是高清,用“脑补”除马赛克!
  10. 英语作文计算机国际会议开幕词,英文国际会议演讲稿范文
  11. SpringBoot学期总结
  12. 前端二面必会面试题(附答案)
  13. 【推荐系统】User-Item CF:GC-MC
  14. dvd在线租赁问题 matlab,DVD在线租赁服务管理模型
  15. Windows安装最新版Pygame
  16. shiro中基于注解实现的权限认证过程
  17. Opencv连通域检测
  18. coco数据集大小分类_VOC、COCO数据集类别
  19. 2015年第六届蓝桥杯C/C++程序设计本科B组省赛 星系炸弹(日期推算)
  20. win11 安装Subversion与配置 svn服务端

热门文章

  1. 罗兰钢琴APP有Android版本吗,罗兰Piano Partner 2安卓版
  2. 模仿成功者,才是最快的成功路径
  3. 看和空姐同居的日子 有感
  4. Python:暴力破解zip!
  5. Unreal4 VS Unity
  6. 网站服务器挤不进去网站怎么改进,网站怎样挤进服务器 如何建立网站服务器...
  7. 植物大战僵尸阳光的无限掉落以及掉落冷却基地址寻找详细步骤~包含排除不符合条件的地址的讲解,以及如何观察地址情况等
  8. 推荐一本LTE入门的优秀书籍
  9. Redis集群清缓存
  10. linux刻录iso到u盘