multiprocessing.context.TimeoutError

RuntimeError: mindspore/ccsrc/backend/session/kernel_build_client.h:109 Response] Response is empty

【操作步骤&问题现象】

1、修改resnet101_imagenet2012_config.yaml中的训练集路径,更改类数量以适应新数据集

2、在models/official/cv/resnet/下使用命令python train.py进行训练

解答:

出现这个问题大概率是开了图算融合特性,然后AKG算子编译卡死超时导致。如果要进一步看相关问题,可能需要你修改一下网络脚本,设置一下svae_graphs=True,然后会在本地生成一个kenel_meta文件,里面有一些相关的INFO,发给我们才能定点分析。(当前这个log看不出来更具体的情况了。)

当然如果只是想跑通这个网络,倒是也可以尝试将train.py里的set_graph_kernel_context这个函数稍微改一下,其中enable_graph_kernel设成False,下一行再注释掉,再跑,看看是否能通。

使能图算融合特性只是对时间性能可能会有优势,关闭该特性,对精度收敛啥的无影响。

使用mindspore的ResNet101使用GPU进行训练时报错相关推荐

  1. Yolov5训练时报错:UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the ind

    Yolov5训练时报错:UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the ind ...

  2. Ubuntu 16.04下Caffe-SSD的应用——常见训练时报错总结

    前言 在训练的过程中经常会碰到各种错误,关于环境的,关于样本都有,我这里整理了我训练用caffe ssd训练VGG网络模型时的报的一些错误. 错误 一.报图像样本通道错误 1.1 opencv断言错误 ...

  3. 关于yolov5训练时报错cuda内存不足问题

    RuntimeError: CUDA out of memory. Tried to allocate 4.08 GiB (GPU 0; 10.76 GiB total capacity; 414.9 ...

  4. 使用NasNet模型与keras做深度学习训练时报错

    使用NasNet模型与keras做深度学习训练时采用以下代码 一.代码片: inputs = Input((224, 224, 3)) base_model = NASNetMobile(includ ...

  5. yolov5运行以及训练时报错的问题

    当我运行时会报一些错误,首先采用下面两个链接的方式解决,亲测有效,这里进行一个汇总. 当遇到:AttributeError: Can't get attribute 'SPPF' on <mod ...

  6. (已解决)多卡训练时报错RuntimeError: grad can be implicitly created only for scalar outputs

    背景 博主第一次使用多卡训练,在程序中添加了如下代码 # 包装为并行风格模型 os.environ["CUDA_DEVICE_ORDER"] = "PCI_BUS_ID& ...

  7. yolov5 训练时报错踩坑(不定时更新)

    yolov5运行train.py 问题描述 问题:TypeError: bad operand type for unary -: 'list' 解决方案: 将[384,384]列表改成单一数值即可, ...

  8. YOLOv6训练时报错解决方法

    报错1:找不到数据集  解决方法: 是因为你yaml文件中数据集的路径不对,YOLOv6读取的数据集格式与YOLOv5不同 将数据集放在主目录中,mydata是我的数据集 yaml文件 报错2:'Tr ...

  9. insightface 切换GPU训练报错解决

    insightface代码: https://github.com/deepinsight/insightface 在pytorch训练时,先用gpu1训练,再用gpu2训练,加载gpu1的预训练时报 ...

最新文章

  1. pytest 9 pytest-datadir读取文件信息
  2. 站长新手入门:从0开始搭建微信小程序商城,不会代码也能开商城(附带源码)
  3. c语言的标准字符,C语言标准定义的32个关键字
  4. Bootstrap的role
  5. 常见数据结构List之LinkedList
  6. 如何制作自己的R包?
  7. Django 模板系统
  8. 华为p40pro如何升级鸿蒙,可以升级到鸿蒙OS的四款华为手机,相信都没有后悔入手!...
  9. MLT-type渲染算法review(笔记)
  10. Smobiler实现手机弹窗
  11. linux 音频驱动实验
  12. Python常用模块-20个常用模块总结
  13. 02.Fabric源码解析---peer命令结构(王雅震)
  14. 第4节:alphapose项目运行和参数
  15. CTF-8021-题目一
  16. 基于H5的Speedtest网速测试工具搭建
  17. TensorFlow学习——Tensorflow Object Detection API(win10,CPU)
  18. SQLiLab刷题记录
  19. SAP中建立一个ODATA步骤
  20. GB50202-2018《建筑地基工程施工质量验收标准》免费下载

热门文章

  1. 网络规划---网络计划软件
  2. JS实现小球碰撞边界反弹-点击消失(详细解析实现思路)
  3. 【DDR3 控制器设计】系列博客汇总篇(附直达链接)
  4. Go语言(Golang)是什么?
  5. 鲁大师2015官方版 v5.8.14.1085 电脑版​
  6. CSDN发布《2015年度中国软件开发者白皮书》
  7. OpenSSL中的EVP接口
  8. 【论文阅读】社交网络传播最大化问题-03
  9. DCDC电源与LDO电源
  10. ERROR in Entry module not found: Error: Can‘t resolve ‘./src‘ in ‘D:\contract\ipfs\go-ipfs\react_app