问题描述:

运行环境:Atlas 800 9000      CANN20.2

batch_size: 4,8,16,32(四种分别尝试过,都在一个epoch训练了80%左右报这个错了)

数据集:coco2017

模型:Model_zoo   YOLOv4_Cspdarknet53  (配置都是用的默认的)

解决方案:

从错误截图中初步分析的结论是,数据集可能不完整或是有错误,导致一定step之后再也无法迭代出数据进行训练了。

我们建议按照如下方式排查故障:

1、确保coco2017数据集来源正确,mindspore model_zoo中yolo v4 README提供了coco数据集的官方下载链接:COCO - Common Objects in Context

2、上述错误一般源于src/yolo_dataset.py读取coco数据集时发生了错误,建议采用如下方式进行排查:

在src/yolo_dataset.py的代码底部增加如下调试代码:

from src.config import ConfigYOLOV3DarkNet53

if __name__ == '__main__':

config = ConfigYOLOV3DarkNet53()

config.label_smooth = 0

config.label_smooth_factor = 0.1

image_dir = "/your_path/coco2017/train2017"

anno_path = "/your_path/coco2017/annotations/instances_train2017.json"

yolo_dataset = COCOYoloDataset(image_dir, anno_path)

nums = 0

for data in yolo_dataset:

nums += 1

print("nums is ", nums)

以上代码主要用于调试COCOYoloDataset,正常情况下,yolo_dataset是可以正确完整输出所有数据的,请参照以上调试代码,确保读取coco数据集完整无误。

【MindSpore】用coco2017训练Model_zoo上的 yolov4,迭代了两千多batch_size之后报错,大佬们帮忙看看。相关推荐

  1. vue3 子组件上绑定(v-model=“xx“) 父组件传过来的值后报错

    遇到的问题 vue3的项目中, 升级了vant的版本(^4.0.7)后, 子组件中用v-model的地方出现了报错 报错的内容 v-model cannot be used on a prop, be ...

  2. 百度aistudio上使用yolov4训练人脸检测模型

    前几天在百度的aistudio上使用yolov4训练了一下人脸检测的模型,今天看见有人留言希望我写一篇在aistudio上如何使用yolov4的教程,纠结了一下,因为这玩意的操作流程其实在我那篇yol ...

  3. MindSpore笔记:训练手写数字识别

    前言 万物皆需前言. 如果该文章无法阅读懂,没关系,后面有较为明了的解释文章. 如果还没装mindspore,请点击:here 先来硬的!! 那么,学习一个新东西,要先来硬的.一门语言是Hello W ...

  4. python使用matplotlib对比多个模型的在训练集上的效果并使用柱状图进行可视化:基于交叉验证的性能均值(mean)和标准差(std)进行可视化分析、使用标准差信息添加误差区间条yerr

    python使用matplotlib对比多个模型的在训练集上的效果并使用柱状图进行可视化:基于交叉验证的性能均值(mean)和标准差(std)进行可视化分析.使用标准差信息添加误差区间条yerr 目录

  5. R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray、F1、偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机)

    R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray.F1.偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机) ...

  6. R语言基于Bagging算法(融合多个决策树)构建集成学习Bagging分类模型、并评估模型在测试集和训练集上的分类效果(accuray、F1、偏差Deviance):Bagging算法与随机森林对比

    R语言基于Bagging算法(融合多个决策树)构建集成学习Bagging分类模型.并评估模型在测试集和训练集上的分类效果(accuray.F1.偏差Deviance):Bagging算法与随机森林对比 ...

  7. 用最简单的方式训练史上最强ResNet-50,性能超过魔改结构的ResNeSt

    近日,CMU 的研究人员在 arXiv 上放出了一份技术报告,介绍他们如何通过蒸馏(distillation)训练一个强大的小模型.所提出方法使用相同模型结构和输入图片大小的前提下,在 ImageNe ...

  8. 宁畅定制算力为冰雪训练插上智慧翅膀

    公园里.广场上,我们常常能看到轮滑者矫健的身影,他们用不同的技法或姿态展示着轮滑炫酷.时尚的魅力.而有"冰上芭蕾"之称的花样滑冰兼具音乐美.姿态美和力量美,更会给我们带来叹为观止的 ...

  9. SVM 训练--在训练集上acc为94% 在测试集上为70%

    用SVM 训练的时候: 出现的问题是: Error: specified nu is infeasible 带有下标的赋值维度不匹配. 百度到的答案:赋值维度不匹配...说明等号两边的大小不一致,导致 ...

最新文章

  1. 大脑神经细胞也有老熟人
  2. mysql asyn 示例
  3. python的编程模式-实例解析Python设计模式编程之桥接模式的运用
  4. Hadoop LZO的安装与配置
  5. map mybatis 的字段返回0_Mybatis 你踩过坑吗?
  6. oracle中关于删除表purge语句和闪回语句的基本使用
  7. python thinker canvas create_arc 使用详解
  8. 设计一个按优先数调度算法实现处理器调度的程序_计算机中的程序都是怎么运行的,来深入了解一下吧...
  9. [原创]windows server 2012 AD架构 试验 系列 – 15解决AD复制冲突
  10. 谈MicroMessageTest的开始创建
  11. CodeMix使用的语言和框架(一):JavaScript
  12. linux shell捕获异常,shell脚本中如何获取错误输出
  13. 12帧跑步动画分解图_跑步动画原理讲解
  14. Unity外接设备摇杆控制
  15. 小技巧之chrome浏览器安装淘宝比价插件
  16. 不同参数对分类模型性能影响记录
  17. 新兴实践_新兴文件系统简介
  18. Polar SC的C语言实现之译码篇
  19. 微信云函数的使用步骤
  20. 红米airdots掉了怎么查找_百元性价比之选,众筹只需79元的红米airdots2首发体验...

热门文章

  1. Centos 7 搭建Chrony 时间服务器
  2. vmware虚拟机转换格式qcow2和raw
  3. Html5+Threejs炫酷灯光效果-流光、追光 呼吸灯效果
  4. 未来的计算机450字,未来的手机作文450字
  5. 自己动手给iphone5换电池
  6. 常见鸟的种类及特点_鸟的种类及图片(看图识鸟)
  7. 虚拟搭建局域网模拟器_利用Packet Tracer模拟器搭建小型企业局域网实验
  8. 字符串变量作mysql查询条件
  9. 计算机网络实验smtp 邮件,smtp计算机网络实验报告.doc
  10. python分析出nba球员的位置_解码NBA:数据分析揭示十三个隐藏的球员位置