【MindSpore】用coco2017训练Model_zoo上的 yolov4，迭代了两千多batch

问题描述：

运行环境：Atlas 800 9000 CANN20.2

batch_size: 4，8，16，32（四种分别尝试过，都在一个epoch训练了80%左右报这个错了）

数据集：coco2017

模型：Model_zoo YOLOv4_Cspdarknet53 (配置都是用的默认的)

解决方案：

从错误截图中初步分析的结论是，数据集可能不完整或是有错误，导致一定step之后再也无法迭代出数据进行训练了。

我们建议按照如下方式排查故障：

1、确保coco2017数据集来源正确，mindspore model_zoo中yolo v4 README提供了coco数据集的官方下载链接：COCO - Common Objects in Context

2、上述错误一般源于src/yolo_dataset.py读取coco数据集时发生了错误，建议采用如下方式进行排查：

在src/yolo_dataset.py的代码底部增加如下调试代码：

from src.config import ConfigYOLOV3DarkNet53

if __name__ == '__main__':

config = ConfigYOLOV3DarkNet53()

config.label_smooth = 0

config.label_smooth_factor = 0.1

image_dir = "/your_path/coco2017/train2017"

anno_path = "/your_path/coco2017/annotations/instances_train2017.json"

yolo_dataset = COCOYoloDataset(image_dir, anno_path)

nums = 0

for data in yolo_dataset:

nums += 1

print("nums is ", nums)

以上代码主要用于调试COCOYoloDataset，正常情况下，yolo_dataset是可以正确完整输出所有数据的，请参照以上调试代码，确保读取coco数据集完整无误。

【MindSpore】用coco2017训练Model_zoo上的 yolov4，迭代了两千多batch_size之后报错，大佬们帮忙看看。相关推荐

vue3 子组件上绑定(v-model=“xx“) 父组件传过来的值后报错
遇到的问题 vue3的项目中, 升级了vant的版本(^4.0.7)后, 子组件中用v-model的地方出现了报错报错的内容 v-model cannot be used on a prop, be ...
百度aistudio上使用yolov4训练人脸检测模型
前几天在百度的aistudio上使用yolov4训练了一下人脸检测的模型,今天看见有人留言希望我写一篇在aistudio上如何使用yolov4的教程,纠结了一下,因为这玩意的操作流程其实在我那篇yol ...
MindSpore笔记：训练手写数字识别
前言万物皆需前言. 如果该文章无法阅读懂,没关系,后面有较为明了的解释文章. 如果还没装mindspore,请点击:here 先来硬的!! 那么,学习一个新东西,要先来硬的.一门语言是Hello W ...
python使用matplotlib对比多个模型的在训练集上的效果并使用柱状图进行可视化：基于交叉验证的性能均值（mean）和标准差(std)进行可视化分析、使用标准差信息添加误差区间条yerr
python使用matplotlib对比多个模型的在训练集上的效果并使用柱状图进行可视化:基于交叉验证的性能均值(mean)和标准差(std)进行可视化分析.使用标准差信息添加误差区间条yerr 目录
R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果（accuray、F1、偏差Deviance）：随机森林在Bagging算法的基础上加入了列采样（分枝特征随机）
R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray.F1.偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机) ...
R语言基于Bagging算法(融合多个决策树)构建集成学习Bagging分类模型、并评估模型在测试集和训练集上的分类效果（accuray、F1、偏差Deviance）：Bagging算法与随机森林对比
R语言基于Bagging算法(融合多个决策树)构建集成学习Bagging分类模型.并评估模型在测试集和训练集上的分类效果(accuray.F1.偏差Deviance):Bagging算法与随机森林对比 ...
用最简单的方式训练史上最强ResNet-50，性能超过魔改结构的ResNeSt
近日,CMU 的研究人员在 arXiv 上放出了一份技术报告,介绍他们如何通过蒸馏(distillation)训练一个强大的小模型.所提出方法使用相同模型结构和输入图片大小的前提下,在 ImageNe ...
宁畅定制算力为冰雪训练插上智慧翅膀
公园里.广场上,我们常常能看到轮滑者矫健的身影,他们用不同的技法或姿态展示着轮滑炫酷.时尚的魅力.而有"冰上芭蕾"之称的花样滑冰兼具音乐美.姿态美和力量美,更会给我们带来叹为观止的 ...
SVM 训练--在训练集上acc为94% 在测试集上为70%
用SVM 训练的时候: 出现的问题是: Error: specified nu is infeasible 带有下标的赋值维度不匹配. 百度到的答案:赋值维度不匹配...说明等号两边的大小不一致,导致 ...

【MindSpore】用coco2017训练Model_zoo上的 yolov4，迭代了两千多batch_size之后报错，大佬们帮忙看看。

【MindSpore】用coco2017训练Model_zoo上的 yolov4，迭代了两千多batch_size之后报错，大佬们帮忙看看。相关推荐

最新文章

热门文章