【2022第十届‘泰迪杯’挑战赛】A题：害虫识别完整版（已有完整结果）

2022泰迪杯挑战赛A题害虫识别完整版(大致思路，详细过程和代码在压缩包中)：

正式数据：

2022.04.06(正式数据)

提取码: u54n

写在前面：

完整版下载：

建议Chrome浏览器打开

下载地址

本套压缩包，包含了：

数据预处理代码、YOLO害虫识别定位全套代码、结果处理代码（去归一化为像素坐标等转为csv文件）、已有的结果result2,result3.csv（由于百度网盘速度感人，上传至阿里云盘，包中有网站和提取码）、另外赠送pycharm专业版软件

已有整套结果数据（检测的图片，问题二三的结果csv）

一、数据预处理：(在数据预处理.ipynb中)

1、构造出YOLO格式标签集：

2、预处理部分代码：

3、选出用于训练的图片集和待测图片集：

二、通过txt文件和对应的images图片文件转化为YOLO所需的voc数据集格式：

三、模型训练（全套模型和结果都在YOLO—hc压缩包中）

1、安装好环境，连接好服务器

2、参数设置成本题的数据：

3、训练好后使用best.pt进行验证，val.py参数为：

4、验证好后，进行最后的检测，detect.py，参数方面设置为：选用最好模型，选择待测数据集：

五、结果进行处理转为像素坐标点然后写入csv

runs\train\exp16:

confusion_matrix.png(混淆矩阵)

混淆矩阵能对分类问题的预测结果进行总结，显示了分类模型的在进行预测时会对哪一部分产生混淆。

F1_curve：

F1分数与置信度之间的关系。F1分数（F1-score）是分类问题的一个衡量指标，是精确率precision和召回率recall的调和平均数，最大为1，最小为0, 1是最好，0是最差

P_curve.png :

准确率precision和置信度confidence的关系图

PR_curve.png:

PR曲线中的P代表的是precision（精准率），R代表的是recall（召回率），其代表的是精准率与召回率的关系，一般情况下，将recall设置为横坐标，precision设置为纵坐标。PR曲线下围成的面积即AP，所有类别AP平均值即Map.如果PR图的其中的一个曲线A完全包住另一个学习器的曲线B，则可断言A的性能优于B，当A和B发生交叉时，可以根据曲线下方的面积大小来进行比较。一般训练结果主要观察精度和召回率波动情况（波动不是很大则训练效果较好）Precision和Recall往往是一对矛盾的性能度量指标；提高Precision == 提高二分类器预测正例门槛 == 使得二分类器预测的正例尽可能是真实正例；提高Recall == 降低二分类器预测正例门槛 == 使得二分类器尽可能将真实的正例挑选

R_curve.png :召回率和置信度之间的关系

results.png：

Box_loss： YOLO V5使用 GIOU Loss作为bounding box的损失，Box推测为GIoU损失函数均值，越小方框越准；
Objectness_loss：推测为目标检测loss均值，越小目标检测越准；
Classification_loss：推测为分类loss均值，越小分类越准；
Precision：精度（找对的正类/所有找到的正类）；
Recall：真实为positive的准确率，即正样本有多少被找出来了（召回了多少）.Recall从真实结果角度出发，描述了测试集中的真实正例有多少被二分类器挑选了出来，即真实的正例有多少被该二分类器召回。
val Box_loss: 验证集bounding box损失;
val Objectness_loss：验证集目标检测loss均值;
val classification_loss：验证集分类loss均值;

C:\Users\X\Desktop\yolov5-hc\runs\val\exp3:

六、结果：

运行detect.py:

检测图片：

转为结果保存到csv文件：

result2.csv:

result3.csv：

优化前：

优化后：

七、写在最后：

由于数据量过大不能一次性上传完，所以拆分些数据先一步上传至阿里云盘，具体在教程中

有包中详细教程，纯手码，创作不易，感谢支持

【2022第十届‘泰迪杯’挑战赛】A题：害虫识别完整版(大致思路。详细过程和代码以及结果csv在压缩包中)相关推荐

第七届泰迪杯挑战赛C题
第七届"泰迪杯"数据挖掘挑战赛C题赛题和数据网盘链接: https://pan.baidu.com/s/1VRIHBLqaTsfOMLnVmibo5A 提取码:L6X6
第十届“泰迪杯”比赛B题解题思路及代码论文
今年大二,因为对编程感兴趣入坑,算下来自学编程快要一年了,了解了关于计算机的很多方向,暑假偶然间了解到数据分析和挖掘,觉得挺有趣的就想深入学习以下,于是开始学习pandas,然后机器学习,并在天池上做 ...
【第十届“泰迪杯”数据挖掘挑战赛】B题：电力系统负荷预测分析问题二时间突变分析 Python实现
目录相关链接完整代码下载链接 1 定义绘图函数 2 通过对原始测量应用阈值来查找异常值 3 手动设置阈值 4 使用分位数设置阈值 5 3Sigma原则(IQR) 6 设定分位数 6.1 导入数据 ...
【第十届“泰迪杯”数据挖掘挑战赛】B题：电力系统负荷预测分析 31页省一等奖论文及代码
相关链接 (1)[第十届"泰迪杯"数据挖掘挑战赛]B题:电力系统负荷预测分析问题一Baseline方案 (2)[第十届"泰迪杯"数据挖掘挑战赛]B题:电力系统 ...
分享篇：第十届“泰迪杯”数据挖掘挑战赛-农田害虫图像识别（特等奖）
第十届"泰迪杯" 数据挖掘挑战赛优秀作品-农田害虫图像识别--特等奖实验结果分析 4.1.1 实验配置本篇论文的实验都是基于 Ubuntu 系统下进行,使用 GPU 和 CPU ...
分享篇：第十届“泰迪杯”数据挖掘挑战赛-农田害虫图像识别（特等奖）一
1.1 赛题背景昆虫的种类浩如烟海,农田常见的昆虫是人工生态系统的重要组成部分.分辨益虫和害虫,保留益虫,消灭害虫,对于减轻害虫对农田的生产危害有重要意义.常见农田害虫共有 138 种,天敌昆虫 ...
【第十届“泰迪杯”数据挖掘挑战赛】B题：电力系统负荷预测分析第一问LSTM模型的建立
1️⃣问题分析地区负荷的中短期预测分析根据附件中提供的某地区电网间隔15分钟的负荷数据,建立中短期负荷预测模型:
基于数据挖掘的上市公司财务数据分析——第九届“泰迪杯”挑战赛A题优秀作品
1 问题重述 1.1 问题背景这是一个信息增长速度飞快的时代,人们获取信息的方式也更加多样化.随着网络和计算机技术的快速发展,如何对各种重要资料进行数据分析是应对变化发展的主要途径.公司在经营过程中 ...
基于深度学习的岩石样本智能识别研究——第九届“泰迪杯”挑战赛B题优秀作品
1 前言 1.1 研究背景岩石是现代建筑业和制造业的重要原材料,除了作为原材料使用以外,还可以对其进行勘探开发挖掘岩油气藏,若能智能且准确地识别岩石岩性.计算岩石含油量,这将会是一笔巨大的社会财富. ...
泰迪杯|第十一届“泰迪杯”挑战赛作品提交仅剩2天了!
提交作品截止时间: 2023年4月28日 16:00:00 距离第十一届"泰迪杯"数据挖掘挑战赛提交作品结束时间只剩2天了,相信大家都在做着最后的更改.小编为大家整理了一些提交的步 ...

【2022第十届‘泰迪杯’挑战赛】A题：害虫识别完整版(大致思路。详细过程和代码以及结果csv在压缩包中)