【2022第十届‘泰迪杯’挑战赛】A题:害虫识别完整版(大致思路。详细过程和代码以及结果csv在压缩包中)
【2022第十届‘泰迪杯’挑战赛】A题:害虫识别完整版(已有完整结果)
2022泰迪杯挑战赛A题害虫识别完整版(大致思路,详细过程和代码在压缩包中):
正式数据:
2022.04.06(正式数据)
提取码: u54n
写在前面:
完整版下载:
建议Chrome浏览器打开
下载地址
本套压缩包,包含了:
数据预处理代码、YOLO害虫识别定位全套代码、结果处理代码(去归一化为像素坐标等转为csv文件)、已有的结果result2,result3.csv(由于百度网盘速度感人,上传至阿里云盘,包中有网站和提取码)、另外赠送pycharm专业版软件
已有整套结果数据(检测的图片,问题二三的结果csv)
一、数据预处理:(在数据预处理.ipynb中)
1、构造出YOLO格式标签集:
2、预处理部分代码:
3、选出用于训练的图片集和待测图片集:
二、通过txt文件和对应的images图片文件转化为YOLO所需的voc数据集格式:
三、模型训练(全套模型和结果都在YOLO—hc压缩包中)
1、安装好环境,连接好服务器
2、参数设置成本题的数据:
3、训练好后使用best.pt进行验证,val.py参数为:
4、验证好后,进行最后的检测,detect.py,参数方面设置为:选用最好模型,选择待测数据集:
五、结果进行处理转为像素坐标点然后写入csv
runs\train\exp16:
confusion_matrix.png(混淆矩阵)
混淆矩阵能对分类问题的预测结果进行总结,显示了分类模型的在进行预测时会对哪一部分产生混淆。
F1_curve:
F1分数与置信度之间的关系。F1分数(F1-score)是分类问题的一个衡量指标,是精确率precision和召回率recall的调和平均数,最大为1,最小为0, 1是最好,0是最差
P_curve.png :
准确率precision和置信度confidence的关系图
PR_curve.png:
PR曲线中的P代表的是precision(精准率),R代表的是recall(召回率),其代表的是精准率与召回率的关系,一般情况下,将recall设置为横坐标,precision设置为纵坐标。PR曲线下围成的面积即AP,所有类别AP平均值即Map.如果PR图的其中的一个曲线A完全包住另一个学习器的曲线B,则可断言A的性能优于B,当A和B发生交叉时,可以根据曲线下方的面积大小来进行比较。一般训练结果主要观察精度和召回率波动情况(波动不是很大则训练效果较好)Precision和Recall往往是一对矛盾的性能度量指标;提高Precision == 提高二分类器预测正例门槛 == 使得二分类器预测的正例尽可能是真实正例;提高Recall == 降低二分类器预测正例门槛 == 使得二分类器尽可能将真实的正例挑选
R_curve.png :召回率和置信度之间的关系
results.png:
Box_loss: YOLO V5使用 GIOU Loss作为bounding box的损失,Box推测为GIoU损失函数均值,越小方框越准;
Objectness_loss: 推测为目标检测loss均值,越小目标检测越准;
Classification_loss: 推测为分类loss均值,越小分类越准;
Precision: 精度(找对的正类/所有找到的正类);
Recall: 真实为positive的准确率,即正样本有多少被找出来了(召回了多少).Recall从真实结果角度出发,描述了测试集中的真实正例有多少被二分类器挑选了出来,即真实的正例有多少被该二分类器召回。
val Box_loss: 验证集bounding box损失;
val Objectness_loss: 验证集目标检测loss均值;
val classification_loss: 验证集分类loss均值;
C:\Users\X\Desktop\yolov5-hc\runs\val\exp3:
六、结果:
运行detect.py:
检测图片:
转为结果保存到csv文件:
result2.csv:
result3.csv:
优化前:
优化后:
七、写在最后:
由于数据量过大不能一次性上传完,所以拆分些数据先一步上传至阿里云盘,具体在教程中
有包中详细教程,纯手码,创作不易,感谢支持
【2022第十届‘泰迪杯’挑战赛】A题:害虫识别完整版(大致思路。详细过程和代码以及结果csv在压缩包中)相关推荐
- 第七届泰迪杯挑战赛C题
第七届"泰迪杯"数据挖掘挑战赛C题赛题和数据 网盘链接: https://pan.baidu.com/s/1VRIHBLqaTsfOMLnVmibo5A 提取码:L6X6
- 第十届“泰迪杯”比赛B题解题思路及代码论文
今年大二,因为对编程感兴趣入坑,算下来自学编程快要一年了,了解了关于计算机的很多方向,暑假偶然间了解到数据分析和挖掘,觉得挺有趣的就想深入学习以下,于是开始学习pandas,然后机器学习,并在天池上做 ...
- 【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 问题二 时间突变分析 Python实现
目录 相关链接 完整代码下载链接 1 定义绘图函数 2 通过对原始测量应用阈值来查找异常值 3 手动设置阈值 4 使用分位数设置阈值 5 3Sigma原则(IQR) 6 设定分位数 6.1 导入数据 ...
- 【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析 31页省一等奖论文及代码
相关链接 (1)[第十届"泰迪杯"数据挖掘挑战赛]B题:电力系统负荷预测分析 问题一Baseline方案 (2)[第十届"泰迪杯"数据挖掘挑战赛]B题:电力系统 ...
- 分享篇:第十届“泰迪杯”数据挖掘挑战赛-农田害虫图像识别(特等奖)
第十届"泰迪杯" 数据挖掘挑战赛优秀作品-农田害虫图像识别--特等奖 实验结果分析 4.1.1 实验配置 本篇论文的实验都是基于 Ubuntu 系统下进行,使用 GPU 和 CPU ...
- 分享篇:第十届“泰迪杯”数据挖掘挑战赛-农田害虫图像识别(特等奖)一
1.1 赛题背景 昆虫的种类浩如烟海,农田常见的昆虫是人工生态系统的重要组成部分.分辨益 虫和害虫,保留益虫,消灭害虫,对于减轻害虫对农田的生产危害有重要意义.常见 农田害虫共有 138 种,天敌昆虫 ...
- 【第十届“泰迪杯”数据挖掘挑战赛】B题:电力系统负荷预测分析第一问LSTM模型的建立
1️⃣问题分析 地区负荷的中短期预测分析 根据附件中提供的某地区电网间隔15分钟的负荷数据,建立中短期负荷预测模型:
- 基于数据挖掘的上市公司财务数据分析——第九届“泰迪杯”挑战赛A题优秀作品
1 问题重述 1.1 问题背景 这是一个信息增长速度飞快的时代,人们获取信息的方式也更加多样化.随着网络和计算机技术的快速发展,如何对各种重要资料进行数据分析是应对变化发展的主要途径.公司在经营过程中 ...
- 基于深度学习的岩石样本智能识别研究——第九届“泰迪杯”挑战赛B题优秀作品
1 前言 1.1 研究背景 岩石是现代建筑业和制造业的重要原材料,除了作为原材料使用以外,还可以对其进行勘探开发挖掘岩油气藏,若能智能且准确地识别岩石岩性.计算岩石含油量,这将会是一笔巨大的社会财富. ...
- 泰迪杯|第十一届“泰迪杯”挑战赛作品提交仅剩2天了!
提交作品截止时间: 2023年4月28日 16:00:00 距离第十一届"泰迪杯"数据挖掘挑战赛提交作品结束时间只剩2天了,相信大家都在做着最后的更改.小编为大家整理了一些提交的步 ...
最新文章
- pycharm+PyQt5+python最新开发环境配置,踩坑过程详解
- Linux下程序崩溃dump时的 core文件的使用方法
- IOS开发 使用CGContextRef绘制文字时的设置
- Scala println的实现原理调试
- Vue中组件间通信的方式
- 织梦网站如何上传服务器还原,织梦系统DedeCMS网站通过数据库备份、还原实现网站整站搬家移植...
- 多媒体台式计算机安装方法,台式机如何组装 台式机组装注意事项【详解】
- NLP情感分析笔记(二):Updated情感分析
- gephi使用教程pdf
- 重置IE浏览器的操作
- python 克里金空间插值_空间插值——克里金插值
- ref:使用Dezender对zend加密后的php文件进行解密
- sorted()函数
- 关于RFID电感耦合方式的射频前端工作原理,你了解吗?
- Linux下ln命令建立软硬链接
- Pytorch版YOLOv4训练步骤(二)
- 下一次面试前你需要准备的五个基本步骤
- 后端报错fastJson.Json.toJson错误
- 多目标优化蚁群算法的matlab_混合参数蚁群算法的改进优化
- 什么是业务,什么是业务架构?