↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

Datawhale干货

作者:limzero,西安交通大学,Datawhale原创作者

比赛介绍

工业缺陷检测是当前深度学习落地的热门项目,其中瓷砖生产过程中的“质量检测环节”需要检测出瓷砖表面的瑕疵,目前比较依赖于人工,效果和效率都层次不齐。

最近天池上线的广东工业赛事针对瓷砖表面瑕疵进行智能检测,要求选手们相应的算法,尽可能快与准确的给出瓷砖疵点具体的位置和类别,主要考察疵点的定位和分类能力。

在本篇文章中,主要为大家介绍选择yolov5作为基线的方案,供大家参考。

基于yolov5的方案

线上结果:

  • 切成 640x640 滑动窗口预测,耗时<1.5 h, 平均一张图<3s! 线上50.

  • 长边resize到6400预测,平均一张图耗时:0.6 s. 线上55+

大家们都在疯狂卷mmdet,毕竟two-stage为王,但是如果没有算力可以考虑下yolov5。而且考虑到速度和精度的均衡(复赛要求<3s),如果使用two-stage的单图大尺度预测,个人感觉上限有限,而且比赛最后都是拼细节。所以肯定会朝着切图(特别是测试时切图)的方向发展。如果two-stage妄图切图到小块然后预测,时间限制肯定会劝退大部分two-stage模型,这也是选择yolov作为基线的原因!

原始图片尺度很大,目标相对原图尺度很小,这不利于模型学习,所以无论是在线随机crop还是离线crop制作训练集,都避免不了处理切图的问题。在线切图可以参考mmdetection的官方实现RandomCrop

离线切图:和在线切图一致,参考yolt切图方式,只是要将切好的图片和新标注都保存起来。本文中训练yolov5使用的是离线切图制作的voc格式数据集

  • 假设需要切图的大小为:640x640

  • overlap比例:0.2

  • 则步长为512

  • 从原图左上角开始切图,切出来图像的左上角记为x,y,

  • 那么可以容易想到y依次为:0,512,1024,....,5120.但接下来却并非是5632,因为5632+640>6000,所以这里要对切图的overlop做一个调整,最后一步的y=6000-640.(这是最关键的一点!!!)

  • 标签变化:切图对应的标签变化就是一个简单的加减(左上角坐标)几何变化

  • 对于所有的原始数据集,切成640x640,再剔除纯背景,大约会生成1.9w+的训练图像

  • 预测的时候也是将图片切成640x640.这样一张图片大约会变成150~200张小图,而yolov5l的FPS在v100上大约为256. 所以可以保证在3s内可以完成一张图的预测。

切图后训练数据可视化:

训练

  • yolov5l

  • 训练尺度:640x640

  • 30 epoch ; 0.1比例验证(训练未见过的图片的切片) ,严格的验证还需要算上切出来的背景块。

  • 线下:mAP@0.5: 60

  • 2卡2070s训练,训练时间<6hour。

测试

单卡:RTX 2070s

  • 1 切成 640x640 滑动窗口预测,耗时<1.5 h, 平均一张图<3s! 线上50.(低于原图预测的结果我是没想到的,没有NMS后处理?或者代码写错了?或者滑窗就是不行?还是一些后处理细节没考虑清楚?)

  • 2 长边resize到6400预测,平均一张图耗时:0.6 s. 线上55+

代码运行说明:

python convert_to_voc.py #先将原始数据转为VOC格式的标注
python make_slice_voc.py #将上述图片切为小图,重新制作为voc.
python convert_voc_to_v5txt.py #将voc标注转换为yolov5的官方格式.
python make_yolov5_train_val.py #制作yolov5的train/val.

总结

  • 虽然检测比赛都是mmdet的天下,但是我相信在复赛有时间限制的情况下,加上这个赛题的特殊性,yolov5还是有比较强的竞争力的,特别是比赛后期。

  • V5提升空间很大:(1)本baseline使用两卡2070s小尺度单图训练,本身具有局限性;(2)除了yolov5l还有更强的v5x可选; (3)预测部分很粗糙,没有充分发挥yolov5速度快的特点;(4)结果后处理可以进一步探索

  • 关于切图滑窗预测, 如果处理好细节,切图预测理论上应该是会好于原图预测。特别是针对那些背景块,需要特殊处理,不然会引入极多的FP,必然导致mAP降低。关于overlap的问题,可以借鉴模型融合的方式,使用NMS或者WBF来对最后的重叠进行一个再处理。

  • 关于单图预测:考虑推理速度尺度,中心裁剪推理,因为所有图都有灰边背景,统计下这些背景的边框范围,进行centerCrop预测结果应该会更好。当然有更简单的方式,以直接在推理结果上面进行后处理。

训练/验证可视化

tensorboard

比赛地址

https://tianchi.aliyun.com/s/bc97f977ae47dcfa4b07c027cd28d907(复制粘贴或阅读原文)

“整理不易,三连

基于yolov5的工业缺陷检测方案相关推荐

  1. 基于yolov5的PCB缺陷检测

    1.简述 基于图像识别技术实现自动印刷电路板(PCB)缺陷检测,具有高效.准确.可靠.自动化程度高和可扩展性强等优点,大大提高了检测效率,节省了人力成本.传统的检测方法通常需要大量的人力和时间,并且容 ...

  2. 「 工业缺陷检测深度学习方法」最新2022研究综述

    作者丨专知 来源丨专知 编辑丨极市平台 导读 基于深度学习的工业缺陷检测方法在各种生产与运维场景中扮演着重要角色.本文将对工业缺陷检测的任务定义.难点.挑战.主流方法.公共数据集及评价指标等进行全面归 ...

  3. 工业缺陷检测比赛Top3方案

    Datawhale干货 方向:深度学习,应用:工业缺陷检测 工业缺陷检测是当前深度学习落地的热门项目,近年来许多的比赛平台都举办了关于缺陷检测的比赛,如kaggle前不久举办的钢铁缺陷检测,以及天池刚 ...

  4. 机器视觉工业缺陷检测的那些事(四、常用算法与库)

    机器视觉工业缺陷检测的那些事(四.常用算法与库) 目录 机器视觉工业缺陷检测的那些事(四) 二.算法(预处理算法.检测算法) 常用的图像处理算法: 1.图像变换:(空域和频域.几何变换.色度变换.尺度 ...

  5. 机器视觉工业缺陷检测的那些事(三、镜头)

    目录 机器视觉工业缺陷检测的那些事(三) 3.镜头的选择 (1)镜头的接口 C接口和CS接口的区别: (2)工业镜头的基本参 <1> 视场(Field of view,即FOV,也叫视野范 ...

  6. 工业缺陷检测工程实践综述

    文章目录 摘要 1.主要难点 2.场景分析 3.缺陷归纳 4.可行性分析 5.数据的四大难点 5.1.数据难分 5.2.多样性不够 5.3.样本不平衡 5.4.数据脏 6.数据生成 7.场景VS数据 ...

  7. 基于PP-PicoDet的钢铁缺陷检测

    基于PP-PicoDet的钢铁缺陷检测 1.背景介绍 近年来,AI视觉检测在安防.工业制造等产业智能化升级进程中发挥着举足轻重的作用. 自动检查和缺陷检测系统使用 AI 来检查零部件的故障和缺陷.通过 ...

  8. 万字长文细说工业缺陷检测

    作者丨皮特潘 编辑丨极市平台 注意:本文从我的一个PPT整理而来,行文可能比较随意,很多细节没有写清楚,后续有时间会持续修改. 上次说到,要写一个系列,最后整理才发现,还是合成一篇比较好一点. [皮特 ...

  9. 如何解决工业缺陷检测小样本问题?

    作者丨吴雨培 来源丨act 工业AI 编辑丨极市平台 当前基于有监督的缺陷检测算法,在数据量充足的场景下已经逐步成功落地,但工业场景具有一定的离散性,大部分应用场景均为小样本检测场景,小样本问题的解决 ...

最新文章

  1. 刚进园子,广州的冬天像夏天
  2. 简单的JS统计静态网站访问次数
  3. duilib拖动控制功能的实现(源代码)
  4. 词汇量贫乏只会说yes、no?试试这些高级感替代词!
  5. 为什么要保持软件包依赖项自由循环的五个原因
  6. Java基础-this关键字和构造方法(10)
  7. maya崩溃自动保存路径_xgen 分享在maya里制作头发失败经验
  8. Windows最强ssh客户端 Bitvise SSH Client 与阿里堡垒服务
  9. 如何使用在线MP3工具简单剪切音乐
  10. esxi - with nvidia geforce 10 titan xp card
  11. 360视频:CMP和ACP投影
  12. vue修改浏览器的标题和图标
  13. 边缘检测(opencv_python下)
  14. 简单python数据分析项目实例-入门Python数据分析最好的实战项目(一)
  15. XML的两种常见格式
  16. 使用《金字塔原理》指导述职报告写作
  17. php调用lol数据库,计算lol战斗力
  18. 【药物联合预测方向】常见专业名词及翻译
  19. 计算机卡主板页面,windows电脑开机时卡在主板界面
  20. 芯片行业都难在哪儿?这篇说得最详细!

热门文章

  1. 天兔(Lepus)监控系统慢查询分析平台安装配置
  2. 前端相关html和css
  3. JOptionPane
  4. Ubuntu 14.04系统托盘图标问题,skype托盘图标显示
  5. HDU 1556 Color the ball
  6. POJ 3683 【2-sat+求一组可行解】.cpp
  7. Multithread 之 introduction
  8. Intel 6系列芯片组设计缺陷 全球出货暂停
  9. 第九代小冰惊喜登场,多端融合且琴棋书画样样精通
  10. 机器学习新闻综述:2019年AI领域不得不看的6篇文章