点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

Github:Surface-Defect-Detection

???????? 我不断总结表面缺陷研究领域中的开源数据集(这个非常关键),收集整理了自17年以来的重要论文,可以在???? [Papers]文件夹下查看。????

    

目前, 基于机器视觉的表面缺陷装备已经在各工业领域广泛替代人工肉眼检测。一般来说,传统的基于机器视觉的表面缺陷检测方法,通常利用被检表面或缺陷的不同性质进行成像方案的设计,合理的成像方案有助于获得光照均匀的图像,并将物体表面缺陷明显的体现出来。近年来,不少基于深度学习的缺陷检测方法也被广泛应用在各种工业场景中。

对比计算机视觉中明确的分类、检测和分割任务, 缺陷检测的需求非常笼统. 实际上, 其需求可以划分为三个不同的层次: “缺陷是什么”(分类)“缺陷在哪里”(定位)“缺陷是多少”(分割)

01

表面缺陷检测关键问题

1、小样本问题

目前深度学习方法广泛应用在各种计算机视觉任务中, 表面缺陷检测一般被看作是其在工业领域的具体应用。在传统的认识中, 深度学习方法无法直接应用在表面缺陷检测中的原因是因为在真实的 工业环境中, 所能提供的工业缺陷样本太少。

实际上, 针对于工业表面缺陷检测中关键问题之一的小样本问题, 目前有4种不同的解决方式:

1)数据扩增、生成

2)网络预训练与迁移学习

3)合理的网络结构设计

4)无监督或半监督

在无监督模型中, 只利用正 常样本进行训练, 因此不需要缺陷样本. 半监督方法 可以利用没有标注的样本来解决小样本情况下的网络训练难题。

2、实时性问题

基于深度学习的缺陷检测方法在工业应用中包括三个主要环节: 数据标注模型训练模型推断. 在实际工业应用中的实时性更关注模型推断这一环节. 目前大多数缺陷检测方法都集中在分类或 识别的准确性上, 而很少关注模型推断的效率。有不少方法用于加速模型, 例如模型权重量化和模型剪枝等。另外,虽然现有深度学习模型使用GPU作为通用计算单元, 但随着技术发展, 相信FPGA会成为一个具有吸引力的替代方案。

02

工业表面缺陷检测常用数据集

1)钢材表面:NEU-CLS

地址:http://faculty.neu.edu.cn/yunhyan/NEU_surface_defect_database.html

由东北大学(NEU)发布的表面缺陷数据库,收集了热轧钢带的六种典型表面缺陷,即轧制氧化皮(RS),斑块(Pa),开裂(Cr),点蚀表面( PS),内含物(In)和划痕(Sc)。该数据库包括1,800个灰度图像:六种不同类型的典型表面缺陷,每一类缺陷包含300个样本。对于缺陷检测任务,数据集提供了注释,指示每个图像中缺陷的类别和位置。对于每个缺陷,黄色框是指示其位置的边框,绿色标签是类别分数。

2)太阳能板:elpv-dataset

地址:https://github.com/zae-bayern/elpv-dataset

3)金属表面:KolektorSDD

该数据集是由Kolektor Group提供并注释的有缺陷的电子换向器的图像构成的。

具体地说,

  • 在电子换向器中嵌入的塑料表面上观察到了微小的碎裂或裂缝;

  • 在八个不重叠的图像中捕获每个换向器的表面积;

  • 在受控环境中捕获图像。

官方链接:https://www.vicos.si/Downloads/KolektorSDD

网盘链接:https://pan.baidu.com/share/init?surl=HSzHC1ltHvt1hSJh_IY4Jg (提取码:1zlb)

该数据集包括:

  • 50个例如变形的电子换向器的物理属性;

  • 每一个中包含8个表面;

  • 总共399张图片;
    – 52张有可见缺陷的图像;
    – 347张没有任何缺陷;

  • 原始尺寸图片:
    – 宽度:500 px
    – 高度:从1240到1270像素

  • 为了进行训练和评估,图片的尺寸应调整为512 x 1408像素

对于每一个,缺陷仅在至少一张图像中可见,而有两个在图像上有缺陷就意味着有52张图像可见缺陷。其余347张图像用作表面无缺陷的负样本。

4)PCB板检测:DeepPCB

地址:https://github.com/Charmve/Surface-Defect-Detection/tree/master/DeepPCB

图1. PCB板检测数据集

5)AITEX数据集(面料缺陷)

数据集下载链接:

https://pan.baidu.com/s/1cfC4Ll5QlnwN5RTuSZ6b7w (提取码:b9uy)

该数据库由七个不同织物结构的245张4096 x 256像素图像组成。数据库中有140个无缺陷图像,每种类型的织物20个,除此之外,有105幅纺织行业中常见的不同类型的织物缺陷(12种缺陷)图像。图像的大尺寸允许用户使用不同的窗口尺寸,从而增加了样本数量。Internet上的数据库还包含所有具有缺陷的图像的分割mask,使得白色像素表示缺陷区域,其余像素为黑色。

6)天池布匹缺陷数据(竞赛)

数据下载链接:

https://pan.baidu.com/s/1LMbujxvr5iB3SwjFGYHspA (提取码:gat2)

在布匹的实际生产过程中,由于各方面因素的影响,会产生污渍、破洞、毛粒等瑕疵,为保证产品质量,需要对布匹进行瑕疵检测。本数据涵盖了纺织业中布匹的各类重要瑕疵,每张图片含一个或多种瑕疵。数据包括包括素色布和花色布两类,其中,素色布数据约8000张,用于初赛;花色布数据约12000张,用于复赛。

7)天池铝型材表面瑕疵数据集(竞赛)

数据集下载链接:

https://tianchi.aliyun.com/competition/entrance/231682/information

数据集介绍:在铝型材的实际生产过程中,由于各方面因素的影响,铝型材表面会产生裂纹、起皮、划伤等瑕疵,这些瑕疵会严重影响铝型材的质量。为保证产品质量,需要人工进行肉眼目测。然而,铝型材的表面自身会含有纹路,与瑕疵的区分度不高。大赛数据集里有1万份来自实际生产中有瑕疵的铝型材监测影像数据,每个影像包含一个或多种瑕疵。供机器学习的样图会明确标识影像中所包含的瑕疵类型。

8)弱监督学习下的工业光学检测(DAGM 2007)

数据下载链接:

https://hci.iwr.uni-heidelberg.de/node/3616

数据集介绍:

  • 主要针对纹理背景上的杂项缺陷。

  • 较弱监督的训练数据。

  • 包含是个数据集,前六个为训练数据集,后四个为测试数据集。

  • 每个数据集均包含以灰度8位PNG格式保存的1000个“无缺陷”图像和150个“有缺陷”图像。每个数据集由不同的纹理模型和缺陷模型生成。

  • “无缺陷”图像显示的背景纹理没有缺陷,“无缺陷”图像的背景纹理上恰好有一个标记的缺陷。

  • 所有数据集已随机分为大小相等的训练和测试子数据集。

  • 弱标签以椭圆形表示,大致表示缺陷区域。

9)基建表面裂纹检测数据

数据集是github上的一个项目,主要是一些基建(水泥表面裂纹),可以访问项目连接:https://github.com/cuilimeng/CrackForest-dataset 或者百度云链接:https://pan.baidu.com/s/1108j5QbDr7T3XQvDxAzVpg (提取码:jajn)下载。

图2. 桥梁裂缝(左)和路面裂缝(右)

  • 桥梁裂缝. 有2688张没有像素级地面真实情况的桥梁裂缝图像,来自于"Liangfu Li, Weifei Ma, Li Li, Xiaoxiao Gao". 数据集可通过此链接访问:https://github.com/Charmve/Surface-Defect-Detection/tree/master/Bridge_Crack_Image.

  • 路面裂缝. 该数据集来自于 Shi Yong, and Cui Limeng and Qi Zhiquan and Meng Fan and Chen Zhensong. 原始数据集可通过此链接访问 https://github.com/Charmve/Surface-Defect-Detection/tree/master/CrackForest. 我们提取像素级地面真相的图像文件。

10)磁瓦缺陷数据集

该数据集是由abin2收集的,现已开源,你可以从这下载 https://github.com/Charmve/Surface-Defect-Detection/tree/master/Magnetic-Tile-Defect,它被用在了论文"Surface defect saliency of magnetic tile"中。(点击这里 或 这里可以查看论文)

图3. 数据集概述.

这同样也是论文“Saliency of magnetic tile surface defects”的数据集,它收集了6个常见磁砖缺陷的图像,并标记了它们的像素级地面真相。

11)铁轨表面缺陷数据集

RSDDs数据集包含两种类型的数据集:第一种是从快车道捕获的I型RSDDs数据集,其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集,其中包含128个具有挑战性的图像。

两个数据集的每幅图像至少包含一个缺陷,并且背景复杂且噪声很大。

RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。

官方链接:http://icn.bjtu.edu.cn/Visint/resources/RSDDs.aspx

链接:https://pan.baidu.com/share/init?surl=svsnqL0r1kasVDNjppkEwg (提取码:nanr

12)Kylberg纹理数据集 v.1.0

图4. 28个纹理类中的每一个的示例补丁。

该数据集:

  • 28个纹理类,请参见图4。

  • 每个分类下有160个独特的纹理补丁。(每个原始补丁有12个旋转的替代数据集,每个类160 * 12 = 1920个纹理补丁)

  • 纹理补丁大小:576x576像素。

  • 文件格式:无损压缩8位PNG。

  • 所有补丁均以127的平均值和40的标准偏差进行标准化。

  • 每个纹理类一个目录。

  • 文件的命名如下:blanket1-d-p011-r180.png,其中blanket1是类名,d是原始图像样本编号(可能的值是a,b,c或d),p011是补丁编号11,r180补丁旋转了180度。

官方链接:http://www.cb.uu.se/~gustaf/texture/

03

表面缺陷检测论文集

收集一些表面缺陷检测的文章,主要检测对象是:金属表面、LCD屏、建筑、输电线等缺陷或异常检物。方法以分类方法、检测方法、重构方法、生成方法为主。电子版论文放在了paper文件的对应日期文件下。

详见本仓库 ???? [Papers]

致谢

你能看到这个项目,我们应当感谢上述数据集最初的开源的人,他们给我们的学习和研究工作带来了极大的帮助。这个数据集的收集想法起初来自于看了“AI算法修炼营”SFXiang的一篇关于表面缺陷检测的文章,促使我整理一份更为全面的数据集。论文集来自于一位叫“庆志的小徒弟”的CSDNer,现在论文收集只到19年11月份,之后会继续完善。同时,希望能有更多小伙伴上传新的数据集。Feel free to CONTRIBUTE.

最后,我想再次感谢以上数据集的开源贡献者。

提示!

本开源数据集最初是由许多人贡献的,只是太过分散,对寻找数据集是个十分费时费力的过程。很多数据集是研究者论文的训练/测试集,或是企业的开源数据集,因此 您只能将此数据集用于研究目的。

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

表面缺陷检测数据集汇总及其相关论文集收集 | Github开源相关推荐

  1. 表面缺陷检测数据集汇总及其相关项目推荐

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 最近,有许多朋友都在关注缺陷检测领域,今天来看看缺陷检测. 目前, 基于机器视觉的表面 缺陷装备已经在 ...

  2. 【表面缺陷检测】表面缺陷检测数据集汇总

    一.导读   在工业界,大批量的工业自动化生产过程中,用人工进行表面质量检测存在诸多弊端,例如漏检率较高.实时性较差.劳动强度大.效率低.受人工经验和主观因素的影响大.   随着计算机技术,人工智能和 ...

  3. 工业表面缺陷检测数据集汇总

    1.数据集名称:NEU-CLS                                         应用场景:钢材表面 链接:http://faculty.neu.edu.cn/songk ...

  4. Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(持续更新)

    Dataset:数据集集合(CV方向数据集)-常见的计算机视觉图像数据集大集合包括表面缺陷检测数据集(建议收藏,持续更新) 目录 CV常用数据集平台集合 Mendeley Data CAISA-Web ...

  5. Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)

    Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新) 目录 CV常用数据集平台集合 Mendeley Data ...

  6. 【表面缺陷检测】常用开源表面缺陷检测数据集 整理

    数据集是深度学习研究的基础,开源数据集为各种方法提供了比较的基准(benchmark). 不同于经典计算机视觉任务中的 ImageNet.PASCAL VOC2007/2012 和 COCO 等数据集 ...

  7. 【目标检测数据集汇总】YOLO txt格式各种数据集

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 [目标检测数据集汇总]目标检测YOLO txt格式数据集~各种数据集 前言 相关连接: 一.安全帽数据集(10755张,nc2) 二. ...

  8. 遥感目标检测数据集汇总

    遥感目标检测数据集汇总 查看全文 http://www.taodudu.cc/news/show-3152461.html 相关文章: Matplotlib.pyplot 常用方法(一) cesium ...

  9. SAR目标检测数据集汇总

    SAR目标检测数据集汇总 文章目录 SAR目标检测数据集汇总 1. MSTAR (1996) 2. OpenSARShip2.0 (2017) 3. SSDD / SSDD+ (2020) 4. AI ...

最新文章

  1. java的高级特性_java的高级特性_for
  2. python进程和线程_Python进程与线程知识
  3. Apollo分布式配置中心入门
  4. spring cloud 2.3.x 注册中心eureka 配置
  5. ASP.NET Core的配置(2):配置模型详解
  6. git 忽略文件 .gitignore 以及规则
  7. $HOME/$user/.权限导致用户无法登陆图形界面
  8. Ubuntu 添加、删除ppa源
  9. python中int什么意思_python3中int(整型)的使用教程
  10. CGAL Catmull-Clark Subdivide Surface
  11. SetStretchBltMode() 防止图片失真
  12. 当Python遇上HDF5--性能优化实战
  13. Spring学习:通过黎活明视频1
  14. mysql 中caption_ACCESS数据库中Field对象的caption属性读写
  15. XML/HTML/CSS/JS之间的区别和联系
  16. android 仿QQ列表可折叠+自定义Dialog结合的DEMO
  17. java 扁平化_java 扁平化输出json所有节点key/value
  18. 去除百度搜索列表中广告的方法-电脑端
  19. android 重力感应切换屏幕,Android 重力感应和屏幕旋转关系
  20. 一个大牛对IT人士的忠告

热门文章

  1. iOS开发之--TableViewCell重用机制避免重复显示问题
  2. 进程间通信(三)—信号量
  3. 静态方法static 的了解
  4. 可以连上网,能Ping通网关和DNS服务器,但是却不能访问网页
  5. 关于排错:专注思考,细心观察,步步为营
  6. JSP针织生产管理系统
  7. 基于Flink SQL构建流批一体实时数仓
  8. Java 刷题必须了解的 API
  9. 你管这破玩意儿叫负载均衡?
  10. 深入理解:RabbitMQ的前世今生