数据是人工智能时代重要的生产要素,高质量训练数据对深度学习模型的建立和优化有关键性的作用,建立大规模、高水准的标注数据集,是推动AI科研和技术前进的驱动力。

制造业是我国国民经济的主体,推动数字化转型,降本增质提速是当今制造业的发展方向。天池通过举办大数据竞赛,希望通过技术创新的方式来推动了产业的创新发展。AI模型的落地离不开高质量数据集的支撑,天池平台开放出一批高标准严要求下真实业务场景的数据,涵盖纺织、食品饮料、非金属制品等行业,小萌喵今天就带大家一起来看看天池上开放的工业数据集。

布匹瑕疵检测数据集

研究方向:工业质检/目标检测

2016年我国布匹产量超过700亿米且产量一直处于上升趋势。布料与人们日常生活接触密切,纺织行业在我国国民经济中所占的地位不言而喻。工厂生产时,对大量布匹的质检通常都是工人肉眼完成的,这种形式检测速度慢、劳动强度大,而且受到工人主观因素影响,将人工智能和计算机视觉技术应用于纺织行业,可以进一步助力纺织行业的自动化,降低对人工的依赖,提升布匹疵点检验的准确度,提升布样疵点质检的效果和效率。

天池开放布匹疵点数据集,包含瑕疵各异的布匹照片,每张照片含素色布的一个或多种瑕疵。

了解更多详情/下载使用数据集请戳:https://tianchi.aliyun.com/dataset/dataDetail?dataId=79336

图1:瑕疵图示(黄色框为瑕疵部分)

瓶装白酒疵品检测数据集

研究方向:工业质检/目标检测

与布匹生产流程类似,在瓶装酒的生产过程中,受到原材料质量(酒瓶)以及加工工艺(灌装)等因素的影响,产品中可能存在各类瑕疵影响产品质量。但跟布匹不同的是,酒瓶上的瑕疵面积较小不容易被发现,并且瑕疵种类多,通常一条产线一般需要有三到五个质检环节分别检测不同类型的瑕疵。目前瓶装酒厂家只能选择投入大量人力用于产品质检。如果可以引进高效、可靠的自动化质检可以降低大量人工成本同时提高质检效,是非常有意义的工作。

天池提供白酒疵品数据集,数据集中白酒瓶身存在的各种瑕疵,包括:瓶盖瑕疵、标贴瑕疵、喷码瑕疵。

如需查看数据集更多详细内容请戳:https://tianchi.aliyun.com/dataset/dataDetail?dataId=110147

图2:瓶盖变形、瓶盖坏边示意图

瓷砖表面暇疵检测数据集

研究方向:工业质检/目标检测

以抛釉砖为例的瓷砖生产环节一般经过原材料混合研磨、脱水、压胚、喷墨印花、淋釉、烧制、抛光,最后进行质量检测和包装。得益于产业自动化的发展,目前生产环节已基本实现无人化。而质量检测环节仍大量依赖人工完成。一般来说,一条产线需要配2~6名质检工,这样的质检方式效率低下、质检质量层次不齐、成本又居高不下。瓷砖的表面是用户衡量瓷砖质量的最直观标准,是瓷砖行业生产和质量管理的重要环节,也是困扰行业多年的技术瓶颈,同时长时间肉眼在强光下观察瓷砖表面寻找瑕疵也对工人的视力也会产生影响。如果能在技术上解决上述问题,无疑是有很大的经济价值和社会意义。

为了推动AI技术应用到传统的行业,天池推出瓷砖数据集,该数据集内含的数据覆盖到了瓷砖产线所有常见瑕疵,包括粉团、角裂、滴釉、断墨、滴墨、B孔、落脏、边裂、缺角、 砖渣、白边等。还有一些缺陷只能在特定视角才可以观察,包括低角度光照黑白图、高角度光照黑白图、彩色图,保证覆盖到生产环境中产生的所有瑕疵能被识别,是国内首个聚焦在瓷砖瑕疵质检的数据集。数据集下载请戳:https://tianchi.aliyun.com/dataset/dataDetail?dataId=110088

图3:瓷砖瑕疵质检过程

以上所有数据都是在专业人员指导下,通过产线上架设专业拍摄设备、实地采集生产过程真实的数据,保证了数据来源的可靠性和科学性。

在数据标注过程中,达摩院的算法专家们对数据质量进行了全程把关,保证了天池数据集的质量。

关于天池数据集

天池数据集是阿里集团的科研数据集开放平台,数据集覆盖了新零售、文娱、医疗健康、交通、安全、能源、自然科学等十多个行业,涵盖了数据挖掘、机器学习、自然语言处理、计算机视觉、决策优化等前沿的技术领域。小伙伴们可以点击下方阅读原文进入官网进行查看,还有更多宝藏数据等你发现。

天池数据集|精品数据集推荐(工业篇)相关推荐

  1. 使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务

    使用文本卷积神经网络,并使用MovieLens数据集完成电影推荐的任务 import pandas as pd from sklearn.model_selection import train_te ...

  2. react数据集中式管理第四篇--@rematch/core

    今天,我们来介绍@rematch/core 其他几篇: react数据集中式管理第一篇–Redux初认识 react数据集中式管理第二篇–@reduxjs/toolkit react数据集中式管理第三 ...

  3. 国内首本数据竞赛图书《阿里云天池大赛赛题解析——机器学习篇》今日开启预售!

    天池平台已经举办了超过 200 场来自真实业务场景的竞赛,每场赛事沉淀的课题和数据集,将在天池保留和开放.天池平台已成为在校学生踏入职场前的虚拟实践基地,也成为聚集40万数据人才,孵化2000余家数据 ...

  4. 阿里云天池大赛赛题解析——机器学习篇 | 留言赠书

    国内第一本针对竞赛实操的图书:<阿里云天池大赛赛题解析--机器学习篇>,正式发售. 阿里云天池7年200多场数据大赛精华提取录 为什么写这本书 七年前,天池团队的几名创始成员带着" ...

  5. 推荐几篇开源论文,包含人脸、目标检测跟踪、分割、去噪、超分辨率等

    本文推荐本周值得关注的已开源论文,包含图像超分辨率.利用疼痛类型之间的域迁移来识别马的疼痛表情的研究.人脸检测识别.图像去噪.分割.手写文本行分割.妆容迁移与卸妆.伪装物体检测等共计 12 篇. 其中 ...

  6. YOLO v5 实现目标检测(参考数据集自制数据集)

    YOLO v5 实现目标检测(参考数据集&自制数据集) Author: Labyrinthine Leo   Init_time: 2020.10.26 GitHub: https://git ...

  7. SIGIR‘22 推荐系统论文之序列推荐(长文)篇

    2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...

  8. SIGIR‘22 推荐系统论文之序列推荐(短文)篇

    2022推荐系统论文梳理系列 推荐系统相关顶会整理 IJCAI'22 推荐系统论文梳理 ICML/ICLR'22 推荐系统论文梳理 WWW'22 推荐系统论文之序列推荐篇 WWW'22 推荐系统论文之 ...

  9. yolov5s 预训练模型_YOLO v5 实现目标检测(参考数据集自制数据集)

    YOLO v5 实现目标检测(参考数据集&自制数据集) Author: Labyrinthine Leo   Init_time: 2020.10.26 GitHub: https://git ...

最新文章

  1. 基于Golang的简单web服务程序开发——CloudGo
  2. LSTM为何如此有效
  3. python代码教程-(Python基础教程之三)Python代码中添加注释
  4. fabric-smaple部署
  5. linux 中 set,env,export,declare显示shell变量的区别
  6. Linux压缩那些事
  7. C#中使用指针转换数据类型[C#/unsafe]
  8. TCP协议之如何保证传输的可靠性
  9. ALTER INDEX Rebuild Reorganize 索引 重建 重组 碎片率
  10. 宽依赖和窄依赖_Kardemir开始生产窄钢板,进入板材市场
  11. 计算机导论在线阅读,计算思维与计算机导论.pdf
  12. 使用UniWebView时的内存管理
  13. 半正定矩阵和正定矩阵的一些理解和补充
  14. 51单片机8位数码管显示学号变化
  15. 全面解析机房综合布线结构、设计方案及未来发展趋势
  16. 如何查看浏览器的DNS 缓存信息
  17. 空气阻力对乒乓球运动轨迹的影响
  18. HTML5plus 移动 App开发入门
  19. 基于Unity3D经典消消乐游戏源码,代码详细注释,c#版方块消消乐源代码
  20. STC12C5A60S2_LCD1602驱动

热门文章

  1. rust最美建筑_[资料整理]动物之森的美丽物语 (多图;补完)
  2. python 列表和元组
  3. 微信小程序云函数返回的result为空,运行时提示undefined
  4. Bmob的使用iOS版
  5. 在C中嵌套汇编代码难吗?
  6. Photoshopcs6 自学笔记三 画笔工具
  7. 做站群前期的准备工作
  8. 033悟空打死沙悟净(键盘映射 )
  9. 爱尚实训html入门基础篇,爱尚实训网页设计与网页制作的区别
  10. JS判断客户端是手机还是PC