2019 年 12 月,北京智源人工智能研究院联合博世和数据评测平台biendata,共同发布了“INSPEC 工业检测大数据 (Industrial Specification Inspection Data)”,该数据集包含博世某系列产品近年来的质量检测相关数据,具体为每个产品质量检测环节各个步骤记录的相关参数,每个步骤都标注检测判定结果,整体数据量在 3w 条左右。biendata同步开放了“智源 — INSPEC 工业大数据质量预测赛”(2019 年 12 月 — 次年 2 月),总奖金为 10 万元。比赛希望挑战选手使用机器学习算法,对正在测试的产品进行质量预测,提前判断次品,节省整体检测时间。比赛和数据可于下方链接查看,或点击“阅读原文”。

比赛地址:

https://www.biendata.com/competition/bosch/

赛事背景

传统制造业工厂的产品检测流程较为复杂,如检测结果发现不良品率需要返工,返工后仍然对是否能通过测试存在不确定性,通过机器学习方法检测历史数据有助于预测不良品,优化工序和提升效率。该问题在传统的制造业工厂存在一定的普适性,类似模型可以帮助更多企业优化工业生产流程。

在本次比赛涉及的产品系列中,博世的工厂会对每种产品进行若干工序(产品不同,工序数量和类目也不尽相同)的检测,每道工序中可能包括若干步骤,每道检测步骤会反馈相关结果(1 为合格、2 为不合格)和参数(数值或字符串)。若产品检测在各个检测步骤皆为合格,并判定该产品实例为合格;若产品检测在某一步骤反馈不合格,检测流程将于该步骤所在工序停止,并判定该产品实例为不合格。比赛希望使用机器学习算法,对正在测试的产品进行质量预测,对次品提前进行判断,节省整体检测时间。

比赛任务

本次比赛的任务为产品质量预测,所使用数据为“INSPEC 工业检测大数据”,其中包含博世某产品家族的工厂生产环节的检测参数,要求选手根据训练集中产品的相关数据(如子家族名称、检测流程、检测结果)建立和优化模型,并参照目标产品中已完工序的检测结果,预测最终产品检测的结果为合格或不合格。

比赛分为初赛与复赛两阶段,初赛于2019年12月31日开启,biendata 平台同步发布训练集、开发集、测试集,并开放初赛提交。2020年2月7日,初赛报名和组队时间截止。由于每日提交存在次数限制,请感兴趣的选手尽量选择提前参赛,以获得更多验证提交次数和优化模型的机会。

比赛数据

(1)概览

本数据中为 v 系列产品,其中包括 11 个子家族,如 Vp3AaLm、Vp9AaLm、VpdAaLm,每个子家族下包括若干个产品类型,每个产品类型单独分布在 1 个 Excel 表格中,Excel命名为子家族名_产品类型名,例:Vp3AaLm_jQU9Uzpzp0u。

(2)产品类型

在每个产品类型的 Excel 表格中,共分为 3 个 Tab,即 Process_Table(产品实例表)、Phase_Table(检测步骤表)、Parameters_Table(步骤参数表)。

  1. 在 Process_Table(产品实例表)中,ID_F_PROCESS 字段表示每个产品类型中各个产品实例的 ID,PROCESS_RESULT_STATE 字段表示该产品实例的最终检测结果,1 为合格、2 为不合格,TYPE_NUMBER 字段表示产品类型名,PRODUCTGROUP_NAME 字段表示产品类型所在子家族。

  2. 在 Phase_Table(检测步骤表)中,ID_F_PROCESS字段表示每个产品实例的 ID,ID_F_PHASE 字段表示每个检测步骤的 ID,PHASE_RESULT_STATE 字段表示该检测步骤的结果,PHASE_NAME 字段表示检测步骤的名称,ID_F_PHASE_S 字段表示每个检测步骤的序列 ID。(注:名称相同且相邻的多个检测步骤被视为一个工序,其检测存在一定相关性。)

  3. 在 Parameters_Table(步骤参数表)中,ID_F_PHASE 字段表示检测步骤 ID, RESULT_STRING 字段表示字符串类型检测结果(表示产品等级),RESULT_VALUE字段表示数值型检测结果,PARAMETER_RESULT_STATE 字段表示该参数检测结果,LOWER_LIMIT 和 UPPER_LIMIT 字段表示该参数可供参考的上下限,AXIS 字段表示产品的轴、SIDE 字段表示产品的面,ID_F_PHASE_S 字段表示检测步骤的序列 ID,ID_F_PARAMETER_S 字段表示检测参数的序列号。

▋ INSPEC 工业检测大数据

智源联合博世发布了 INSPEC 工业检测大数据,该数据集包括某系列产品近年来的质量检测相关数据,其中主要为每个产品质量检测环节各个步骤记录的相关参数,每个步骤都标注检测判定结果,整体数据量在 3w 条左右。相比于类似数据集,本比赛数据具有显著优势和特点。

首先,该数据集来自世界顶尖制造企业真实的工厂生产数据,已经过脱敏处理,尽量还原现实环境中产品检测的工序和流程。其次,INSPEC工业检测大数据详细记录了检测环节生成的具体产品参数,涵盖产品子家族 ID、实例 ID、检测环节 ID、检测环节结果、检测规格和数值等。丰富的数据维度一方面增强了比赛的难度,另一方面有助于选手打造更加鲁棒的模型。

参赛方式

点击阅读原文链接或扫描下图中的二维码直达赛事页面,注册网站-下载数据,即可参赛。

▶友情提示,因涉及到数据下载,强烈建议大家登录 PC 页面报名参加。

智源人工智能系列竞赛

2019 年 9 月,智源人工智能算法大赛正式启动。本次比赛由北京智源人工智能研究院主办,爱数智慧、清华大学、北京大学、中科院计算所、旷视、知乎等协办,总奖金超过 100 万元,旨在以全球领先的科研数据集与算法竞赛为平台,选拔培育人工智能创新人才。

北京智源人工智能研究院院长、北京大学教授黄铁军介绍:智源的中心任务是在北京建成全球最优的人工智能创新生态,核心是选拔培育人工智能顶尖人才和发展潜力大的青年学术英才。研究院副院长刘江也表示:“我们希望不拘一格来支持人工智能真正的标志性突破,即使是本科生,如果真的是好苗子,我们也一定支持。”而人工智能大赛就是发现有潜力的年轻学者的重要途径。

本次智源人工智能算法大赛有两个重要的目的,一是通过发布数据集和数据竞赛的方式,推动基础研究的进展。特别是可以让计算机领域的学者参与到其它学科的基础科学研究中。二是可以通过比赛筛选、锻炼相关领域的人才。

目前正在角逐的比赛:

  • 智源-超高清晰电镜图像分割挑战赛—神经元识别大赛

    https://www.biendata.com/competition/urisc/

  • 智源-高能对撞粒子分类挑战赛

    https://www.biendata.com/competition/jet/

  • 智源-MagicSpeechNet 家庭场景中文语音数据集挑战赛

    https://www.biendata.com/competition/magicdata/

- 往期文章 -

“智源 — INSPEC 工业大数据质量预测赛” 上线,为硬核工业制造炼就 AI 之心...相关推荐

  1. 2017工业大数据 风机叶片预测练习

    写在开头:老师给了数据集,主要练习对时间序列的操作,本文内容适合机器学习初学者入门借鉴,有一套较为完整的从数据预处理至模型评价的流程. 本文总结了一些风机叶片预测问题中需要解决的问题与部分解决方案(采 ...

  2. 【大数据】中国工程院院士何友:工业大数据及其应用

    来源:德先生D-Technologies 工业大数据面临的挑战. 第一是数据搜集,要对来自网络包括物联网和机构信息系统的数据附上时空标签,去伪存真,尽可能收集异源甚至是异构的数据,还可与历史数据对照, ...

  3. 【工业大数据】大数据驱动的智能车间运行分析与决策方法体系

    随着信息化和自动化技术的飞速发展,特别是数控机床.传感器.数据采集装置和其他具备感知能力的智能设备在离散车间底层的大量使用,车间生产从自动化.数字化向智能化发展. 智能车间的制造数据呈现出典型的大数据 ...

  4. 中国工业大数据行业发展趋势分析与投资战略规划建议报告2022-2028年版

    中国工业大数据行业发展趋势分析与投资战略规划建议报告2022-2028年版 mmmmmm鸿**mmm晟&mmmmm信**mmmmm合&mmmmm研**mmmmmmm究&mmmm ...

  5. 工业大数据漫谈3:什么是工业大数据?

    前面两部分我们大概了解了一下大数据的由来和特点,这一部分我们来看看什么是工业大数据,它和传统我们理解的大数据有什么不同? 在了解什么是工业大数据的时候,我觉得我们有必要先了解一下什么是工业以及工业都包 ...

  6. 广东省工信厅副厅长王月琴:创新工业大数据应用,促进制造业数字化转型

    近年来,广东深入贯彻落实国家大数据发展战略,大力发展5G网络.工业互联网.大数据.人工智能等新一代信息技术,紧紧围绕制造业数字化转型这个核心,以工业大数据创新应用为抓手,推动新一代信息技术与制造业深度 ...

  7. 130家!2020年度智能制造、工业软件、工业大数据企业排行榜!

    2020年度智能制造企业TOP50 在新一轮科技革命和产业变革中,智能制造已成为世界各国抢占发展机遇的制高点和主攻方向. 2020中国智能制造系统解决方案大会暨联盟会员代表大会上,工信部辛国斌副部长强 ...

  8. 【“工业大数据预测”系列】——第2篇:异常数据处理

    文章目录 前言 1 数据来源 2 数据预处理 2.1 无效数据处理 2.2 异常数据处理 3 数据预处理完整代码 前言   Hi,久等了,这里是工业大数据预测系列的第二篇.   前面我们提到,工业大数 ...

  9. 【工业大数据】工业大数据:构建制造型企业新型能力

    2015年5月8日,国务院公布<中国制造2025>,这是中国版的"工业4.0"规划.该规划提到"加快推动新一代信息技术与制造技术融合发展,把智能制造作为两化深 ...

最新文章

  1. excrutiating
  2. 20170102-文件处理
  3. React开发(144):Git Commit 规范
  4. (64)FPGA模块例化(generate)
  5. android自定义进度条百分比跟着走,Android studio圆形进度条 百分数跟随变化
  6. 命名之法 —— 书名及角色、武功(金庸)
  7. SQL重复记录处理(查找,过滤,删除)
  8. 熬夜总结学了一半的JDBC
  9. nacos实现配置中心,对比config
  10. html网站 放新闻 文件夹名字 是什么,服务器上传网页文件时应注意哪几点?
  11. python列表的嵌套_Python 展开多层嵌套的列表
  12. 以太网速率怎么手动设置_交换机如何配置速率和双工模式
  13. SDUT 数据库系统概论 关系查询处理和查询优化
  14. Windows命令窗口输入命令报错不是内部或外部命令,也不是可运行的程序 或批处理文件
  15. 怎样查看自己的wifi密码?
  16. 如何批量查询快递的签收状态?
  17. 天猫双12爬虫(福利:266万条商品数据免费下载)
  18. 由KKT互补松弛条件,支持向量的系数不一定为0,非支持向量的系数一定为0
  19. Apache DolphinScheduler 社区呼唤志愿者
  20. Android学习笔记之AndroidManifest.xml文件解析(学习别人的..非原创)

热门文章

  1. python函数拟合不规则曲线_python中的多变量(多项式)最佳拟合曲线?
  2. 基于matlab fdma传输系统设计,基于MATLAB的LTE系统仿真研究
  3. 计算机组成原理名词解释常用,2018考研408计算机组成原理名词解释(3)
  4. 在一个3*4数组中查找最大最小值
  5. java doublebuffer_Java DoubleBuffer clear()用法及代码示例
  6. mysql和oracle冲突吗_三分钟带你分清MySQL 和Oracle之间的误区
  7. undertale人物_【undertale】传说之下精美人物图包 (Frisk篇)
  8. 阿里云E-HPC联合安世亚太、联科集团共建云超算生态
  9. Druid 大数据分析之快速应用(单机模式)
  10. Java基础巩固之线程学习