ILSVRC(ImageNet Large Scale Visual Recognition Challenge)的缩写,是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平。

ImageNet数据集是ILSVRC竞赛使用的是数据集,由斯坦福大学李飞飞教授主导,包含了超过1400万张全尺寸的有标记图片。ILSVRC比赛会每年从ImageNet数据集中抽出部分样本,以2012年为例,比赛的训练集包含1281167张图片,验证集包含50000张图片,测试集为100000张图片。


ILSVRC竞赛的项目主要包括以下几个问题:

01 图像分类与目标定位(CLS-LOC)

图像分类的任务是要判断图片中物体在1000个分类中所属的类别,主要采用top-5错误率的评估方式,即对于每张图给出5次猜测结果,只要5次中有一次命中真实类别就算正确分类,最后统计没有命中的错误率。

2012年之前,图像分类最好的成绩是26%的错误率,2012年AlexNet的出现降低了10个百分点,错误率降到16%。2016年,公安部第三研究所选派的“搜神”(Trimps-Soushen)代表队在这一项目中获得冠军,将成绩提高到仅有2.9%的错误率。

目标定位是在分类的基础上,从图片中标识出目标物体所在的位置,用方框框定,以错误率作为评判标准。目标定位的难度在于图像分类问题可以有5次尝试机会,而在目标定位问题上,每一次都需要框定的非常准确。

目标定位项目在2015年ResNet从上一年的最好成绩25%的错误率提高到了9%。2016年,公安部第三研究所选派的“搜神”(Trimps-Soushen)代表队的错误率仅为7%。

02 目标检测(DET)

目标检测是在定位的基础上更进一步,在图片中同时检测并定位多个类别的物体。具体来说,是要在每一张测试图片中找到属于200个类别中的所有物体,如人、勺子、水杯等。评判方式是看模型在每一个单独类别中的识别准确率,在多数类别中都获得最高准确率的队伍获胜。平均检出率mean AP(mean Average Precision)也是重要指标,一般来说,平均检出率最高的队伍也会多数的独立类别中获胜,2016年这一成绩达到了66.2。

03 视频目标检测(VID)

视频目标检测是要检测出视频每一帧中包含的多个类别的物体,与图片目标检测任务类似。要检测的目标物体有30个类别,是目标检测200个类别的子集。此项目的最大难度在于要求算法的检测效率非常高。评判方式是在独立类别识别最准确的队伍获胜。

2016年南京信息工程大学队伍在这一项目上获得了冠军,他们提供的两个模型分别在10个类别中胜出,并且达到了平均检出率超过80%的好成绩。

04 场景分类(Scene)

场景分类是识别图片中的场景,比如森林、剧场、会议室、商店等。也可以说,场景分类要识别图像中的背景。这个项目由MIT Places团队组织,使用Places2数据集,包括400个场景的超过1000万张图片。评判标准与图像分类相同(top-5),5次猜测中有一次命中即可,最后统计错误率。

2016年最佳成绩的错误率仅为9%。

场景分类问题中还有一个子问题是场景分割,是将图片划分成不同的区域,比如天空、道路、人、桌子等。该项目由MIT CSAIL视觉组织,使用ADE20K数据集,包含2万张图片,150个标注类别,如天空、玻璃、人、车、床等。这个项目会同时评估像素及准确率和分类IOU(Interp of Union)。

带你详细了解机器视觉竞赛—ILSVRC竞赛相关推荐

  1. 深度学习: ILSVRC竞赛(ImageNet竞赛)

    参考:https://blog.csdn.net/jningwei/article/details/80026826 ILSVRC比赛 即我们所说的 ImageNet比赛 . Large Scale ...

  2. 计算机基础知识 竞赛题库,详细计算机基础知识资料竞赛题目答案.doc

    详细计算机基础知识资料竞赛题目答案.doc w1.电子计算机是只用来进行科学计算的电子设备.( )(还可以用于各行各业)2. 电子计算机区别于其他计算工具的本质特点是能够存储程序和数据.( )3. 微 ...

  3. stm32f103利用HC06进行蓝牙通信,在7针的OLED屏幕上显示,带数据更新功能(带超详细讲解)

    stm32f103利用HC06进行蓝牙通信,在7针的OLED屏幕上显示,带数据更新功能(带超详细讲解) 首先看看效果吧 手机端发送一个数据在OLED屏幕上显示 其实蓝牙通信就是个蓝牙转串口的过程,手机 ...

  4. 《新媒体管理师》初中高级报考条件是什么?带你详细了解,看看自己符合报名高级新媒体管理师吗?

    <新媒体管理师>初中高级报考条件是什么?带你详细了解,看看自己符合报名高级新媒体管理师吗? 首先,我们来了解一下什么是新媒体管理师? 新媒体管理师是兼具了新媒体的运营管理.策划.文案编辑. ...

  5. 一文带你详细了解浏览器安全

    一文带你详细了解浏览器安全 1.同源策略 2.浏览器沙箱 1.同源策略 浏览器的同源策略,限制了来自不同源的"document"或脚本,对当前"document" ...

  6. 一文带你详细了解HarmonyOS折叠屏设计规范

    原文:一文带你详细了解HarmonyOS折叠屏设计规范!,点击链接查看更多技术内容. 随着新一代折叠屏手机HUAWEI Mate Xs 2发布,HarmonyOS折叠屏设计规范(后文简称:设计规范)也 ...

  7. 还在为数学建模的事发愁?带你一起来看看数模竞赛中必备的经典算法

    前言 数学建模比赛是本科生和研究生阶段最重要的比赛之一,包括全国大学生数学建模竞赛(俗称"国赛")和美国大学生数学建模竞赛(俗称"美赛").在这些比赛中取得好成 ...

  8. 超详细注释NLP Question answering竞赛(印度语和泰米尔语)

    赛题印度语和泰米尔语问答 链接:https://www.kaggle.com/c/chaii-hindi-and-tamil-question-answering 初学者友好,尽可能都写上了注释 1. ...

  9. 算法竞赛入门竞赛 入门经典 第六章 个人记录

    UVa 210 并行程序模拟(放弃 || 待补) 没看懂题意,但是有百度了一下duque 算是对duque有了一个大致的认识和了解 当然也有尝试. 本来想着去hdu找一些duque的题 结果 好像可以 ...

最新文章

  1. JS BOM 浏览器对象模型
  2. java jsonobject转List_java – 将JSONObject转换为List或JSONArray的简单代码?
  3. C++设计模式-策略模式(Strategy)基本轮廓
  4. c语言面试会问10个数排序吗,c语言面试最必考的十道试题,求职必看!!!
  5. Android文件夹占用空间分析,关于Android中图片大小、内存占用与drawable文件夹关系的研究与分析...
  6. Java 就业培训教程 再读笔记
  7. PHP简单在线二维码生成工具源码
  8. Java软件开发技术交流群
  9. Java入门基础第3天《使用记事本编写运行Java程序》
  10. 小tips:页面滚动到关闭时的位置与不滚动
  11. 3. 'PipelinedRDD' object has no attribute '_jdf'
  12. uniapp——ios端和android端微信分享,通过打开appStore和应用宝商店下载
  13. 2020牛客暑期多校训练营(第九场)——Groundhog and 2-Power Representation
  14. 智能学习 | MATLAB实现Bee-CNN蜜蜂算法优化卷积神经网络图像分类预测
  15. 基于C语言的JPEG编码代码详解
  16. java计算机毕业设计大学生校园兼职系统源码+数据库+系统+lw文档+部署
  17. 转载新闻 你应该知道的一些 Linux 技巧
  18. 毛永胜计算机教师,中等职业学校网络计算机技术与应用
  19. java重启tomcat
  20. PMP证书到期后,有没有必要续证了

热门文章

  1. 斑能不能彻底去掉_海鲜不能和什么一起吃
  2. 蜂鸟笔记本swift接口_蜂鸟Swift 5可清新文艺、又可尊贵典雅
  3. list 查找_五千字长文带你学习 二分查找算法
  4. mc服务器tps优化,LaggRemover——降低延迟/优化TPS/内存
  5. 小程序 const moment = require('moment')_小程序依赖分析实践
  6. css里面的位置属性,CSS定位属性Position详解
  7. 执行transact-sql语句或批处理时发生异常_DAY5-step6 Python异常处理:try, raise,except, finally...
  8. Day25 与类相关的魔术方法
  9. js地址栏获取参数的方法,解决中文乱码问题,能支持中文参数
  10. Composer更新慢的终极解决方案-转