ILSVRC竞赛详细介绍(ImageNet Large Scale Visual Recognition Challenge)
ILSVRC(ImageNet Large Scale Visual Recognition Challenge)
是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平。
ImageNet
数据集是ILSVRC
竞赛使用的是数据集,由斯坦福大学李飞飞教授主导,包含了超过1400万张全尺寸的有标记图片。ILSVRC
比赛会每年从ImageNet
数据集中抽出部分样本,以2012年为例,比赛的训练集包含1281167张图片,验证集包含50000张图片,测试集为100000张图片。
ILSVRC
竞赛的项目主要包括以下几个问题:
(1)图像分类与目标定位(CLS-LOC)
图像分类的任务是要判断图片中物体在1000个分类中所属的类别,主要采用top-5
错误率的评估方式,即对于每张图给出5次猜测结果,只要5次中有一次命中真实类别就算正确分类,最后统计没有命中的错误率。
2012年之前,图像分类最好的成绩是26%的错误率,2012年AlexNet
的出现降低了10个百分点,错误率降到16%。2016年,公安部第三研究所选派的“搜神”(Trimps-Soushen
)代表队在这一项目中获得冠军,将成绩提高到仅有2.9%的错误率。
目标定位是在分类的基础上,从图片中标识出目标物体所在的位置,用方框框定,以错误率作为评判标准。目标定位的难度在于图像分类问题可以有5次尝试机会,而在目标定位问题上,每一次都需要框定的非常准确。
目标定位项目在2015年ResNet
从上一年的最好成绩25%的错误率提高到了9%。2016年,公安部第三研究所选派的“搜神”(Trimps-Soushen
)代表队的错误率仅为7%。
(2)目标检测(DET)
目标检测是在定位的基础上更进一步,在图片中同时检测并定位多个类别的物体。具体来说,是要在每一张测试图片中找到属于200个类别中的所有物体,如人、勺子、水杯等。评判方式是看模型在每一个单独类别中的识别准确率,在多数类别中都获得最高准确率的队伍获胜。平均检出率mean AP(mean Average Precision)
也是重要指标,一般来说,平均检出率最高的队伍也会在多数的独立类别中获胜,2016年这一成绩达到了66.2。
(3)视频目标检测(VID)
视频目标检测是要检测出视频每一帧中包含的多个类别的物体,与图片目标检测任务类似。要检测的目标物体有30个类别,是目标检测200个类别的子集。此项目的最大难度在于要求算法的检测效率非常高。评判方式是在独立类别识别最准确的队伍获胜。
2016年南京信息工程大学队伍在这一项目上获得了冠军,他们提供的两个模型分别在10个类别中胜出,并且达到了平均检出率超过80%的好成绩。
(4)场景分类(Scene)
场景分类是识别图片中的场景,比如森林、剧场、会议室、商店等。也可以说,场景分类要识别图像中的背景。这个项目由MIT Places
团队组织,使用Places2
数据集,包括400个场景的超过1000万张图片。评判标准与图像分类相同(top-5
),5次猜测中有一次命中即可,最后统计错误率。
2016年最佳成绩的错误率仅为9%。
场景分类问题中还有一个子问题是场景分割,是将图片划分成不同的区域,比如天空、道路、人、桌子等。该项目由MIT CSAIL
视觉组织,使用ADE20K
数据集,包含2万张图片,150个标注类别,如天空、玻璃、人、车、床等。这个项目会同时评估像素及准确率和分类IOU(Intersection of Union)
ILSVRC竞赛详细介绍(ImageNet Large Scale Visual Recognition Challenge)相关推荐
- ImageNet Large Scale Visual Recognition Competition (ILSVRC)-ImageNet数据集标签名称中英文对照
0 n01440764 tench 鱼 1 n01443537 goldfish 鱼 2 n01484850 great_white_shark 鱼 3 n01491361 tiger_shark 鱼 ...
- 【食品图像识别】Large Scale Visual Food Recognition
1 引言 视觉智能部与中科院计算所于2020-2021年度展开了<细粒度菜品图像识别和检索>科研课题合作,本文系双方联合在IEEE T-PAMI2023发布论文<Large Scal ...
- CVPR2022学习-人脸识别:An Efficient Training Approach for Very Large Scale Face Recognition
论文地址:https://arxiv.org/pdf/2105.10375.pdf 代码地址:GitHub - tiandunx/FFC: Official code for fast face cl ...
- 带你详细了解机器视觉竞赛—ILSVRC竞赛
ILSVRC(ImageNet Large Scale Visual Recognition Challenge)的缩写,是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水 ...
- Paper之BigGAN:《Large Scale Gan Training For High Fidelity Natural Image Synthesis》翻译与解读
Paper之BigGAN:<Large Scale Gan Training For High Fidelity Natural Image Synthesis>翻译与解读 目录 效果 1 ...
- 深度学习: ILSVRC竞赛(ImageNet竞赛)
参考:https://blog.csdn.net/jningwei/article/details/80026826 ILSVRC比赛 即我们所说的 ImageNet比赛 . Large Scale ...
- 【CS231n_2017】1-Introduction to CNN for Visual Recognition
本专栏根据斯坦福大学2017年公开课CS231n的视频教程整理学习资料,做学习笔记. 首先简单介绍CS231n,又称Convolutional Neural Networks for Visu ...
- 终于等到你,最强 IDE Visual Studio 2017 正式版发布(附详细介绍与下载地址)
Visual Studio 2017 正式版发布,该版本不仅添加了实时单元测试.实时架构依赖关系验证等新特性,还对许多实用功能进行了改进,如代码导航.IntelliSense.重构.代码修复和调试等等 ...
- html中scale布局,详细介绍css3的transform中scale缩放
css即层叠样式表.在网页制作时采用层叠样式表技术,可以有效地对页面的布局.字体.颜色.背景和其它效果实现更加精确的控制.今天小编要给大家分享一篇教程,那就是:详细介绍css3的transform中s ...
- 2021年美国大学生数学建模竞赛(题目详细介绍)
2021年美赛(详细介绍) 2021年美赛时间为:2月5日-8日 题目类型: MCM问题A(连续) MCM问题B(离散) MCM问题C(数据洞察) ICM问题D(运筹学/网络科学) ICM问题E(环境 ...
最新文章
- Redis常用五大数据类型
- linux vino vnc,CentOS 远程桌面(vnc,vino)
- U3D assetbundle加载
- 以array开头的php函数,PHP 常用数组函数详解
- 【李宏毅2020 ML/DL】P2 Regressio - Case Study
- Git之关于本地分支与远程分支
- Kali Linux 无线渗透测试入门指南 第四章 WLAN 加密缺陷
- AjaxControltoolkit学习笔记—ListSearch 使用详解
- java微信支付,企业微信号转账给个人
- 程序员修炼之道---从小工到专家 第一章
- 2.6一个小工具的使用snipaste
- 能切换双显卡的android,安卓模拟器如何把双显卡切换成高性能显卡
- 【Cocos2d-x游戏引擎开发笔记(25)】XML解析
- 使用Pixelmator Pro修饰照片
- 万诤:同心同向同行,才算得上不负遇见
- Shiro实现logout操作
- MDK 更换版本,原工程debug标签setting闪退
- 客观的看待人工智能,也许并没有那么可怕
- 串口通信是先发低位再发高位
- 【学堂在线】C++ 语言程序设计基础 - 课程习题