转载自:https://blog.csdn.net/qq_43205738/article/details/86543766

简介

这是ILSVRC2012开发工具包的文档。
如有问题、评论或bug报告,请联系ilsvrc2012@image-net.org。

数据集

本次比赛的图像数据有三种类型:来自ImageNet的训练数据(TRAINING)、特定于本次比赛的验证数据(VALIDATION)和特定于本次比赛的测试数据(TEST)。在三个数据源中没有重叠:训练、验证和测试。这三组数据都包含1000类对象的图像。这些类别一一对应于WordNet中1000个synsets (同义词名词集)。如果图像包含X,则该图像属于该类别X,其中X是一个synset名词。有关集合和标记策略的详细信息,请参见[1]。

所选的1000个synsets类别之间没有重叠,对于任何sysnets i和j, i都不是WordNet(WordNet是一个大型英语语义网,里面将名词、动词、形容词和副词整理成了同义词集,并标注了同义词集之间的关系,而ImageNet中的图片是分类到WordNet的同义词集上的)中j的父类或子类。我们称这些synsets为“低等级的synsets”。

这1000个synsets是更大的ImageNet的一部分,我们可以认为ImageNet包含了1000个低等级的synsets和它们所有的父类。它们的父类有860个,我们称之为“高等级的synsets”。它们之间的关系可以理解为这样的层次结构,所有的低等级synsets都是“叶节点”,而高等级synsets是“枝节点”。即低等级类(1000类)的划分比较细,一个高等级类(860类)可能能划分成多个低等级类。

需要注意的是,低等级synsets在ImageNet中可能有子类,但是对于ILSVRC 2012,我们不考虑它们的子类别。即ILSVRC 2012可以看作是完整ImageNet的“修剪”版本。

还要注意的是,在本次比赛中,所有的ground truth标签都是低等级synsets,参赛作品必须预测出与1000个低水平synsets中的一个相对应的标签。不考虑预测高等级synsets。因为没有为高等级synsets提供额外的训练图像。

1.数据结构

所有关于synsets的信息都在data/meta.mat中的“synsets”数组中。可以在Matlab中访问它,输入:

load data/meta.mat;
synsets

你会看到

synsets = 1x1 struct array with fields:ILSVRC2012_IDWNIDwordsglossnum_childrenchildrenwordnet_heightnum_train_images

这个struct数组每个字段的意义如下:

'ILSVRC2012_ID’是分配给每个synset的整数ID。所有的低等级synsets都被分配了1到1000之间的ID。所有高等级synsets的ID都大于1000。在“synsets”数组中,按照ILSVRC2012_ID对synsets进行排序,即synsets(i)。i.预测结果提交使用ILSVRC2012_ID作为synset标签。

'WNID’是一个synset的WordNet ID。它是ImageNet或WordNet中synset的唯一标识。训练图像的tar文件使用WNID命名。此外,它还用于命名单个训练图像。

'num_children’是该synset的子类数量。对于所有低等级synsets,它都是零;对于高等级synsets,它是非零的。

'children’是该synset的子类的ILSVRC2012_IDs组成的向量。

'wordnet_height’是指在完整ImageNet/WordNet层次结构中的到其子节点(子类)的最长路径的长度(完整ImageNet层次结构中的叶子节点的wordnet_height为0)。

层次结构根的ILSVRC2012_ID为1001,即synset“实体”。

2.训练图像

每个synset都有一个tar文件,由其WNID命名。图像文件命名为x_y.JPEG,其中x是synset的WNID, y是一个整数(不是固定的长度,也不一定是连续的)。所有图像都是JPEG格式。

总共有1281167张图片用于训练。每个synset的图像数量从732到1300不等。

3.验证图像

总共有50,000张验证图像。它们被命名为:

  ILSVRC2012_val_00000001.JPEGILSVRC2012_val_00000002.JPEG...ILSVRC2012_val_00049999.JPEGILSVRC2012_val_00050000.JPEG

每个synset有50个验证图像。

验证图像的groud_truth在:
data/ILSVRC2012_validation_ground_truth.txt,
其中每行包含一个图像的ILSVRC2012_ID,按图像文件名的字母顺序升序排列。

4.测试图像

总共有10万张测试图片,之后将单独发布。测试图像的名称为

  ILSVRC2012_test_00000001.JPEGILSVRC2012_test_00000002.JPEG...ILSVRC2012_test_00099999.JPEGILSVRC2012_test_00100000.JPEG

每个synset有100个测试图像。

比赛期间将不公布测试图像的groud_truth

5.边框注释(Bounding Boxes)

验证和测试中的所有图像以及训练集中至少100个图像具有PASCAL VOC格式的边框注释。可以使用PASCAL开发工具包解析它。每个带有边框注释的图像都有一个XML文件。如果图像文件名是X。然后将边界框文件命名为X.xml。

有关边框注释(Bounding Boxes)的更多信息,请访问:
http://www.image-net.org/download-bboxes

如果一个图像中有多个目标,则每个目标都一定有一个边界框。

对于分类任务和目标检测任务,您都可以在竞赛中自由使用边框。

提交和评估

1.提交格式:

100,000张测试图像(从ILSVRC2012_test_00000001到ILSVRC2012_test_0100000.JPEG JPEG。)的格式都应该相同。

对于task 1(分类任务),测试数据的结果提交将由一个文本文件组成,每个图像有一行,按照图像文件名的字母顺序排列,即从ILSVRC2012_test_00000001到ILSVRC2012_test_0100000.JPEG JPEG。每行包含预测的标签,即预测类别的ILSVRC2012_IDs(1到1000之间的整数),按照置信度降序排序。每行标签的数量可以变化,但不能超过此数比5。

对于task 2(目标检测任务),提交结果类似于task 1,但是在每一行中,每个预测的标签后面都跟着按置信度降序排序的该对象的检测位置。它看起来如下:
<label(1)> <xmin(1)> <ymin(1)> <xmax(1)> <ymax(1)> <label(2)> <xmin(2)> <ymin(2)> <xmax(2)> <ymax(2)> …
每行的标签数量可以变化,但不超过5个(忽略额外的标签)。

验证集的预测样例文件是:

    ./evaluation/demo.val.pred.txt           for Task 1./evaluation/demo.val.pred.det.txt        for Task 2

2.评估程序

用于评估Task 1的提交结果的Matlab程序如下:

./evaluation/eval_flat.m  

对于Task2:

./evaluation/eval_localization_flat.m

要查看使用这些程序评估验证结果的演示示例,请在“evaluation”文件夹中启动Matlab并输入;

demo_eval;

你会看到如下输出:

pred_file = demo.val.pred.txtground_truth_file =../data/ILSVRC2012_validation_ground_truth.txtTask 1: # guesses  vs flat error1.0000    0.99902.0000    0.99803.0000    0.99724.0000    0.99625.0000    0.9950pred_localization_file =demo.val.pred.det.txtground_truth_file =../data/ILSVRC2012_validation_ground_truth.txtPlease enter the path to the Validation bounding box annotations directory: ~/AnnoVal/vallocalization_ground_truth_dir =~/AnnoVal/valTask 2: # guesses  vs flat error1.0000    1.00002.0000    0.99993.0000    0.99984.0000    0.99975.0000    0.9996

ILSVRC2012数据集介绍相关推荐

  1. ILSVRC2012数据集(分类部分)简要介绍和初步处理

    ILSVRC2012数据集(分类部分)简要介绍和初步处理 简介 即大名鼎鼎ImageNet2012竞赛的数据集,在图像分类数据集中属于最常用的跑分数据集和预训练数据集. 主要内容可以参考ILSVRC2 ...

  2. K-近邻算法之案例:鸢尾花种类预测--数据集介绍

    K-近邻算法之案例:鸢尾花种类预测--数据集介绍 本实验介绍了使用Python进行机器学习的一些基本概念. 在本案例中,将使用K-Nearest Neighbor(KNN)算法对鸢尾花的种类进行分类, ...

  3. 深度学习常用数据集介绍

    数据集大全 数据集大全 介绍 目前接触到的数据集 1. [MNIST](http://yann.lecun.com/exdb/mnist/) 2. [CIFAR-10 / CIFAR-100](htt ...

  4. 【知识星球】数据集板块重磅发布,海量数据集介绍与下载

    有三AI知识星球的"数据集板块"正式上线,提供数据集介绍,论文下载,数据集下载3大功能,那些因为网速问题,因为需要签license的蛋疼问题,从此不再成为问题! 有三AI知识星球- ...

  5. OHSUMED数据集介绍

    1. OHSUMED数据集介绍 本实验中采用OHSUMED测试数据集合(其也被用于第9 届国际文本检索竞赛TREC9 的文档过滤子竞赛).OHSUMED 数据集合由William Hersh和他的同事 ...

  6. GCN(一)数据集介绍

    1.数据集介绍 1.1 数据集概述 Cora数据集由机器学习论文组成,是近年来图深度学习很喜欢使用的数据集.在数据集中,论文分为以下七类之一: 基于案例 遗传算法 神经网络 概率方法 强化学习 规则学 ...

  7. camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)

    深度学习图像数据集介绍(MSCOCO) MSCOCO数据集是微软开发维护的大型图像数据集,次数聚集的任务包括识别(recognition),分割(segementation),及检测(detectio ...

  8. Imdb影评的数据集介绍与下载

    1. Imdb影评的数据集介绍 这是用于二分类情感分类的数据集,其包含的数据比以前的基准数据集要多得多. 我们提供了25,000电影评论用于训练,而25,000条电影评论用于测试. 也有其他未标记的数 ...

  9. 多目标跟踪数据集 :mot16、mot17数据集介绍

    文章目录 MOT16 数据集 MOT17数据集介绍 多目标跟踪数据集 MOT16 .MOT1数据集介绍: MOT16 数据集 数据集百度网分享: 点击此处 提取码: miao 文件格式: 解压MOT1 ...

  10. 语义分割之VOC2012、Cityscapes数据集介绍

    PASCAL-VOC2012 PASCAL-VOC2012数据集介绍官网: 参考 数据集下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCt ...

最新文章

  1. HarmonyOS之AI能力·词性标注
  2. 未来计算机打蜡机,电脑洗车机的未来发展方向:多样化or精简化?
  3. 用链表和数组实现HASH表,几种碰撞冲突解决方法
  4. 电脑入门完全自学手册_「新书推荐」新能源汽车维修完全自学手册
  5. 父进程给子进程传参数
  6. Spring中MultipartHttpServletRequest实现文件上传
  7. Windows Django 开发环境搭建
  8. web开发html如何把图片居中,css中怎么让img图片居中
  9. Bootstrap 学习笔记1 - CSS
  10. python基础----Day07
  11. c# 计算一年有多少周
  12. Linux 存储 Stack详解
  13. LC谐振电路跟和LC振荡电路
  14. ImageLoader 详解
  15. 短信猫实现短信验证小例子
  16. dell服务器物理盘blink,Blink
  17. stata 入门(双重差分模型)
  18. html编辑器增加超级链接,ueditor1.2.1修改超链接默认值,ueditor编辑器新窗口打开连接...
  19. 我的世界java服务器搭建_Linux搭建我的世界服务端
  20. JAVA 面向对象与面向过程区别

热门文章

  1. 极光推送官网android,极光推送(一)——配置
  2. HMC5883l磁力计数据读取
  3. Dos命令 --复制文件(夹)
  4. 水利知识库AI助手+公务员资料【产品经理】
  5. MLA与APA二种文件格式的文献引用写作技巧
  6. 中医药天池大数据竞赛——中医文献问题生成挑战(三)
  7. m.微博各种接口分析
  8. 深度学习语音识别方法概述与分析
  9. 局域网技术,涉及到VLAN,TRUNK,链路聚合,VLAN间路由,单臂路由,
  10. 网络七层协议的形象说明