Dataset之Pascal VOC:Pascal VOC(VOC 2012、VOC 2007) 数据集的简介、下载、使用方法详细攻略

目录

Pascal 竞赛

1、PASCAL VOC竞赛任务

2、Pascal 竞赛的历史

3、Pascal  VOC等类似大型官方数据集的由来

Pascal VOC 数据集的简介

1、VOC2007和VOC2012数据集

Pascal VOC 数据集的下载

Pascal VOC 数据集的使用方法


Pascal 竞赛

PASCAL:pattern analysis, statistical modelling and computational learning
       VOC:visual object classes
       Pascal 的全程是 Pattern Analysis, Statical Modeling and Computational Learning。
       PASCAL VOC 挑战赛是视觉对象的分类识别和检测的一个基准测试,提供了检测算法和学习性能的标准图像注释数据集和标准的评估系统。从2005年至今,该组织每年都会提供一系列类别的、带标签的图片,挑战者通过设计各种精妙的算法,仅根据分析图片内容来将其分类,最终通过准确率、召回率、效率来一决高下。如今,挑战赛和其所使用的数据集已经成为了对象检测领域普遍接受的一种标准。更多的自述和背景故事可以参见这篇官方提供的说明文件。

官网地址
http://pascallin.ecs.soton.ac.uk/challenges/VOC/
Visual Object Classes Challenge 2012 (VOC2012)
The PASCAL Visual Object Classes (VOC) Challenge

1、PASCAL VOC竞赛任务

1、PASCAL VOC的挑战任务

  • Classification/Detection Competitions
    分类:对于每一个分类,判断该分类是否在测试照片上存在(共20类);
    检测:检测目标对象在待测试图片中的位置并给出边界框坐标(bounding box)
  • Segmentation Competition
    分割:Object Segmentation
  • Action Classification Competition
    人体动作识别(Action Classification)
  • ImageNet Large Scale Visual Recognition Competition
    ImageNet大型视觉识别大赛
  • Person Layout Taster Competition
    人体布局(Human Layout)

官网地址:http://host.robots.ox.ac.uk/pascal/VOC/

2、Pascal 竞赛的历史

起初Pascal 并不像现在这样完善和全面,刚开始委员会只提供了4个类别的图像,在2006年的时候增加到了10个类,2007年开始则增加到了20个类;同样是在2007年,加入了对人体轮廓布局(Person layout)的测试;测试图像的数量也由起初的1578张增加到了2007年高峰时期的9963张,随后的一年则出现了大幅下降,直到2010年图库数量重新达到高峰,并与2011年稳定在11530张;期间于2009年开始图库的构成发生了变化,这之前每年委员会都会重新制作图库,选择新的照片来构成新的数据集。而2009年开始则采用扩增的方式,只在原有图库的基础上加入新的图片;再有一点就是在2010年加入的动作识别项目和 Other 分类。

3、Pascal  VOC等类似大型官方数据集的由来

计算机视觉里面很大一块是在做物体的识别、检测还有分类(object recognition, detection and classification)。几乎在每一个应用领域都需要用到这三项功能,所以能否顺利的完成这三个功能,对检验一个算法的正确性和效率来说是至关重要的。所以每一个算法的设计者都会运用自己搜集到的场景图片对算法进行训练和检测,这个过程就逐渐的形成了数据集(dataset)。
      而不幸的是,这样形成的数据集存在着很大的偏向性。因为就算是作者可以的随机搜集图片,在筛选的时候也存在着作者对事物的主管判断,而这种判断在其他人眼中就会觉得不公平。同时为了比较不同的算法效率,设计者也会运用数据集来进行性能比较。所以如果你看的论文足够多的话,你会发现,大家的实验部分都会说:在某个数据集上我的算法是最牛X的;在某某数据集上我的算法和当前最牛X的其他地方差不多,但速度快/准确率高/误报率低;虽然我的算法在某数据集一般,但几个数据集做一下平均,我的最牛X……所以这些由算法设计者们创建的数据集并不是那么的有说服性。

Pascal VOC 数据集的简介

PASCAL VOC挑战在2005年至2012年间展开。 目标检测技术的基准之一。该数据集中有20个分类。该数据集包含11530张用于训练和验证的图像, 其中感兴趣区域有27450个标定。 
       PASCAL VOC为图像识别和分类提供了一整套标准化的优秀的数据集,从2005年到2012年每年都会举行一场图像识别challenge。该挑战的主要目的是识别真实场景中一些类别的物体。在该挑战中,这是一个监督学习的问题,训练集以带标签的图片的形式给出。
       Pascal VOC(2005~2012)竞赛的目标主要是进行图像的目标识别,其提供的数据集包含20类的物体。每张图片都有标注,标注的物体包括人、动物(如猫、狗、岛等)、交通工具(如车、船飞机等)、家具(如椅子、桌子、沙发等)在内的20个类别。每个图像平均有2.4个目标。所有的标注图片都有Detection需要的label, 但只有部分数据有Segmentation Label。

1、VOC2007和VOC2012数据集

1、VOC2007

VOC2007:中包含9963张标注过的图片, 由train/val/test三部分组成, 共标注出24,640个物体。 VOC2007的test数据label已经公布, 之后的没有公布(只有图片,没有label)。

2、VOC2012

VOC2012:VOC2012数据集是VOC2007数据集的升级版,一共有11530张图片。对于检测任务,VOC2012的trainval/test包含08-11年的所有对应图片。 trainval有11540张图片共27450个物体。 对于分割任务, VOC2012的trainval包含07-11年的所有对应图片, test只包含08-11。trainval有 2913张图片共6929个物体。     
      VOC2012数据集分为20类,包括背景为21类,分别如下:

  • 人:人
  • 动物:鸟、猫、牛、狗、马、羊
  • 车辆:飞机、自行车、船、巴士、汽车、摩托车、火车
  • 室内:瓶、椅子、餐桌、盆栽植物、沙发、电视/监视器

这些物体包括20类:

  • Person: person
  • Animal: bird, cat, cow, dog, horse, sheep
  • Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
  • Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor

Pascal VOC 数据集的下载

1、VOC2012数据集下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar

(1)、将其转换为tfrecord格式:为了不影响代码的结构,还是在原来的object_detection 文件夹中, 再新建一个voc 文件夹,并将下载的数据集压缩包复制至voc/中。解压后,就得到一个VOCdevkit 文件夹,最终的文件夹结构应该为

Pascal VOC 数据集的使用方法

后期更新……

Dataset之Pascal:Pascal竞赛及其Pascal VOC(VOC 2012、VOC 2007) 数据集的简介、下载、使用方法详细攻略相关推荐

  1. Dataset:机器学习和深度学习中对数据集进行高级绘图(数据集可视化,箱线图等)的简介、应用之详细攻略——daidingdaiding

    Dataset:机器学习和深度学习中对数据集进行高级绘图(数据集可视化,箱线图等)的简介.应用之详细攻略--daidingdaiding 目录 箱线图 箱线图 箱线图(box plots):这些图显示 ...

  2. VOC数据集图片标注工具labelImg简介、安装、使用方法详细攻略(windows) PyQt4、PyQt5

    参考文章1:labelImg:图片标注工具之labelImg的简介.安装.使用方法详细攻略 参考文章2:LabelImg labelImg的安装 用gitbash打开,运行git clone http ...

  3. Dataset之AllstateClaimsSeverity:AllstateClaimsSeverity数据集(Kaggle2016竞赛)的简介、下载、案例应用之详细攻略

    Dataset之AllstateClaimsSeverity:AllstateClaimsSeverity数据集(Kaggle2016竞赛)的简介.下载.案例应用之详细攻略 目录 AllstateCl ...

  4. Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略

    Dataset之RentListingInquries:RentListingInquries(Kaggle竞赛)数据集的简介.下载.案例应用之详细攻略 目录 RentListingInquries比 ...

  5. Dataset之HiggsBoson:Higgs Boson(Kaggle竞赛)数据集的简介、下载、案例应用之详细攻略

    Dataset之HiggsBoson:Higgs Boson(Kaggle竞赛)数据集的简介.下载.案例应用之详细攻略 目录 Higgs Boson比赛简介 Higgs Boson数据集的下载 Hig ...

  6. Dataset之COCO数据集:COCO数据集的简介、下载、使用方法之详细攻略

    Dataset之COCO数据集:COCO数据集的简介.安装.使用方法之详细攻略 目录 COCO数据集的简介 0.COCO数据集的80个类别-YoloV3算法采用的数据集 1.COCO数据集的意义 2. ...

  7. Dataset:GiveMeSomeCredit数据集的简介、下载、使用方法之详细攻略

    Dataset:GiveMeSomeCredit数据集的简介.下载.使用方法之详细攻略 目录 GiveMeSomeCredit数据集的简介 1.数据集基本描述 2.EDA后总结 3.数据集基本形状 G ...

  8. Dataset:Big Mart Sales数据集的简介、下载、案例应用之详细攻略

    Dataset:Big Mart Sales数据集的简介.下载.案例应用之详细攻略 目录 Big Mart Sales数据集的简介 1.特征解释 Big Mart Sales数据集的下载 Big Ma ...

  9. Competition——AI:国内外人工智能比赛平台以及竞赛类型、竞赛题目、举行时间等之详细攻略(最全+ing)

    Competition--AI:国内外人工智能比赛平台以及竞赛类型.竞赛题目.举行时间等之详细攻略(最全+ing) tips (1).可以在各大比赛平台指定的讨论区,或者github网站上,找到历届选 ...

最新文章

  1. intouch负值显示0_excel 应用中计算结果显示为负数,使负数显示为0应如何操作?...
  2. android ip 黑白名单,GaussDB T 单机 IP黑白名单配置
  3. 中国通信企业投身罗马尼亚智慧城市建设
  4. linux的mysql本地yum安装_Linux下MySQL5.7.18 yum方式从卸载到安装过程图解
  5. wxWidgets:wxSizeEvent类用法
  6. ECMAScript 2016,2017,和2018中新增功能
  7. colgroup标签
  8. SharePoint2013的头像显示和读取
  9. Android设置Textview字体样式
  10. Tableau 2021安装教程
  11. 桌面整理之DeskGo
  12. 【文学】平凡的世界第三部
  13. 2009年的MACBOOK苹果电脑重装MAC OS 10.8.5系统
  14. CSS鼠标事件和键盘事件练习
  15. Win10 如何进入WinRE模式?
  16. ZYNQ 或ZYNQ Ultrascale PS/PL交互
  17. 电精2 android,安卓街机模拟器|街机电精2(街机模拟器)安卓版 - 系统天堂
  18. pytorch 中的topk函数
  19. JAVA 双亲委派机制
  20. 修改服务器2003系统时间,windows2003 时间服务器ntp配置

热门文章

  1. STL标准库-容器-set与map
  2. tomcat请求数据的编码设置
  3. 《慕课React入门》总结
  4. 瞬发大量并发连接 造成MySQL连接不响应的分析
  5. dos下实现延迟功能
  6. 选择一线一张床还是小城一套房?
  7. 图解 MySQL 索引:B-树、B+树,终于搞清楚了!
  8. Java 泛型背后的原理是什么?
  9. Spring Boot MongoDB 入门
  10. Maven的这三个用法你一定要会!