一、简介

  • PASCAL VOC 挑战赛主要有 Object Classification 、Object Detection、Object Segmentation、Human Layout、Action Classification 这几类子任务

    • PASCAL 主页 与 排行榜
    • PASCAL VOC 2007 挑战赛主页 、PASCAL VOC 2012 挑战赛主页 、PASCAL VOC Evaluation Server
  • PASCAL VOC 2007 和 2012 数据集总共分 4 个大类:vehicle、household、animal、person,总共 20 个小类(加背景 21 类),预测的时候是只输出下图中黑色粗体的类别

二、VOC 常用组合、数据量统计及组织结构

  • VOC2007 train_val_test & VOC2012 train_val 百度云下载链接,提取码: jz27

  • 目前目标检测常用的是 VOC2007 和 VOC2012 数据集,因为二者是互斥的,论文中的常用组合有以下几种:

    • 07+12: 使用 VOC2007 和 VOC2012 的 train+val(16551) 上训练,然后使用 VOC2007 的 test(4952) 测试
    • 07++12: 使用 VOC2007 的 train+val+test(9963) 和 VOC2012的 train+val(11540) 训练,然后使用 VOC2012 的 test 测试,这种方法需提交到 PASCAL VOC Evaluation Server 上评估结果,因为 VOC2012 test 没有公布
    • 07+12+COCO: 先在 MS COCO 的 trainval 上 预训练,再使用 VOC2007 和 VOC2012 的 train+val 微调训练,然后使用 VOC2007 的 test 测试
    • 07++12+COCO: 先在 MS COCO 的 trainval 上预训练,再使用 VOC2007 的 train+val+test 和 VOC2012 的 train+val微调训练,然后使用 VOC2012 的 test 测试 ,这种方法需提交到 PASCAL VOC Evaluation Server上评估结果,因为VOC2012 test 没有公布
  • VOC2007 和 VOC2012 目标检测任务中的训练、验证和测试数据统计如下表所示,具体每一类的数据分布见 PASCAL VOC2007 Database Statistics 和 PASCAL VOC2012 Database Statistics

  • 组织结构: 以 VOC 2007 为例,解压后的文件为:

    .
    ├── Annotations 进行 detection 任务时的标签文件,xml 形式,文件名与图片名一一对应
    ├── ImageSets 包含三个子文件夹 Layout、Main、Segmentation,其中 Main 存放的是分类和检测的数据集分割文件
    ├── JPEGImages 存放 .jpg 格式的图片文件
    ├── SegmentationClass 存放按照 class 分割的图片
    └── SegmentationObject 存放按照 object 分割的图片├── Main
    │   ├── train.txt 写着用于训练的图片名称, 共 2501 个
    │   ├── val.txt 写着用于验证的图片名称,共 2510 个
    │   ├── trainval.txt train与val的合集。共 5011 个
    │   ├── test.txt 写着用于测试的图片名称,共 4952 个
    

三、标注标准及 XML 解析

  • 标注标准:VOC2011 Annotation Guidelines
  • 标注信息是用 xml 文件组织的如下:
    <annotation><folder>VOC2007</folder><filename>000001.jpg</filename>  # 文件名 <source><database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image><flickrid>341012865</flickrid></source><owner><flickrid>Fried Camels</flickrid><name>Jinky the Fruit Bat</name></owner><size>  # 图像尺寸, 用于对 bbox 左上和右下坐标点做归一化操作<width>353</width><height>500</height><depth>3</depth></size><segmented>0</segmented>  # 是否用于分割<object><name>dog</name>  # 物体类别<pose>Left</pose>  # 拍摄角度:front, rear, left, right, unspecified <truncated>1</truncated>  # 目标是否被截断(比如在图片之外),或者被遮挡(超过15%)<difficult>0</difficult>  # 检测难易程度,这个主要是根据目标的大小,光照变化,图片质量来判断<bndbox><xmin>48</xmin><ymin>240</ymin><xmax>195</xmax><ymax>371</ymax></bndbox></object><object><name>person</name><pose>Left</pose><truncated>1</truncated><difficult>0</difficult><bndbox><xmin>8</xmin><ymin>12</ymin><xmax>352</xmax><ymax>498</ymax></bndbox></object>
    </annotation>
    

四、提交格式

1、Classification Task

  • 每一类都有一个 txt 文件,里面每一行都是测试集中的一张图片,前面一列是图片名称,后面一列是预测的分数
# comp1_cls_test_car.txt, 内容如下000004 0.702732
000006 0.870849
000008 0.532489
000018 0.477167
000019 0.112426

2、Detection Task

  • 每一类都有一个 txt 文件,里面每一行都是测试集中的一张图片,每行的格式为:<image identifier> <confidence> <left> <top> <right> <bottom>,confidence 用来计算 mAP
# comp3_det_test_car.txt,内容如下
# comp3:只允许用所给训练数据,comp4:允许使用外部数据000004 0.702732 89 112 516 466
000006 0.870849 373 168 488 229
000006 0.852346 407 157 500 213
000006 0.914587 2 161 55 221
000008 0.532489 175 184 232 201

五、评估标准

  • PASCAL的评估标准是 mAP(mean average precision),关于 mAP 可参考以下资料:

    • average precision
    • 性能指标(模型评估)之mAP
    • 多标签图像分类任务的评价方法-mAP
    • 周志华老师 《机器学习》 模型评估标准一节
    • PASCAL官方给了 MATLAB 版的 mAP 评估脚本和示例代码 development kit code and documentation
  • eg:下面是一个二分类的 P-R 曲线(precision-recall curve),对于 PASCAL 来说,每一类都有一个这样的 P-R曲线,P-R 曲线下面与 x 轴围成的面积称为 average precision,每个类别都有一个 AP,20个类别的 AP 取平均值 就是 mAP。

六、参考资料

1、The PASCAL Visual Object Classes Homepage
2、目标检测数据集PASCAL VOC简介

目标检测:PASCAL VOC 数据集简介相关推荐

  1. Pascal VOC 数据集介绍(tensorflow model zoo)

    Pascal VOC 数据集的下载 # 下载2007年的训练数据 wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06- ...

  2. 目标检测数据集-Pascal VOC 数据集介绍

    个人微信公众号:AI研习图书馆 ID:(Art-Intelligence) 欢迎关注,交流学习,共同进步~ 1.引言 PASCAL VOC数据集,为图像识别和分类提供了一整套标准化的优秀数据集,从20 ...

  3. 图像处理基本库的学习笔记5--公共数据集,PASCAL VOC数据集,NYUD V2数据集的简介与提取,COCO2017,医学影像数据集汇总

    目录 公共数据集 计算机视觉标准数据集整理-PASCAL VOC数据集 数据集文件结构 Annotation JPEGImages SegmentationClass SegmentationObje ...

  4. 目标检测系列(preface) 数据集DataSets

    目标检测系列(Preface) - 数据集 公开数据集(PASCAL VOC // COCO)介绍 一.PASCAL VOC格式数据集 官网 标注工具 1.数据集一般格式 VOC2007 Annota ...

  5. PASCAL VOC数据集

    一.简介 PASCAL: pattern analysis, statistical modelling and computational learning VOC: visual object c ...

  6. 深度学习和目标检测系列教程 3-300:了解常见的目标检测的开源数据集

    @Author:Runsen 计算机视觉中具有挑战性的主题之一,对象检测,可帮助组织借助数字图片作为输入来理解和识别实时对象.大量的论文基于常见的目标检测的开源数据集而来,因此需要了解常见的目标检测的 ...

  7. RCNN系列实验的PASCAL VOC数据集格式设置

    我们在做RCNN系列的实验时,往往需要把数据集的格式设置为和PASCAL VOC数据集一样的格式,其实当然也可以修改读取数据的代码,只是这样更为麻烦,自己的数据格式变了又得修改.  首先以VOC200 ...

  8. YOLO v5 实现目标检测(参考数据集自制数据集)

    YOLO v5 实现目标检测(参考数据集&自制数据集) Author: Labyrinthine Leo   Init_time: 2020.10.26 GitHub: https://git ...

  9. 人工智能学习:PASCAL VOC数据集读取(6)

    PASCAL VOC是一个国际的计算机视觉挑战赛,数据集包含了20个分类的3万多张图片.挑战赛及其数据集基础上涌现不少知名的目标检测模型如R-CNN,YOLO,SSD等.可以通过下载和读取的方法载入P ...

最新文章

  1. Map m=new HashMap()
  2. Windows Server 笔记之备份与灾难恢复
  3. vue2的响应式原理学“废”了吗?继续观摩vue3响应式原理Proxy
  4. STM32H7---高速缓存Cache(二)
  5. Matplotlib - bar(条形图)
  6. 23-[模块]-logging
  7. 文荣:7月24日阿里云上海峰会网络大神
  8. 【牛腩新闻发布系统】牛腩小结
  9. iOS申请真机调试证书-图文详解
  10. 十三、注解(高琪java300集+java从入门到精通笔记)
  11. Python零基础学习笔记(三十三)—— 窗体的控制...
  12. iPhone 13 真的要来了!苹果秋季发布会前瞻
  13. Java内存模型中happen-before原则
  14. There‘s no Qt version assigned to project xxx.vcxproj for configuration Debug/x64
  15. Spring cloud config 配置文件加密
  16. 台式机1080ti最低多少起_配一台1080ti的电脑要多少钱,不是土豪,最低
  17. php货币符号怎么打,Magento修改货币符号和货币符号的位置
  18. Android Studio编写Xposed模块
  19. 【翻译】2020年云安全综合指南(风险,最佳实践,认证)
  20. 微信公众平台SDK! Senparc.Weixin.MP.dll(资料整理)

热门文章

  1. Hadoop3.3.3完全分布式安装(Centos7.x)(保姆教程)
  2. Firefox人气火红 能否取代龙头IE?
  3. android 多个按钮居中,Android手机开发 使用线性布局和相对布局实现Button垂直水平居中...
  4. vscode终端无输出
  5. CPU概述及CPU的内部结构
  6. 基于FPGA的DDS直接数字频率合成器,频率和相位控制字可配置,在vivado2019.2平台中verilog开发.含testbench
  7. SQLSERVER 2000 以及SQL Server 2005的版本号
  8. 算法竞赛入门经典 开灯问题
  9. java代码审计_Java代码审计| Spring框架思路篇
  10. Linux网络之curl命令详解