详解 VOC 数据集
本视频配套视频链接:https://www.bilibili.com/video/BV1ZL4y1p7Cz/
我们先来介绍一个经典的数据集:VOC 数据集。Visual Object Class 的首字母缩写,它的官方地址为 http://host.robots.ox.ac.uk/pascal/VOC/。
虽然现在大家更倾向于使用我们后面要介绍的 COCO 数据集,但 VOC 数据集也很重要,大家经常可以在一些论文中看到它的身影。
你会发现之前很多的数据集都是伴随着比赛的出现。比赛举办方提供训练数据集图片和训练数据集的标注给参赛者,同时还会提供不带标注信息的测试数据集图片给参赛者。当然,这些测试数据集图片的标注信息是在比赛举办方手中。然后,参赛者拿着带标注信息的训练数据集去捣鼓,然后用捣鼓的模型去预测不带标注信息的测试数据集,将预测出来的标注信息按照比赛方规定的形式提交给比赛方。比赛方之后会比较参赛者提交的预测结果和自己手上的标注结果,进而计算出参赛者提交数据的正确率,最后给各个参赛者的预测结果进行排名。
VOC 数据集也是伴随着比赛出现的,因为这个比赛在 2012 年就停办了,所以数据集更新的年份也就终止于 2012 年。
可以看到上图,存在从 2005 年 - 2012 年的比赛,每年的比赛都提供了相应年份的数据集。这样一看,VOC 数据集其实包括了从 2005 - 2012 年,8 年的数据集。8 份数据集,我们该如何选择哪一个年份的数据集。
先给大家一个结论,我们再来说说为什么选择这些年份的数据集。
结论就是,大家更多使用的是 2007 和 2012 年的数据集。至于原因,让我娓娓道来。
2005 年的时候,VOC 比赛举办方提供了 VOC 2005 数据集,这个时候的数据集只有 4 种目标类别,数据集数量大约只有 1500 张左右。这个时候,VOC 2015 数据集无论是从数据集的图片数量还是目标的种类上来说,都是相对较少的。到了 2006 年,VOC 2006 数据集有了 10 种类别,数量也有了 2600 张左右。
但是,到了 2007 年,VOC 2007 数据集一下子有了 20 种类别,同时数据集数量也一下子提升到了 9900 张左右。
VOC 2007 数据集是一个巨大的转折点。这个时候的数据集无论是从数据量的规模还是目标的类别都能够满足绝大多数模型的训练要求。所以,大家会发现很多模型都采用了 VOC 2007 数据集来训练网络模型。
然而到了 2008 年,VOC 比赛方又开始搞事情了。他们重新制作数据集,所以 VOC 2008 数据集有 20 个类别,图片数量为 4000 张左右。可以发现比 VOC 2007 数据集少得多。之后 2009 - 2012 年都是在 2008 年数据集的基础上不断的进行数量上的扩充,到了 2012 年,数据集的图片数量高达 11000 张。
所以,可想而知,VOC 2012 数据集对广大科研工作者是很有吸引力的。
下面一张图,很好地说明了 VOC 各年份数据集的变化。
上图中,不同的颜色代表数据集的内容,比如 05 年和 06 年的颜色是不一样的,说明 05 年和 06 年数据集的内容是完全不一样的。可以看到 05 - 07 年,是一个阶段,这个时候,每个年份数据集的内容都是不一样的。但是从刚才的介绍中可以发现,07 年数据集,无论是从图片数量还是种类上都是占优的,所以这个 05 - 07 年,VOC 2007 数据集顺利胜出。
而从 08 - 12 年,又是一个新的阶段,08 年,VOC 数据集重新建立了新的数据集,然后每年都在这个数据集的基础上,不断进行扩充。到了 11/12 年,数据集数量还是种类都到了顶峰。大家注意,11 年 和 12 年,数据集图片数量还是类别都是一样的,但是 12 年在 11 年的基础上对标注进行了一些优化改进。大家更习惯喜欢 12 年数据集。
所以,综上,大家应该明白了为什么大家更喜欢使用 2007 和 2012 年的数据集。
土堆教程,配套 目标检测入门实战系列 视频教程
详解 VOC 数据集相关推荐
- 详解 MNIST 数据集
MNIST 数据集已经是一个被"嚼烂"了的数据集, 很多教程都会对它"下手", 几乎成为一个 "典范". 不过有些人可能对它还不是很了解, ...
- 【实际操作】DenseFusion复现过程详解-YCB-Video数据集
DenseFusion系列代码全讲解目录:[DenseFusion系列目录]代码全讲解+可视化+计算评估指标_Panpanpan!的博客-CSDN博客 这些内容均为个人学习记录,欢迎大家提出错误一起讨 ...
- Netflix Prize数据集详解及数据集下载链接
Netflix数据集包含了1999.12.31-2005.12.31期间匿名客户提供的超过一亿部电影平级.这个数据集大约给出了480189个用户和17770部电影评级.数据集中的详细信息如下图所示: ...
- 全卷积神经网路【U-net项目实战】LUNA 2016 数据集详解
文章目录 1.LUNA 2016 数据集详解 2.mdh数据格式详解 3.python读取mdh的方法 4.annotations.csv坐标转换 5.LUNA16数据集肺结节显示 1.LUNA 20 ...
- LUNA 2016 数据集详解
LUNA 2016 数据集详解 LUNA16数据集的由来 LUNA 2016 数据集来自2016年LUng Nodule Analysis比赛,这里是其官方网站. LUNA16数据集是最大公用肺结节数 ...
- ILSVRC2015_VID数据集详解
数据集下载地址:http://bvisionweb1.cs.unc.edu/ilsvrc2015/ILSVRC2015_VID.tar.gz 总说: 数据集包括3862 snippets用于训练,55 ...
- tensorflow入门数据集:mnist详解
文章目录 python处理二进制 mnist介绍 mnist显示 方法一:读取解压后的原始文件 方法二:使用TensorFlow封装代码读取 需求一:同时显示图片和标签,验证图片和标签一一对应 需求二 ...
- BraTS数据集处理详解(附代码详解)
代码参考:https://github.com/sinclairjang/3D-MRI-brain-tumor-segmentation-using-autoencoder-regularizatio ...
- MSCOCO数据标注详解
参考: cocodataset/cocoapi philferriere/cocoapi- support Windows build and python3 COCO 标注详解 COCO数据集ann ...
- voc数据集格式详解
计算机视觉经常会用到voc数据集 以如下数据集为例 http://www.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/semantic ...
最新文章
- perl use 命令中指定路径
- 【开发环境】安装 Visual Studio Code 开发环境 ( 下载 Visual Studio Code 安装器 | Visual Studio Code )
- 利用vc的mfc做的Excel表格处理工具
- 分组数据方差公式_统计学公式
- 练习11.1 奥运五环色 7-1 藏头诗
- Jakarta EE中的规范范围
- vue 后端返回二进制流文件,前端如何实现下载?
- hibernate 批量更新_360产品动态,10月份平台都有哪些更新?
- 合成人声、人脸替换等深度合成信息内容须进行显著标识
- 常用的比较排序算法总结
- Java并发编程之CAS和AQS
- fireworks切图
- cad字体安装_三种CAD缺失字体解决方法,让你不在为寻找字体而烦恼
- KB4484127 更新导致ACCESS数据库查询报 Query '' is corrupt 异常解决方案
- 漂白android软件,原本图片漂白软件
- Spring+Spring MVC+MyBatis实现SSM框架整合详细教程【转】
- C++OpenCV矩形的角点检测与坐标提取,基于fast特征点
- 记录本地 Docker 新建镜像,推送到Daocloud
- Ansoft SIMPLORER 6.0 (多领域仿真软件)\
- 车载以太网协议的架构