PASCAL VOC数据集分析(分类部分)
- Person: person
- Animal: bird, cat, cow, dog, horse, sheep
- Vehicle: aeroplane, bicycle, boat, bus, car, motorbike, train
- Indoor: bottle, chair, dining table, potted plant, sofa, tv/monitor
Train/validation/test: 9,963 images containing 24,640 annotated objects.
- <annotation>
- <folder>VOC2012</folder>
- <filename>2007_000392.jpg</filename> //文件名
- <source> //图像来源(不重要)
- <database>The VOC2007 Database</database>
- <annotation>PASCAL VOC2007</annotation>
- <image>flickr</image>
- </source>
- <size> //图像尺寸(长宽以及通道数)
- <width>500</width>
- <height>332</height>
- <depth>3</depth>
- </size>
- <segmented>1</segmented> //是否用于分割(在图像物体识别中01无所谓)
- <object> //检测到的物体
- <name>horse</name> //物体类别
- <pose>Right</pose> //拍摄角度
- <truncated>0</truncated> //是否被截断(0表示完整)
- <difficult>0</difficult> //目标是否难以识别(0表示容易识别)
- <bndbox> //bounding-box(包含左下角和右上角xy坐标)
- <xmin>100</xmin>
- <ymin>96</ymin>
- <xmax>355</xmax>
- <ymax>324</ymax>
- </bndbox>
- </object>
- <object> //检测到多个物体
- <name>person</name>
- <pose>Unspecified</pose>
- <truncated>0</truncated>
- <difficult>0</difficult>
- <bndbox>
- <xmin>198</xmin>
- <ymin>58</ymin>
- <xmax>286</xmax>
- <ymax>197</ymax>
- </bndbox>
- </object>
- </annotation>
对应的图片为:
VOC2007数据集共包含:训练集(5011幅),测试集(4952幅),共计9963幅图,共包含20个种类。
数据集的组成架构如下:
- Annotations —目标真值区域
- ImageSets —-类别标签
- JPEGImages —–图像
- SegmentationClass
- SegmentationObjec
JPEGImages 中存放原始图像,jpg格式。大小一般为 500*375 或 375*500;
ImageSets 中有三个文件夹【Layout】【Main】【Segmentation】,分类识别我们只关注【Main】,它内部存储类别标签,-1表示负样本,+1为正样本
*_train.txt 训练样本集
*_val.txt 评估样本集
*_trainval.txt 训练与评估样本汇总
2 各类别统计信息
20个类别中,后面数字代表数据集中对应的的正样本图像个数(非目标个数)。
- 训练集
aeroplane 238
bicycle 243
bird 330
boat 181
bottle 244
bus 186
car 713
cat 337
chair 445
cow 141
diningtable 200
dog 421
horse 287
motorbike 245
person 2008
pottedplant 245
sheep 96
sofa 229
train 261
tvmonitor 256
- 测试集
aeroplane 204
bicycle 239
bird 282
boat 172
bottle 212
bus 174
car 721
cat 322
chair 417
cow 127
diningtable 190
dog 418
horse 274
motorbike 222
person 2007
pottedplant 224
sheep 97
sofa 223
train 259
tvmonitor 229
可以看出,除了person数量较多,其他类别样本个数不算多。
因此,用VOC数据来训练模型,做行人检测或者车辆检测,数据是不够的,需要自己扩充数据。
PASCAL VOC数据集分析(分类部分)相关推荐
- 图像处理基本库的学习笔记5--公共数据集,PASCAL VOC数据集,NYUD V2数据集的简介与提取,COCO2017,医学影像数据集汇总
目录 公共数据集 计算机视觉标准数据集整理-PASCAL VOC数据集 数据集文件结构 Annotation JPEGImages SegmentationClass SegmentationObje ...
- 目标检测数据集-Pascal VOC 数据集介绍
个人微信公众号:AI研习图书馆 ID:(Art-Intelligence) 欢迎关注,交流学习,共同进步~ 1.引言 PASCAL VOC数据集,为图像识别和分类提供了一整套标准化的优秀数据集,从20 ...
- 人工智能学习:PASCAL VOC数据集读取(6)
PASCAL VOC是一个国际的计算机视觉挑战赛,数据集包含了20个分类的3万多张图片.挑战赛及其数据集基础上涌现不少知名的目标检测模型如R-CNN,YOLO,SSD等.可以通过下载和读取的方法载入P ...
- Pascal VOC 数据集介绍(tensorflow model zoo)
Pascal VOC 数据集的下载 # 下载2007年的训练数据 wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06- ...
- PASCAL VOC数据集
一.简介 PASCAL: pattern analysis, statistical modelling and computational learning VOC: visual object c ...
- PASCAL VOC 数据集的标注格式
PASCAL VOC 数据集的标注格式 PASCAL VOC 挑战赛 ( **The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛. PASCAL的全称是 ...
- Ubuntu上用caffe的SSD方法训练Pascal VOC数据集
实验目的 继caffe和ssd搭建完成,demo也演示完毕,了解一些基本知识后,现在开始训练自己的数据集,在给自己的训练集处理之前,先跟着官方的示例将Pascal VOC数据集训练走一遍,把可能会踩坑 ...
- RCNN系列实验的PASCAL VOC数据集格式设置
我们在做RCNN系列的实验时,往往需要把数据集的格式设置为和PASCAL VOC数据集一样的格式,其实当然也可以修改读取数据的代码,只是这样更为麻烦,自己的数据格式变了又得修改. 首先以VOC200 ...
- Deep Learning---py-faster-rcnn基于PASCAL VOC数据集训练模型
0 说明 系统环境为Ubuntu14.04, 已经安装好了CUDA和cuDNN以及Python等基础包. 1 设置和编译py-faster-rcnn 1.1 下载py-faster-rcnn $ gi ...
最新文章
- windows文件保护_等保测评2.0:Windows安全审计
- 最新、最全面的LAMP+wordpress安装过程!!
- requests安装及问题解决
- 明星居然来我们宜昌保利时代拍戏——电影《被光抓走的人》
- 2020年余丙森概率统计强化笔记-第五章 大数定律和中心极限定理 第六章 数理统计
- VTK:采样函数用法实战
- Boost:基于Boost的阻塞TCP回显服务器
- LeetCode Algorithm 3. 无重复字符的最长子串
- 【数据结构与算法】判断单链表是否有环的算法
- [转载] Python round四舍五入精度缺失的解决
- 命令行删除RMS SCP 连接点
- 直播网站源码,输入框中显示小图标
- pgAdmin 3 编译安装
- NMS 非极大值抑制原理及实现
- 本世纪惊心动魄的粮食战争,中国反败为胜:陈思进--20190701
- 自然语言处理NLP基础知识
- Arcmap地理配准png
- 每天一道面试题 浏览器输入URL到页面呈现详细过程
- RabbitMQ 面试题目整理
- Ventoy 制作U盘启动盘 使用教程