适合初学者的PASCAL VOC2012数据集的下载及简单讲解
如题,我本身也是一个初学者,本篇文章是我在了解PASCAL VOC数据集中所学习到的,因此记录下来与大家分享,如果有不对的地方还希望大家指正。
PASCAL VOC挑战赛是世界级的计算机视觉挑战赛,PASCAL的全称是:Pattern Analysis,Statistical Modelling and Computational Learning Visual Objection Classes,是一个由欧盟资助的网络组织,挑战赛主要分为以下几类:图像分类,目标检测,目标分割以及动作识别等。
一、PASCAL VOC2012数据集的下载
由于我下载的时候官网打不开,因此找到了一个镜像网站,大家可以直接复制到迅雷中下载,还是比较快的。https://pjreddie.com/media/files/VOCtrainval_11-May-2012.tar
二、PASCAL VOC2012数据集的内容
解压下载的文件,里面结构如下:
1.Annotations
这个文件夹下的内容为所有图像的标注信息,均为XML文件。
就像这样,任选其中一个打开可以看到如下信息,’#'后的是我加上的注释:
<annotation><folder>VOC2012</folder>#图片所在的文件夹<filename>2007_000033.jpg</filename>#所对应的图片名称<source><database>The VOC2007 Database</database><annotation>PASCAL VOC2007</annotation><image>flickr</image>#来自网络分享</source><size>#尺寸<width>500</width><height>366</height><depth>3</depth></size><segmented>1</segmented>#是否被分割过,1是被分割过,没有就是0<object>#目标1<name>aeroplane</name>#类别<pose>Unspecified</pose><truncated>0</truncated>#目标是否被截断<difficult>0</difficult>#目标检测的难易程度,1为难检测,0为容易检测<bndbox>#目标的左上角和右下角坐标<xmin>9</xmin><ymin>107</ymin><xmax>499</xmax><ymax>263</ymax></bndbox></object><object>#目标2<name>aeroplane</name><pose>Left</pose><truncated>0</truncated><difficult>0</difficult><bndbox><xmin>421</xmin><ymin>200</ymin><xmax>482</xmax><ymax>226</ymax></bndbox></object><object>#目标3<name>aeroplane</name><pose>Left</pose><truncated>1</truncated><difficult>0</difficult><bndbox><xmin>325</xmin><ymin>188</ymin><xmax>411</xmax><ymax>223</ymax></bndbox></object>
</annotation>
2.ImageSets
此文件夹下又有四个文件夹
其中Action文件夹中为人的行为动作图像信息,Layout为人的各个部位图像信息,Segmentation为目标分割图像信息,Main文件夹为目标检测分类图像信息,Main文件夹中包括了20个种类的txt格式的信息,每一个种类都有三个,分别是_train,_trainval,_val,部分截图如下。除此之外,还包含了三个总的信息文件train.txt,val.txt,trainval.txt,这里面训练集共有5717张图片,验证集共有5823张图片,共有11540张图片。
训练集train.txt文件中的每一行都是一个图片的名称,验证集val.txt也同样,并且训练集中的图片和验证集中的是完全不一样的。trainval.txt是将这两部分融合到一起的。
随机点开某一个类别的txt文件,如bird_train.txt,可以发现每一行除了名称后面还有一个数字,如果是-1,说明这个图片中没有鸟这个目标;如果是1,说明这个图片中有鸟这个目标;如果是0,说明这个目标检测起来是有困难的。如下部分截图:
3.JPEGImages
这个文件夹下就是一个个.jpg格式的图片。
4.SegmentationClass
基于类别的图像分割图,都是png格式的。
5.SegmentationObject
基于目标的图像分割图,也都是png格式的。
三、PASCAL VOC2012数据集的使用顺序
首先读入train.txt的文件,获取它的每一行信息,然后去Annotations找到它的xml文件,然后解析这个文件,再去JPEGImages中找到这个图片,载入到内存中。
如果大家觉得我写的不够细致,可以去b站搜这位up主的讲解,很细致,感谢他!https://b23.tv/KRwTKT
适合初学者的PASCAL VOC2012数据集的下载及简单讲解相关推荐
- PspNet在MMsegmentation框架下成功训练Pascal VOC2012数据集及踩坑实录
时间:2021/08/29/05:45:28 一晚上了,难以置信,我竟然还不困,还有着整理博客的冲动.也就在这周,熬夜能力突然就在几个晚上的不归宿中突破了,一夜过后天壤之别,一晚比一晚能熬,之前还会担 ...
- PASCAL VOC2012数据集
PASCAL VOC2012数据集 下载的官方网址:http://host.robots.ox.ac.uk/pascal/voc/voc2012/index.html#devkit 一.介绍与下载 P ...
- Pascal VOC2012数据集下载
数据集下载 刚发现原来数据集下载也是这么麻烦的一件事情,还有人用链接换积分.还好找到了一个好心人,连接在下面. 好心人的网址 他给的链接地址 https://pjreddie.com/projects ...
- Pascal VOC 数据集国内下载
(非官方/非百度云) 从2007-2012的文件 http://data1.f3322.net:666/share/Pascal VOC/ 文件在对应目录 如果遭遇下载失败的情况请访问 https:/ ...
- PASCAL VOC2012 数据集讲解与制作自己的数据集
前言 随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容.来源于哔哩哔哩博主"霹雳吧啦Wz",博主学习作为笔记记录,欢 ...
- TCGA下载和表达矩阵整理:最适合初学者的教程
本文首发于公众号:医学和生信笔记 " 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化.主要分享R语言做医学统计学.meta分析.网络药理学.临床预测模型.机器学习.生物 ...
- 目标检测数据集-Pascal VOC 数据集介绍
个人微信公众号:AI研习图书馆 ID:(Art-Intelligence) 欢迎关注,交流学习,共同进步~ 1.引言 PASCAL VOC数据集,为图像识别和分类提供了一整套标准化的优秀数据集,从20 ...
- Pascal VOC 数据集介绍(tensorflow model zoo)
Pascal VOC 数据集的下载 # 下载2007年的训练数据 wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06- ...
- 【Pytorch】构建VOC2012数据集代码详解
目录 数据集 图片读入 预处理 crop 标签和像素点颜色 随机翻转 噪声 标准化 torch.utils.data.Dataset()和torch.utils.data.DataLoader() t ...
- Ubuntu 16.04下Caffe-SSD的应用(六)——PASCAL VOC2007数据集介绍
前言 1.PASCAL VOC为图像识别与分类提供了一整套标准化的图像数据集,VOC数据集是衡量图像分类识别能力的基准,好多深度学习的框架在识别这块都以此数据集作为演示样例.PASCAL VOC数据集 ...
最新文章
- dplayer js控制 自动全屏_Qt编写安防视频监控系统18-云台控制
- 数据结构Java11【图结构概述、图遍历原理(BFS\DFS)、图遍历代码实现】
- python 判断时间是否大于6点_python - 在dataframe中,如何检查时间增量是否大于一分钟?_pandas_酷徒编程知识库...
- java 注解报错_eclipse编译项目:Java @Override 注解报错的解决方法
- 【电路仿真】基于matlab simulink三相半波可控整流电路【含Matlab源码 331期】
- 3,graph语法学习
- 《Java 8 实战》 学习笔记一(行为参数化)
- [Render] Unity SRP 概述:可编写脚本的渲染管道
- Windows 7 Sp1 x64 无法安装英文语言包(已解决)
- Python 提示‘Unindent amount does not match previous indent‘解决方法
- 数据中台POC演示流程
- 真的会有大牛市吗老大?前提条件是破2万美刀,差一刀都不行!
- java获取请求ip的方法
- 创业需要宽广的心胸吗--leo看赢在中国第三季(6)
- 成熟男人的处事说话技巧
- 2022秋季信息安全技术(期末复习2)
- C++学习(二一一)英伟达和七彩虹
- 微信公众号:微信H5页面JSAPI充值
- 蓝色满天星中的小白兔
- react小项目 - canvas海报生成器
热门文章
- 王长震《非财务经理的财务管理沙盘推演课程》
- 人民银行支付系统(CNAPS)和中国银联下面的跨行支付系统是一回事儿吗
- .Net程序员学用Oracle系列(18):PLSQL Developer 攻略
- 芯片烧录软件Android版,HiTool官方版
- excel的VBA编程环境VBE更换错误字体后设置闪退
- cad刷新快捷键_掌握了这些实用的CAD技巧,比别人出图快一小时不止
- 小说PHP最新源码,2019最新PTCMS小说精美多风格四套全新版源码+模板
- 麻省理工18年春软件构造课程阅读11“抽象函数与表示不变量”
- SSM框架面试题整理
- GoF的23种设计模式分类概念