【SSD论文解读】 论文中用到的数据集:Pascal VOC、MS COCO、ImageNet
【SSD论文解读】 论文中用到的数据集
- 一、数据集介绍
- 1、Pascal VOC
- 2、MS COCO
- 3、ILSVRC
- 二、数据集处理函数
- 1、专门的datasets类
- 2、论文中的数据集处理函数
- 三、训练时,三种数据集上学习率等参数的修改
- 四、Pascal voc、COCO上,多种模型mAP对比
- 1、Pascal voc
- 2、COCO
一、数据集介绍
SSD 论文中使用到的数据集有3个:
1、Pascal VOC
用于图像分类和目标检测两个任务的基准测试,主要由VOC 2007和VOC 2012两部分组成,每部分包含20个常见类别。前者包含5011张训练和验证图像,4952张测试图像;后者包含11540张训练和验证图像,10991张测试图像。
详见:PASCAL VOC2012 数据集详解
VOC 2007文件结构
2、MS COCO
用于目标检测与实例分割、人体关键点检测、材料识别、全景分割、图像描述。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。
详见:COCO数据集解析、Dataset之COCO数据集:COCO数据集的简介、下载
3、ILSVRC
是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平,主要项目有图像分类与目标定位、目标检测、视频目标检测、场景分类。
使用ImageNet数据集,包含了超过1400万张全尺寸的有标记图片。ILSVRC比赛会每年从ImageNet数据集中抽出部分样本,以2012年为例,比赛的训练集包含1281167张图片,验证集包含50000张图片,测试集为100000张图片。
详见:ILSVRC竞赛详细介绍(ImageNet Large Scale Visual Recognition Challenge)
二、数据集处理函数
1、专门的datasets类
pytorch针对一些数据集有专门的datasets类,以datasets.VOCDetection为例。来源:pytorch读取VOC数据之VOCDetection
import torchvision.datasets as datasets
voc_trainset = datasets.VOCDetection('G:/jupyter/demo_voc',year='2007', image_set='train', download=False)
print(len(voc_trainset))
2、论文中的数据集处理函数
详见:目标检测算法之SSD的数据增强策略
三、训练时,三种数据集上学习率等参数的修改
四、Pascal voc、COCO上,多种模型mAP对比
1、Pascal voc
2、COCO
【SSD论文解读】 论文中用到的数据集:Pascal VOC、MS COCO、ImageNet相关推荐
- 目标检测数据集PASCAL VOC简介
简介 PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛, PASCAL全称:Pattern Analysis, Stat ...
- 目标检测数据集-Pascal VOC 数据集介绍
个人微信公众号:AI研习图书馆 ID:(Art-Intelligence) 欢迎关注,交流学习,共同进步~ 1.引言 PASCAL VOC数据集,为图像识别和分类提供了一整套标准化的优秀数据集,从20 ...
- 目标检测任务中常用的数据集格式(voc、coco、yolo)
在目标检测任务中,常见的数据集格式有三种,分别为voc(xml).coco(json).yolo(txt). 一.Pascal VOC Pascal VOC数据集是目标检测的常用的大规模数据集之一,从 ...
- 目标检测经典论文——R-FCN论文翻译(中英文对照版):Object Detection via Region-based Fully Convolutional Networks
目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[R-FCN纯中文版] R-FCN: Object Detection via Regio ...
- Fashion-Gen: The Generative Fashion Dataset and Challenge 论文解读数据集介绍
FashionGEN数据集使用 论文解读 数据集划分 类别介绍 图片统计 文本描述 chanllenge 评估方法 数据集下载 分析代码 内容分析 可视化数据 论文解读 论文地址:https://ar ...
- Face Super-Resolution Guided by 3D Facial Priors(ECCV2020)论文解读
Face Super-Resolution Guided by 3D Facial Priors(ECCV2020)论文解读 论文地址:https://arxiv.org/pdf/2007.09454 ...
- 论文解读《Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision》
论文解读<带有交叉伪监督的半监督式语义分割法> 论文出处:CVPR2021 论文地址:论文地址 代码地址:代码地址 一 摘要: (1) 本文通过研究有标签数据和无标签数据,研究了半监督语义 ...
- 【AI】《ResNet》论文解读、代码实现与调试找错
前言 残差网络Resnet,被誉为撑起计算机视觉半边天的文章,重要性不言而喻.另外,文章作者何凯明,在2022年AI 2000人工智能最具影响力学者排行里排名第一: 为什么这篇文章影响力这么大呢? 通 ...
- Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation论文解读
(CVPR 2020|中科院VIPL实验室) 1.要解决的问题: 基于类别标签的弱监督语义分割是一个具有挑战性的问题,类别响应图(class activation map,简称CAM)始终是这一领域的 ...
最新文章
- 完整复现何恺明ICCV获奖论文结果并开源 !(附论文开源代码)
- 算法的sound和complete
- Nginx.代理MySQL
- python应该安装哪一个_python安装到哪个盘
- 冲杯咖啡,谈谈计算机cpu
- wxWidgets:wxToolBar 示例
- Linux文件句柄限制总结
- 分布式数据库管理系统介绍
- 基于代价函数小波脊相位的MFSK信号符号速率估计MATLAB仿真及代码(2020.12.14更新)
- 1154. 一年中的第几天 golang
- Android零基础入门第86节:探究Fragment生命周期
- 数据结构与算法 —— 向量的扩容策略与分摊时间复杂度
- CCleaner v5.73.8130 发布,系统清理工具
- html如何加载ae做好的,AE转JS动画,lottie.js和bodymovin的简易使用心得
- 2)MFC对话框程序设计
- 哈工大车万翔团队:口语语言理解的最新进展与前沿
- ShuffleNet 算法的介绍
- 2022网易最新版本将军令算法刨析(2)
- Linux dnf使用记录
- Spring创建对象基本过程