【SSD论文解读】 论文中用到的数据集

  • 一、数据集介绍
    • 1、Pascal VOC
    • 2、MS COCO
    • 3、ILSVRC
  • 二、数据集处理函数
    • 1、专门的datasets类
    • 2、论文中的数据集处理函数
  • 三、训练时,三种数据集上学习率等参数的修改
  • 四、Pascal voc、COCO上,多种模型mAP对比
    • 1、Pascal voc
    • 2、COCO

一、数据集介绍

SSD 论文中使用到的数据集有3个:

1、Pascal VOC

用于图像分类目标检测两个任务的基准测试,主要由VOC 2007VOC 2012两部分组成,每部分包含20个常见类别。前者包含5011张训练和验证图像,4952张测试图像;后者包含11540张训练和验证图像,10991张测试图像。

详见:PASCAL VOC2012 数据集详解

VOC 2007文件结构

2、MS COCO

用于目标检测与实例分割、人体关键点检测、材料识别、全景分割、图像描述。图像包括91类目标,328,000影像和2,500,000个label。目前为止有语义分割的最大数据集,提供的类别有80类,有超过33 万张图片,其中20 万张有标注,整个数据集中个体的数目超过150 万个。

详见:COCO数据集解析、Dataset之COCO数据集:COCO数据集的简介、下载

3、ILSVRC

是近年来机器视觉领域最受追捧也是最具权威的学术竞赛之一,代表了图像领域的最高水平,主要项目有图像分类与目标定位、目标检测、视频目标检测、场景分类

使用ImageNet数据集,包含了超过1400万张全尺寸的有标记图片。ILSVRC比赛会每年从ImageNet数据集中抽出部分样本,以2012年为例,比赛的训练集包含1281167张图片,验证集包含50000张图片,测试集为100000张图片。

详见:ILSVRC竞赛详细介绍(ImageNet Large Scale Visual Recognition Challenge)

二、数据集处理函数

1、专门的datasets类

pytorch针对一些数据集有专门的datasets类,以datasets.VOCDetection为例。来源:pytorch读取VOC数据之VOCDetection

import torchvision.datasets as datasets
voc_trainset = datasets.VOCDetection('G:/jupyter/demo_voc',year='2007', image_set='train', download=False)
print(len(voc_trainset))

2、论文中的数据集处理函数

详见:目标检测算法之SSD的数据增强策略

三、训练时,三种数据集上学习率等参数的修改

四、Pascal voc、COCO上,多种模型mAP对比

1、Pascal voc


2、COCO

【SSD论文解读】 论文中用到的数据集:Pascal VOC、MS COCO、ImageNet相关推荐

  1. 目标检测数据集PASCAL VOC简介

    简介 PASCAL VOC挑战赛 (The PASCAL Visual Object Classes )是一个世界级的计算机视觉挑战赛, PASCAL全称:Pattern Analysis, Stat ...

  2. 目标检测数据集-Pascal VOC 数据集介绍

    个人微信公众号:AI研习图书馆 ID:(Art-Intelligence) 欢迎关注,交流学习,共同进步~ 1.引言 PASCAL VOC数据集,为图像识别和分类提供了一整套标准化的优秀数据集,从20 ...

  3. 目标检测任务中常用的数据集格式(voc、coco、yolo)

    在目标检测任务中,常见的数据集格式有三种,分别为voc(xml).coco(json).yolo(txt). 一.Pascal VOC Pascal VOC数据集是目标检测的常用的大规模数据集之一,从 ...

  4. 目标检测经典论文——R-FCN论文翻译(中英文对照版):Object Detection via Region-based Fully Convolutional Networks

    目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[R-FCN纯中文版] R-FCN: Object Detection via Regio ...

  5. Fashion-Gen: The Generative Fashion Dataset and Challenge 论文解读数据集介绍

    FashionGEN数据集使用 论文解读 数据集划分 类别介绍 图片统计 文本描述 chanllenge 评估方法 数据集下载 分析代码 内容分析 可视化数据 论文解读 论文地址:https://ar ...

  6. Face Super-Resolution Guided by 3D Facial Priors(ECCV2020)论文解读

    Face Super-Resolution Guided by 3D Facial Priors(ECCV2020)论文解读 论文地址:https://arxiv.org/pdf/2007.09454 ...

  7. 论文解读《Semi-Supervised Semantic Segmentation with Cross Pseudo Supervision》

    论文解读<带有交叉伪监督的半监督式语义分割法> 论文出处:CVPR2021 论文地址:论文地址 代码地址:代码地址 一 摘要: (1) 本文通过研究有标签数据和无标签数据,研究了半监督语义 ...

  8. 【AI】《ResNet》论文解读、代码实现与调试找错

    前言 残差网络Resnet,被誉为撑起计算机视觉半边天的文章,重要性不言而喻.另外,文章作者何凯明,在2022年AI 2000人工智能最具影响力学者排行里排名第一: 为什么这篇文章影响力这么大呢? 通 ...

  9. Self-supervised Equivariant Attention Mechanism for Weakly Supervised Semantic Segmentation论文解读

    (CVPR 2020|中科院VIPL实验室) 1.要解决的问题: 基于类别标签的弱监督语义分割是一个具有挑战性的问题,类别响应图(class activation map,简称CAM)始终是这一领域的 ...

最新文章

  1. 完整复现何恺明ICCV获奖论文结果并开源 !(附论文开源代码)
  2. 算法的sound和complete
  3. Nginx.代理MySQL
  4. python应该安装哪一个_python安装到哪个盘
  5. 冲杯咖啡,谈谈计算机cpu
  6. wxWidgets:wxToolBar 示例
  7. Linux文件句柄限制总结
  8. 分布式数据库管理系统介绍
  9. 基于代价函数小波脊相位的MFSK信号符号速率估计MATLAB仿真及代码(2020.12.14更新)
  10. 1154. 一年中的第几天 golang
  11. Android零基础入门第86节:探究Fragment生命周期
  12. 数据结构与算法 —— 向量的扩容策略与分摊时间复杂度
  13. CCleaner v5.73.8130 发布,系统清理工具
  14. html如何加载ae做好的,AE转JS动画,lottie.js和bodymovin的简易使用心得
  15. 2)MFC对话框程序设计
  16. 哈工大车万翔团队:口语语言理解的最新进展与前沿
  17. ShuffleNet 算法的介绍
  18. 2022网易最新版本将军令算法刨析(2)
  19. Linux dnf使用记录
  20. Spring创建对象基本过程

热门文章

  1. MySQL 的优化和架构
  2. Oracle官网所有JDK及JRE历史版本下载地址
  3. 华为S交换机堆叠配置大全
  4. 歌曲信息管理系统c语言代码,歌曲信息管理系统_通用完整版.doc
  5. 安防监控中网络摄像机接入拼接屏中HDMI矩阵的实际案例分析!
  6. 01_I.MX6U芯片简介
  7. linux基础知识之磁盘管理及文件系统
  8. 新宝资讯市场最强热点
  9. 个人简历”的Resume(java封装类)
  10. ubuntu 无线网卡 断网重连 教程