Re-ID数据集介绍
文章目录
- 一、Market1501
- 描述:
- 目录结构
- 命名规则:
- 干扰数据集:
- 二、DukeMTMC-reID
- 描述
- 目录结构
- 命名规则:
- 三、MSMT17_V2
- 描述
- 目录结构
一、Market1501
论文链接
描述:
Market1501数据集示例图像。所有图像为128*64。(上)具有独特外观的行人(中)外观相似的行人(下)干扰图像和无用图像
共6台摄像机放在校园超市前面,其中包括5台1280*1080高清摄像机和1台720*576 SD摄像机,这些摄像头之间存在重叠,该数据集包含1306个行人的32668个包围框。 由于开放的环境,每个行人的图像最多由六台摄像机拍摄。我们确保每个标注的行人都至少由两台摄像头拍摄,以便进行跨摄像头搜索。
数据集被随机分为训练集和测试集,分别包含750和751个行人。训练集有 751 人,包含 12,936 张图像,平均每个人有 17.2 张训练数据;测试集有 750 人,包含 19,732 张图像,平均每个人有 26.3 张测试数据。3368 张查询图像的行人检测矩形框是人工绘制的,而 gallery 中的行人检测矩形框则是使用DPM检测器检测得到的。该数据集提供的固定数量的训练集和测试集均可以在single-shot或multi-shot测试设置下使用。在测试过程中,对于每个行人,我们在每台摄像机中选择一个查询图像。请注意,所选的查询是手绘的,而不是像在gallery中那样用DPM检测。原因在于,实际上,交互式绘制一个包围框非常方便,它可以产生更高的识别准确度[20]。搜索过程以跨摄像机模式执行,即,与查询一样来自同一摄像机捕获的相关图像被视为“无效”。在这种情况下,一个行人最多有6个查询,总共有3368个查询图像。
目录结构
1) “bounding_box_test”——用于测试集的 750 人,包含 19,732 张图像,前缀为 0000 表示在提取这 750 人的过程中DPM检测错的图(可能与query是同一个人),-1 表示检测出来其他人的图(不在这 750 人中)
2) “bounding_box_train”——用于训练集的 751 人,包含 12,936 张图像
3) “query”——为 750 人在每个摄像头中随机选择一张图像作为query,因此一个人的query最多有 6 个,共有 3,368 张图像
4) “gt_query”——matlab格式,用于判断一个query的哪些图片是好的匹配(同一个人不同摄像头的图像)和不好的匹配(同一个人同一个摄像头的图像或非同一个人的图像)
5) “gt_bbox”——手工标注的bounding box,用于判断DPM检测的bounding box是不是一个好的box
命名规则:
以 0001_c1s1_000151_01.jpg 为例
1) 0001 表示每个人的标签编号,从0001到1501;
2) c1 表示第一个摄像头(camera1),共有6个摄像头;
3) s1 表示第一个录像片段(sequece1),每个摄像机都有数个录像段;
4) 000151 表示 c1s1 的第000151帧图片,视频帧率25fps;
5) 01 表示 c1s1_001051 这一帧上的第1个检测框,由于采用DPM检测器,对于每一帧上的行人可能会框出好几个bbox。00 表示手工标注框
干扰数据集:
在Market-1501数据集基础上增加了一个额外的干扰集。该数据集包含超过500,000个包围框,包含背景虚假警报以及不属于1,501个标注行人的行人。在实验中,除了Market-1501数据集外,我们还将报告拓展的Market-1501 + 500K数据集的结果。
二、DukeMTMC-reID
描述
原始数据集包含了85分钟的高分辨率视频,采集自8个不同的摄像头。并且提供了人工标注的bounding box.我们从视频中每120帧采样一张图像,得到了 36,411张图像。一共有1,404个人出现在大于两个摄像头下,有408个人只出现在一个摄像头下。所以我们随机采样了 702 个人作为训练集,702个人作为测试集。在测试集中,我们采样了每个ID的每个摄像头下的一张照片作为 查询图像(query)。剩下的图像加入测试的 搜索库(gallery),并且将之前的 408人作为干扰项,也加到 gallery中。
最终,DukeMTMC-reID 包含了 16,522张训练图片(来自702个人), 2,228个查询图像(来自另外的702个人),以及 17,661 张图像的搜索库(gallery)。并提供切割后的图像供下载。
目录结构
命名规则:
“0005_c2_f0046985.jpg”, “0005” 代表行人的身份. "c2"代表这张图像来自第二个摄像头. “f0046985” 代表来自摄像头2的 第46985帧.
三、MSMT17_V2
描述
MSMT17,即Multi-Scene Multi-Time,涵盖了多场景多时段。
数据集采用了安防在校园内的15个摄像头网络,其中包含12个户外摄像头和3个室内摄像头。为了采集原始监控视频,在一个月里选择了具有不同天气条件的4天。每天采集3个小时的视频,涵盖了早上、中午、下午三个时间段。因此,总共的原始视频时长为180小时。
基于Faster RCNN作为行人检测器,三位人工标注员用了两个月时间查看检测到的包围框和标注行人标签。最终,得到4101个行人的126441个包围框。
按照训练-测试为1:3的比例对数据集进行随机划分,而不是像其他数据集一样均等划分。这样做的目的是鼓励高效率的训练策略,由于在真实应用中标注数据的昂贵。
训练集包含1041个行人共32621个包围框,而测试集包括3060个行人共93820个包围框。对于测试集,11659个包围框被随机选出来作为query,而其它82161个包围框作为gallery.
目录结构
Re-ID数据集介绍相关推荐
- GCN(一)数据集介绍
1.数据集介绍 1.1 数据集概述 Cora数据集由机器学习论文组成,是近年来图深度学习很喜欢使用的数据集.在数据集中,论文分为以下七类之一: 基于案例 遗传算法 神经网络 概率方法 强化学习 规则学 ...
- camvid数据集介绍_深度学习图像数据集介绍(MSCOCO)
深度学习图像数据集介绍(MSCOCO) MSCOCO数据集是微软开发维护的大型图像数据集,次数聚集的任务包括识别(recognition),分割(segementation),及检测(detectio ...
- 多目标跟踪数据集 :mot16、mot17数据集介绍
文章目录 MOT16 数据集 MOT17数据集介绍 多目标跟踪数据集 MOT16 .MOT1数据集介绍: MOT16 数据集 数据集百度网分享: 点击此处 提取码: miao 文件格式: 解压MOT1 ...
- 语义分割之VOC2012、Cityscapes数据集介绍
PASCAL-VOC2012 PASCAL-VOC2012数据集介绍官网: 参考 数据集下载地址:http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCt ...
- 目标检测实战篇1——数据集介绍(PASCAL VOC,MS COCO)
前言 前面我们讲过了目标检测的YOLO系列算法,SSD算法.从这个博文开始,我们要真实开启实战篇章.在正式介绍实战篇之前,我们需要先知道两个数据集:PASCAL VOC和COCO数据集. 一.PA ...
- Market1501数据集介绍及相关代码
Market1501数据集介绍及相关代码 1.数据集介绍 文件夹介绍 bounding_box_test:测试集,gallery bounding_box_train:训练集 query:prob g ...
- StudentLife数据集介绍
原网址:https://studentlife.cs.dartmouth.edu/ StudentLife数据集介绍 达特茅斯的学期有节奏吗? 从手机预测平均绩点(GPA) StudentLife数据 ...
- Foursquare数据集介绍
Foursquare数据集介绍 详情:https://archive.org/details/201309_foursquare_dataset_umn 下载:https://archive.org/ ...
- NLP-阅读理解:数据集介绍及预处理【SQuAD、DuReader】
一.SQuAD数据集 二.DuReader数据集 1.DuReader数据集介绍 DuReader,从名字(Du和Reader)就可以看出来,是百度整理出来的阅读理解数据集. DuRader数据集由一 ...
- TIMIT数据集介绍
对于做语音识别的人可以看看: TIMIT数据集是来自美国630个人每个人说十个给定的句子,每一个句子都有标记 TIMIT数据集介绍 如:这篇博客:http://blog.csdn.net/jie889 ...
最新文章
- 微信小程序记账应用实例课程(完结)——对接服务端账目CRUD
- python 搭建登陆系统_Django 搭建CMDB系统完整[1](用户登录)
- Boost:bind绑定右值的测试程序
- 可怕!那些你看不到的进程
- matlab中gatbx工具箱的添加
- image to pdf
- 从714里连续减去6减几次得0_数学干货 | 小学数学1—6年级基础知识整理 ,预习复习都能用...
- php微信40037,服务号发送模板消息问题,错误码:40037
- 【赛尔笔记】病患相似度度量简述
- 聊聊spring for kafka对consumer的封装与集成 1
- oracle函数 TO_MULTI_BYTE(c1)
- 知己知彼-关于Oracle安全比特币勒索问题揭秘和防范
- 用.iso文件从硬盘安装redhatlinux7.3(转)
- 面试笔试整理3:深度学习机器学习面试问题准备(必会)
- 【攻防世界 level2】
- StringUtil工具类
- uni-app - 禁用 APP 横屏旋转(用户操作行为)
- PLY文档翻译——利用Python进行词法和语法分析
- 通过数据:提升用户转化与留存全攻略
- iOS开发 转屏控制 (shouldAutorotate/supportedInterfaceOrientations)不起作用
热门文章
- Mysql索引原理剖析与优化策略
- securecrt7.0破解版安装与注册机的使用方法
- 项目管理:可视化表单界面设计器
- mysql语言的特点不包括_SQL数据库题库及答案
- python clr createinstance_Python System.Byte方法代码示例
- 交叉验证(Cross Validation)最详解
- java针刺治疗尿潴留_针刺治疗中风后尿潴留优势病例分析
- 拦截器、过滤器、监听器的区别和使用
- zzuli OJ 1118:小明的调查作业
- 【ESP32-C3 系列芯片 技术规格书学习笔记 (二、原理图)】