人群计数主流数据集介绍

一、ShanghaiTech Part A/B
二、NWPU-Crowd
三、JHU_CROWD++
四、UCF-QNRF
五、待更新

一、ShanghaiTech Part A/B

A：共计482张图片，其中训练集300张，测试集182张；图片格式为.jpg，平均分辨率为589×868589 \times 868589×868，标签格式为.mat；
- 训练集中最小图片尺寸为299×450299 \times 450299×450(IMG_157.jpg)或者420×182420 \times 182420×182(IMG_135.jpg)，最大图片尺寸为1024×10241024 \times 10241024×1024(IMG_57.jpg)；
- 训练集中含有111111张灰度图片和141414张竖屏图片；
- 无验证集
- 测试集中最小图片尺寸为293×438293 \times 438293×438(IMG_138.jpg)或者300×200300 \times 200300×200(IMG_34.jpg)，最大图片尺寸为1024×9421024 \times 9421024×942(IMG_23.jpg)或者992×1024992 \times 1024992×1024(IMG_50.jpg)；
- 测试集中含有999张灰度图片和666张竖屏图片；
B：共计716张图片，其中训练集400张，测试集316张；图片格式为.jpg，平均分辨率为768×1024768 \times 1024768×1024，标签格式为.mat；
- 训练集中图片尺寸均为为1024×7681024 \times 7681024×768；无灰度图片；
- 无验证集
- 测试集中图片尺寸均为为1024×7681024 \times 7681024×768；无灰度图片；
ShanghaiTech数据集主页；

二、NWPU-Crowd

共计5109张图片，其中训练集3109张，验证集500张，测试集1500张；
图片格式为.jpg，标签格式为.json和.mat；
平均分辨率为2191×32092191 \times 32092191×3209：
- 训练集中最小图片尺寸为259×194259 \times 194259×194(0216.jpg)，最大图片尺寸为19044×402819044 \times 402819044×4028(2503.jpg)或者9302×62029302 \times 62029302×6202(0742.jpg)；
- 训练集中含有000张灰度图片和145145145张竖屏图片；
- 验证集中最小图片尺寸为640×384640 \times 384640×384(3503.jpg)，最大图片尺寸为10800×233210800 \times 233210800×2332(3173.jpg)或者4480×67204480 \times 67204480×6720(3588.jpg)；
- 验证集中含有000张灰度图片和232323张竖屏图片；
- 测试集中最小图片尺寸为260×194260 \times 194260×194(4868.jpg)，最大图片尺寸为9443×32369443 \times 32369443×3236(4933.jpg)或者4480×67204480 \times 67204480×6720(3621.jpg)；
- 测试集中含有000张灰度图片和797979张竖屏图片；
train、validate目录下分别有一个train.txt、validate.txt文档，文档打开后每一行有三列，第一列为image_id，第二列为luminance label，第三列为scene level；test.txt文档只有一列，为image_id；
值得注意的是，测试集不含标签，需在线评估：
- 对于计数任务，提交文件为.txt文件，包含1500行，每行第一项是测试集图像的文件名（不含后缀），第二项是人数预测值（float类型），中间用一个空格隔开；
- 对于定位任务，提交文件为.txt文件，包含1500行，每行第一项是测试集图像的文件名（不含后缀），第二项是人数预测值NNN（int类型），再之后是2×N2 \times N2×N个整数，表示NNN个人头的坐标位置(x,y)(x, y)(x,y)，每项之间用空格隔开；
NWPU数据集主页；

三、JHU_CROWD++

共计4372张图片，其中训练集2272张，验证集500张，测试集1600张；
图片格式为.jpg，标签格式为.txt；
图片平均分辨率为910×1430910 \times 1430910×1430：
- 训练集中最小图片尺寸为169×117169 \times 117169×117(2660.jpg)或者222×107222 \times 107222×107(1344.jpg)，最大图片尺寸为8580×40898580 \times 40898580×4089(1243.jpg)或者7371×49147371 \times 49147371×4914(1227.jpg)；
- 训练集中含有111111张灰度图片和595959张竖屏图片；
- 验证集中最小图片尺寸为300×208300 \times 208300×208(1325.jpg)或者750×206750 \times 206750×206(0179.jpg)，最大图片尺寸为7295×18787295 \times 18787295×1878(1614.jpg)或者5760×38405760 \times 38405760×3840(3815.jpg)；
- 验证集中含有222张灰度图片和191919张竖屏图片；
- 测试集中最小图片尺寸为232×378232 \times 378232×378(0202.jpg)或者500×130500 \times 130500×130(4271.jpg)，最大图片尺寸为10088×352010088 \times 352010088×3520(4343.jpg)或者3840×57603840 \times 57603840×5760(1670.jpg)；
- 测试集中含有111111张灰度图片和474747张竖屏图片；
训练集、验证集和测试集目录下均包含222个子目录（images，gt），以及一个文件image_labels.txt；
images目录下包含图像；
gt目录下包含每张图像对应的.txt格式的标签，每个txt文件包含若干行，每一行有6个值x,y,w,h,o,bx, y, w, h, o, bx,y,w,h,o,b，以空格’ '分割：
- x,yx, yx,y表示头部位置；
- w,hw, hw,h表示头部的大致宽度和高度;
- ooo表示遮挡等级，其取值可为1,2,31, 2, 31,2,3，分别表示可见、部分遮挡、全遮挡；
- bbb表示模糊登记，其取值可为0,10, 10,1，分别表示不模糊、模糊；
- 一个典型示例为 133 229 11 17 2 0；
image_labels.txt文件是图像级别的注释，其每一行是对一张图像的注释，具体地，一行包含五个值，以逗号’,'分割：
- 图片文件名；
- 图片中总人数；
- 场景样式，如会议、街景、火车站、游行等；
- 天气条件，其取值可为0,1,2,30, 1, 2, 30,1,2,3，分别表示无特殊天气、雾霾、下雨、下雪；
- 图像是否含有干扰，取值为000表示不含有，取值为111表示含有干扰（图中无人，为负样本；或者图中虽然有人，但背景纹理与人群相似）；
- 一个典型示例为 0092,210,railway station,0,0；
JHU数据集主页；

四、UCF-QNRF

共计1535张图片，其中训练集1201张，测试集334张，不含验证集；
图片格式为.jpg，标签格式为.mat；
平均分辨率为2013×29022013 \times 29022013×2902：
- 训练集中最小图片尺寸为300×377300 \times 377300×377(img_1104.jpg)或者480×246480 \times 246480×246(img_1117.jpg)，最大图片尺寸为7360×49127360 \times 49127360×4912(img_1073.jpg)或者6666×99996666 \times 99996666×9999(img_0137.jpg)；
- 训练集中含有111111张灰度图片和515151张竖屏图片；
- 测试集中最小图片尺寸为400×300400 \times 300400×300(img_0289.jpg)或者500×163500 \times 163500×163(img_0100.jpg)，最大图片尺寸为7360×49127360 \times 49127360×4912(img_0042.jpg)或者3456×51843456 \times 51843456×5184(img_0090.jpg)；
- 测试集中含有666张灰度图片和161616张竖屏图片；
QNRF数据集主页；

五、待更新

人群计数主流数据集介绍相关推荐

西工大PAMI论文：发布大规模人群计数/定位基准平台
近年来,安防监控在智慧城市中扮演的角色越来越重要,监控视角下的人群分析对于构建智慧城市的重要性日渐显现. 人群计数与定位作为其中的基础任务,服务于人流预测.城市规划.空间设计等高阶任务. 然而,该领域 ...
基于卷积神经网络的地铁平台人群计数
1.文章简介本次介绍的是一篇2021年发表的名为<ConvolutionalNeural Network for Crowd Counting on Metro Platforms>的有 ...
人群计数-SaCNN论文翻译
论文翻译摘要: 人群计数的任务是自动估计人群图像中的行人数目.为了应对人群图像中普遍存在的尺度和视角变化,最先进的方法是采用多列CNN架构来回归人群图像的密度图.对于不同尺度的行人(头),多列具有不 ...
人群计数数据集汇总和详细介绍,全网最全，crowd counting datasets
Crowd Counting数据集汇总视频监控=video surveillance https://github.com/gjy3035/Awesome-Crowd-Counting/blob/m ...
干货！面向人群计数的跨模态协作表征学习方法和大规模RBGT数据集
点击蓝字关注我们 AI TIME欢迎每一位AI爱好者的加入! 人群计数是一项基本但又十分具有挑战性的视觉任务,它需要丰富的信息来生成像素级别的人群密度图.之前的方法大多数仅使有限的用光学图像信息,在 ...
ICCV19 (Oral) | 基于贝叶斯损失函数的人群计数
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达本文作者:洪晓鹏 https://zhuanlan.zhihu.co ...
C3F：首个开源人群计数算法框架
C3F:首个开源人群计数算法框架导读:52CV曾经报道多篇拥挤人群计数相关的技术,比如最近的: CVPR 2019 | 西北工业大学开源拥挤人群数据集生成工具,大幅提升算法精度开源地址: http ...
【技术短文】基于深度负相关学习的人群计数方法
SIGAI 特邀作者:cnns 原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的. 1. 人群计数监控视频中的人群自动计数有着重要的社会意义和市 ...
图片人群计数模型代码运行指南
PaperWithCode 八大数据集模型排名:https://paperswithcode.com/task/crowd-counting 搜索关键词 "人群计数"(crowd ...

人群计数主流数据集介绍

人群计数主流数据集介绍

一、ShanghaiTech Part A/B

二、NWPU-Crowd

三、JHU_CROWD++

四、UCF-QNRF

五、待更新

人群计数主流数据集介绍相关推荐

最新文章

热门文章