人群计数主流数据集介绍
人群计数主流数据集介绍
- 一、ShanghaiTech Part A/B
- 二、NWPU-Crowd
- 三、JHU_CROWD++
- 四、UCF-QNRF
- 五、待更新
一、ShanghaiTech Part A/B
- A: 共计482张图片,其中训练集300张,测试集182张;图片格式为
.jpg
,平均分辨率为589×868589 \times 868589×868,标签格式为.mat
;- 训练集中最小图片尺寸为299×450299 \times 450299×450
(IMG_157.jpg)
或者420×182420 \times 182420×182(IMG_135.jpg)
,最大图片尺寸为1024×10241024 \times 10241024×1024(IMG_57.jpg)
; - 训练集中含有111111张灰度图片和141414张竖屏图片;
- 无验证集
- 测试集中最小图片尺寸为293×438293 \times 438293×438
(IMG_138.jpg)
或者300×200300 \times 200300×200(IMG_34.jpg)
,最大图片尺寸为1024×9421024 \times 9421024×942(IMG_23.jpg)
或者992×1024992 \times 1024992×1024(IMG_50.jpg)
; - 测试集中含有999张灰度图片和666张竖屏图片;
- 训练集中最小图片尺寸为299×450299 \times 450299×450
- B: 共计716张图片,其中训练集400张,测试集316张;图片格式为
.jpg
,平均分辨率为768×1024768 \times 1024768×1024,标签格式为.mat
;- 训练集中图片尺寸均为为1024×7681024 \times 7681024×768;无灰度图片;
- 无验证集
- 测试集中图片尺寸均为为1024×7681024 \times 7681024×768;无灰度图片;
- ShanghaiTech数据集主页;
二、NWPU-Crowd
- 共计5109张图片,其中训练集3109张,验证集500张,测试集1500张;
- 图片格式为
.jpg
,标签格式为.json
和.mat
; - 平均分辨率为2191×32092191 \times 32092191×3209:
- 训练集中最小图片尺寸为259×194259 \times 194259×194
(0216.jpg)
,最大图片尺寸为19044×402819044 \times 402819044×4028(2503.jpg)
或者9302×62029302 \times 62029302×6202(0742.jpg)
; - 训练集中含有000张灰度图片和145145145张竖屏图片;
- 验证集中最小图片尺寸为640×384640 \times 384640×384
(3503.jpg)
,最大图片尺寸为10800×233210800 \times 233210800×2332(3173.jpg)
或者4480×67204480 \times 67204480×6720(3588.jpg)
; - 验证集中含有000张灰度图片和232323张竖屏图片;
- 测试集中最小图片尺寸为260×194260 \times 194260×194
(4868.jpg)
,最大图片尺寸为9443×32369443 \times 32369443×3236(4933.jpg)
或者4480×67204480 \times 67204480×6720(3621.jpg)
; - 测试集中含有000张灰度图片和797979张竖屏图片;
- 训练集中最小图片尺寸为259×194259 \times 194259×194
train
、validate
目录下分别有一个train.txt
、validate.txt
文档,文档打开后每一行有三列,第一列为image_id
,第二列为luminance label
,第三列为scene level
;test.txt
文档只有一列,为image_id
;- 值得注意的是,测试集不含标签,需在线评估:
- 对于计数任务,提交文件为
.txt
文件,包含1500行,每行第一项是测试集图像的文件名(不含后缀),第二项是人数预测值(float
类型),中间用一个空格隔开; - 对于定位任务,提交文件为
.txt
文件,包含1500行,每行第一项是测试集图像的文件名(不含后缀),第二项是人数预测值NNN(int
类型),再之后是2×N2 \times N2×N个整数,表示NNN个人头的坐标位置(x,y)(x, y)(x,y),每项之间用空格隔开;
- 对于计数任务,提交文件为
- NWPU数据集主页;
三、JHU_CROWD++
- 共计4372张图片,其中训练集2272张,验证集500张,测试集1600张;
- 图片格式为
.jpg
,标签格式为.txt
; - 图片平均分辨率为910×1430910 \times 1430910×1430:
- 训练集中最小图片尺寸为169×117169 \times 117169×117
(2660.jpg)
或者222×107222 \times 107222×107(1344.jpg)
,最大图片尺寸为8580×40898580 \times 40898580×4089(1243.jpg)
或者7371×49147371 \times 49147371×4914(1227.jpg)
; - 训练集中含有111111张灰度图片和595959张竖屏图片;
- 验证集中最小图片尺寸为300×208300 \times 208300×208
(1325.jpg)
或者750×206750 \times 206750×206(0179.jpg)
,最大图片尺寸为7295×18787295 \times 18787295×1878(1614.jpg)
或者5760×38405760 \times 38405760×3840(3815.jpg)
; - 验证集中含有222张灰度图片和191919张竖屏图片;
- 测试集中最小图片尺寸为232×378232 \times 378232×378
(0202.jpg)
或者500×130500 \times 130500×130(4271.jpg)
,最大图片尺寸为10088×352010088 \times 352010088×3520(4343.jpg)
或者3840×57603840 \times 57603840×5760(1670.jpg)
; - 测试集中含有111111张灰度图片和474747张竖屏图片;
- 训练集中最小图片尺寸为169×117169 \times 117169×117
- 训练集、验证集和测试集目录下均包含222个子目录(
images
,gt
),以及一个文件image_labels.txt
; images
目录下包含图像;gt
目录下包含每张图像对应的.txt
格式的标签,每个txt
文件包含若干行,每一行有6个值x,y,w,h,o,bx, y, w, h, o, bx,y,w,h,o,b,以空格’ '分割:- x,yx, yx,y表示头部位置;
- w,hw, hw,h表示头部的大致宽度和高度;
- ooo表示遮挡等级,其取值可为1,2,31, 2, 31,2,3,分别表示 可见、部分遮挡、全遮挡;
- bbb表示模糊登记,其取值可为0,10, 10,1,分别表示不模糊、模糊;
- 一个典型示例为 133 229 11 17 2 0;
image_labels.txt
文件是图像级别的注释,其每一行是对一张图像的注释,具体地,一行包含五个值,以逗号’,'分割:- 图片文件名;
- 图片中总人数;
- 场景样式,如 会议、街景、火车站、游行等;
- 天气条件,其取值可为0,1,2,30, 1, 2, 30,1,2,3,分别表示 无特殊天气、雾霾、下雨、下雪;
- 图像是否含有干扰,取值为000表示不含有,取值为111表示含有干扰(图中无人,为负样本;或者图中虽然有人,但背景纹理与人群相似);
- 一个典型示例为 0092,210,railway station,0,0;
- JHU数据集主页;
四、UCF-QNRF
- 共计1535张图片,其中训练集1201张,测试集334张,不含验证集;
- 图片格式为
.jpg
,标签格式为.mat
; - 平均分辨率为2013×29022013 \times 29022013×2902:
- 训练集中最小图片尺寸为300×377300 \times 377300×377
(img_1104.jpg)
或者480×246480 \times 246480×246(img_1117.jpg)
,最大图片尺寸为7360×49127360 \times 49127360×4912(img_1073.jpg)
或者6666×99996666 \times 99996666×9999(img_0137.jpg)
; - 训练集中含有111111张灰度图片和515151张竖屏图片;
- 测试集中最小图片尺寸为400×300400 \times 300400×300
(img_0289.jpg)
或者500×163500 \times 163500×163(img_0100.jpg)
,最大图片尺寸为7360×49127360 \times 49127360×4912(img_0042.jpg)
或者3456×51843456 \times 51843456×5184(img_0090.jpg)
; - 测试集中含有666张灰度图片和161616张竖屏图片;
- 训练集中最小图片尺寸为300×377300 \times 377300×377
- QNRF数据集主页;
五、待更新
人群计数主流数据集介绍相关推荐
- 西工大PAMI论文:发布大规模人群计数/定位基准平台
近年来,安防监控在智慧城市中扮演的角色越来越重要,监控视角下的人群分析对于构建智慧城市的重要性日渐显现. 人群计数与定位作为其中的基础任务,服务于人流预测.城市规划.空间设计等高阶任务. 然而,该领域 ...
- 基于卷积神经网络的地铁平台人群计数
1.文章简介 本次介绍的是一篇2021年发表的名为<ConvolutionalNeural Network for Crowd Counting on Metro Platforms>的有 ...
- 人群计数-SaCNN论文翻译
论文翻译 摘要: 人群计数的任务是自动估计人群图像中的行人数目.为了应对人群图像中普遍存在的尺度和视角变化,最先进的方法是采用多列CNN架构来回归人群图像的密度图.对于不同尺度的行人(头),多列具有不 ...
- 人群计数数据集汇总和详细介绍,全网最全,crowd counting datasets
Crowd Counting数据集汇总 视频监控=video surveillance https://github.com/gjy3035/Awesome-Crowd-Counting/blob/m ...
- 干货!面向人群计数的跨模态协作表征学习方法和大规模RBGT数据集
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 人群计数是一项基本但又十分具有挑战性的视觉任务,它需要丰富的信息来生成像素级别的人群密度图.之前的方法大多数仅使有限的用光学图像信息,在 ...
- ICCV19 (Oral) | 基于贝叶斯损失函数的人群计数
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文作者:洪晓鹏 https://zhuanlan.zhihu.co ...
- C3F:首个开源人群计数算法框架
C3F:首个开源人群计数算法框架 导读:52CV曾经报道多篇拥挤人群计数相关的技术,比如最近的: CVPR 2019 | 西北工业大学开源拥挤人群数据集生成工具,大幅提升算法精度 开源地址: http ...
- 【技术短文】基于深度负相关学习的人群计数方法
SIGAI 特邀作者:cnns 原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的. 1. 人群计数 监控视频中的人群自动计数有着重要的社会意义和市 ...
- 图片人群计数模型代码运行指南
PaperWithCode 八大数据集模型排名:https://paperswithcode.com/task/crowd-counting 搜索关键词 "人群计数"(crowd ...
最新文章
- 2021年大数据常用语言Scala(二十四):函数式编程 过滤 filter
- Java基础20:Java8新特性终极指南
- java中replace()和replaceAll()区别
- SQL 中的游标实例
- 中石油训练赛 - Historical Maths(二分)
- 如何配置代码自动校验功能
- wince6.0编译命令分析
- vue打卡日历_Vue日历
- Web缓存(Varnish方案)
- python可以替代java吗_Python 并非最好的编程语言,它无法取代 C/C++ 和 Java
- 织梦采集侠-dede织梦采集发布
- Win10截屏的几种方法介绍
- 爬虫工具在就业市场的受欢迎程度
- 深蓝卡通风人教版小学五年级英语课件PPT模板
- 借助AI人工智能,这家公司能让孩子快乐学琴吗?
- css下拉菜单汇总案例
- H3c Smart-link 实验
- 【嵌入式10】stm32CubeMX+Keil使用HAL库点灯,并使用逻辑分析仪观察周期
- [小说连载]张小庆,在路上(2)- 第一天上班
- emjoy表情插入数据库问题