人群计数主流数据集介绍

  • 一、ShanghaiTech Part A/B
  • 二、NWPU-Crowd
  • 三、JHU_CROWD++
  • 四、UCF-QNRF
  • 五、待更新

一、ShanghaiTech Part A/B

  1. A: 共计482张图片,其中训练集300张,测试集182张;图片格式为.jpg,平均分辨率为589×868589 \times 868589×868,标签格式为.mat

    • 训练集中最小图片尺寸为299×450299 \times 450299×450(IMG_157.jpg)或者420×182420 \times 182420×182(IMG_135.jpg),最大图片尺寸为1024×10241024 \times 10241024×1024(IMG_57.jpg)
    • 训练集中含有111111张灰度图片和141414张竖屏图片;
    • 无验证集
    • 测试集中最小图片尺寸为293×438293 \times 438293×438(IMG_138.jpg)或者300×200300 \times 200300×200(IMG_34.jpg),最大图片尺寸为1024×9421024 \times 9421024×942(IMG_23.jpg)或者992×1024992 \times 1024992×1024(IMG_50.jpg)
    • 测试集中含有999张灰度图片和666张竖屏图片;
  2. B: 共计716张图片,其中训练集400张,测试集316张;图片格式为.jpg,平均分辨率为768×1024768 \times 1024768×1024,标签格式为.mat
    • 训练集中图片尺寸均为为1024×7681024 \times 7681024×768;无灰度图片;
    • 无验证集
    • 测试集中图片尺寸均为为1024×7681024 \times 7681024×768;无灰度图片;
  3. ShanghaiTech数据集主页;

二、NWPU-Crowd

  1. 共计5109张图片,其中训练集3109张,验证集500张,测试集1500张;
  2. 图片格式为.jpg,标签格式为.json.mat
  3. 平均分辨率为2191×32092191 \times 32092191×3209:
    • 训练集中最小图片尺寸为259×194259 \times 194259×194(0216.jpg),最大图片尺寸为19044×402819044 \times 402819044×4028(2503.jpg)或者9302×62029302 \times 62029302×6202(0742.jpg)
    • 训练集中含有000张灰度图片和145145145张竖屏图片;
    • 验证集中最小图片尺寸为640×384640 \times 384640×384(3503.jpg),最大图片尺寸为10800×233210800 \times 233210800×2332(3173.jpg)或者4480×67204480 \times 67204480×6720(3588.jpg)
    • 验证集中含有000张灰度图片和232323张竖屏图片;
    • 测试集中最小图片尺寸为260×194260 \times 194260×194(4868.jpg),最大图片尺寸为9443×32369443 \times 32369443×3236(4933.jpg)或者4480×67204480 \times 67204480×6720(3621.jpg)
    • 测试集中含有000张灰度图片和797979张竖屏图片;
  4. trainvalidate目录下分别有一个train.txtvalidate.txt文档,文档打开后每一行有三列,第一列为image_id,第二列为luminance label,第三列为scene leveltest.txt文档只有一列,为image_id
  5. 值得注意的是,测试集不含标签,需在线评估:
    • 对于计数任务,提交文件为.txt文件,包含1500行,每行第一项是测试集图像的文件名(不含后缀),第二项是人数预测值(float类型),中间用一个空格隔开;
    • 对于定位任务,提交文件为.txt文件,包含1500行,每行第一项是测试集图像的文件名(不含后缀),第二项是人数预测值NNN(int类型),再之后是2×N2 \times N2×N个整数,表示NNN个人头的坐标位置(x,y)(x, y)(x,y),每项之间用空格隔开;
  6. NWPU数据集主页;

三、JHU_CROWD++

  1. 共计4372张图片,其中训练集2272张,验证集500张,测试集1600张;
  2. 图片格式为.jpg,标签格式为.txt
  3. 图片平均分辨率为910×1430910 \times 1430910×1430:
    • 训练集中最小图片尺寸为169×117169 \times 117169×117(2660.jpg)或者222×107222 \times 107222×107(1344.jpg),最大图片尺寸为8580×40898580 \times 40898580×4089(1243.jpg)或者7371×49147371 \times 49147371×4914(1227.jpg)
    • 训练集中含有111111张灰度图片和595959张竖屏图片;
    • 验证集中最小图片尺寸为300×208300 \times 208300×208(1325.jpg)或者750×206750 \times 206750×206(0179.jpg),最大图片尺寸为7295×18787295 \times 18787295×1878(1614.jpg)或者5760×38405760 \times 38405760×3840(3815.jpg)
    • 验证集中含有222张灰度图片和191919张竖屏图片;
    • 测试集中最小图片尺寸为232×378232 \times 378232×378(0202.jpg)或者500×130500 \times 130500×130(4271.jpg),最大图片尺寸为10088×352010088 \times 352010088×3520(4343.jpg)或者3840×57603840 \times 57603840×5760(1670.jpg)
    • 测试集中含有111111张灰度图片和474747张竖屏图片;
  4. 训练集、验证集和测试集目录下均包含222个子目录(imagesgt),以及一个文件image_labels.txt
  5. images目录下包含图像;
  6. gt目录下包含每张图像对应的.txt格式的标签,每个txt文件包含若干行,每一行有6个值x,y,w,h,o,bx, y, w, h, o, bx,y,w,h,o,b,以空格’ '分割:
    • x,yx, yx,y表示头部位置;
    • w,hw, hw,h表示头部的大致宽度和高度;
    • ooo表示遮挡等级,其取值可为1,2,31, 2, 31,2,3,分别表示 可见、部分遮挡、全遮挡;
    • bbb表示模糊登记,其取值可为0,10, 10,1,分别表示不模糊、模糊;
    • 一个典型示例为 133 229 11 17 2 0
  7. image_labels.txt文件是图像级别的注释,其每一行是对一张图像的注释,具体地,一行包含五个值,以逗号’,'分割:
    • 图片文件名;
    • 图片中总人数;
    • 场景样式,如 会议、街景、火车站、游行等;
    • 天气条件,其取值可为0,1,2,30, 1, 2, 30,1,2,3,分别表示 无特殊天气、雾霾、下雨、下雪;
    • 图像是否含有干扰,取值为000表示不含有,取值为111表示含有干扰(图中无人,为负样本;或者图中虽然有人,但背景纹理与人群相似);
    • 一个典型示例为 0092,210,railway station,0,0
  8. JHU数据集主页;

四、UCF-QNRF

  1. 共计1535张图片,其中训练集1201张,测试集334张,不含验证集
  2. 图片格式为.jpg,标签格式为.mat
  3. 平均分辨率为2013×29022013 \times 29022013×2902:
    • 训练集中最小图片尺寸为300×377300 \times 377300×377(img_1104.jpg)或者480×246480 \times 246480×246(img_1117.jpg),最大图片尺寸为7360×49127360 \times 49127360×4912(img_1073.jpg)或者6666×99996666 \times 99996666×9999(img_0137.jpg)
    • 训练集中含有111111张灰度图片和515151张竖屏图片;
    • 测试集中最小图片尺寸为400×300400 \times 300400×300(img_0289.jpg)或者500×163500 \times 163500×163(img_0100.jpg),最大图片尺寸为7360×49127360 \times 49127360×4912(img_0042.jpg)或者3456×51843456 \times 51843456×5184(img_0090.jpg)
    • 测试集中含有666张灰度图片和161616张竖屏图片;
  4. QNRF数据集主页;

五、待更新

人群计数主流数据集介绍相关推荐

  1. 西工大PAMI论文:发布大规模人群计数/定位基准平台

    近年来,安防监控在智慧城市中扮演的角色越来越重要,监控视角下的人群分析对于构建智慧城市的重要性日渐显现. 人群计数与定位作为其中的基础任务,服务于人流预测.城市规划.空间设计等高阶任务. 然而,该领域 ...

  2. 基于卷积神经网络的地铁平台人群计数

    1.文章简介 本次介绍的是一篇2021年发表的名为<ConvolutionalNeural Network for Crowd Counting on Metro Platforms>的有 ...

  3. 人群计数-SaCNN论文翻译

    论文翻译 摘要: 人群计数的任务是自动估计人群图像中的行人数目.为了应对人群图像中普遍存在的尺度和视角变化,最先进的方法是采用多列CNN架构来回归人群图像的密度图.对于不同尺度的行人(头),多列具有不 ...

  4. 人群计数数据集汇总和详细介绍,全网最全,crowd counting datasets

    Crowd Counting数据集汇总 视频监控=video surveillance https://github.com/gjy3035/Awesome-Crowd-Counting/blob/m ...

  5. 干货!面向人群计数的跨模态协作表征学习方法和大规模RBGT数据集

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 人群计数是一项基本但又十分具有挑战性的视觉任务,它需要丰富的信息来生成像素级别的人群密度图.之前的方法大多数仅使有限的用光学图像信息,在 ...

  6. ICCV19 (Oral) | 基于贝叶斯损失函数的人群计数

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文作者:洪晓鹏 https://zhuanlan.zhihu.co ...

  7. C3F:首个开源人群计数算法框架

    C3F:首个开源人群计数算法框架 导读:52CV曾经报道多篇拥挤人群计数相关的技术,比如最近的: CVPR 2019 | 西北工业大学开源拥挤人群数据集生成工具,大幅提升算法精度 开源地址: http ...

  8. 【技术短文】基于深度负相关学习的人群计数方法

    SIGAI 特邀作者:cnns 原创声明:本文为 SIGAI 原创文章,仅供个人学习使用,未经允许,不得转载,不能用于商业目的. 1.     人群计数 监控视频中的人群自动计数有着重要的社会意义和市 ...

  9. 图片人群计数模型代码运行指南

    PaperWithCode 八大数据集模型排名:https://paperswithcode.com/task/crowd-counting 搜索关键词 "人群计数"(crowd ...

最新文章

  1. 2021年大数据常用语言Scala(二十四):函数式编程 过滤  filter
  2. Java基础20:Java8新特性终极指南
  3. java中replace()和replaceAll()区别
  4. SQL 中的游标实例
  5. 中石油训练赛 - Historical Maths(二分)
  6. 如何配置代码自动校验功能
  7. wince6.0编译命令分析
  8. vue打卡日历_Vue日历
  9. Web缓存(Varnish方案)
  10. python可以替代java吗_Python 并非最好的编程语言,它无法取代 C/C++ 和 Java
  11. 织梦采集侠-dede织梦采集发布
  12. Win10截屏的几种方法介绍
  13. 爬虫工具在就业市场的受欢迎程度
  14. 深蓝卡通风人教版小学五年级英语课件PPT模板
  15. 借助AI人工智能,这家公司能让孩子快乐学琴吗?
  16. css下拉菜单汇总案例
  17. H3c Smart-link 实验
  18. 【嵌入式10】stm32CubeMX+Keil使用HAL库点灯,并使用逻辑分析仪观察周期
  19. [小说连载]张小庆,在路上(2)- 第一天上班
  20. emjoy表情插入数据库问题

热门文章

  1. 统计建模与R软件 第三章课后习题 不包含星图,调和曲线
  2. 加速,加速,再加速:来自Google的网站加速技巧大全
  3. Go :使用编译器诊断标志测试内联是否有效(附完整源码)
  4. angular的同级controller通信
  5. https证书产品价格为什么高低不一
  6. 这是我见过最好的NumPy图解教程!
  7. android项目源码
  8. c语言中sor函数,用C语言实现SOR方法.doc
  9. win7下查看计算机ID,win7系统快速查看硬件ID的操作方法
  10. glyphicon图标的使用举例