[转]【数据集整理】人体行为识别和图像识别

原文链接https://blog.csdn.net/liuxiao214/article/details/78889662

一共12个人体行为识别的数据集,基于视频的;

6个图像识别的,有关物体识别、行人识别、年龄识别和人头检测的,基于图像,图像识别数据集参考于博客:http://blog.csdn.net/qq_14845119/article/details/51913171

后续可能还会补充。


视频识别


1、Weizmann

内容:

1、10个类别,每个类别9个视频,背景单一。
2、180x144

下载链接: http://www.wisdom.weizmann.ac.il/~vision/SpaceTimeActions.html


2、KTH

内容:

1、共25个人采集,6个类别,每个类别4个情境,3中室外,1种室内,共600个视频。
2、给出了每个视频4个片段的始末帧位置。
3、规格:160x120,25fps。

下载链接: http://www.nada.kth.se/cvap/actions/

自己整理了一份放在百度云,
链接:https://pan.baidu.com/s/1cMhy1nW76dFIcOK0RjlkQw 密码:naw4,

有效期7天


3、Fire Detection

内容: 共6个视频,火灾检测。

下载链接: http://crcv.ucf.edu/data/fire.php


4、UCF101

内容:

1、共13320个视频101个类别,从YouTube采集的真实场景。
2、分为5大类:人与物交互、baby动作、人人交互、乐器演奏、运动。
3、规格:320x240,25fps,最小视频为28帧。

下载链接: http://crcv.ucf.edu/data/UCF101.php


5、HMDB51

内容:

1、共51个类别,6849个视频。每一个类别至少包含101个视频。
2、从电影、视频网站上采集。
3、包含5大类:面部动作(微笑、大笑、咀嚼、说话);面部与物交互动作(吃饭、喝水、抽烟);身体运动(翻跟斗、拍手、爬上等);身体与物交互运动(梳头发、拔剑等);人人交互运动(击剑、拥抱、接吻等)

下载链接: http://serre-lab.clps.brown.edu/resource/hmdb-a-large-human-motion-database/#dataset


6、VISAL

内容:

1、包含很多数据集,船只数据、纹理合成数据、交通拥挤数据、拥挤人群数据UCSD(行人、人注释、人数、线划分)、人3D姿态数据MADS。
2、可下载拥挤人群和人姿态。

下载链接: http://visal.cs.cityu.edu.hk/downloads/


7、Monitoring Human Activity

内容:

1、数据量很小,且需要单独下载,有空可下载。

下载链接: http://mha.cs.umn.edu/index.shtml


8、HOLLYWOOD2

内容:

1、人体动作:12个类别。
2、场景:10个类别。
3、共3669个视频,20.1个小时。
4、从69部电影中采集。
5、视频样本中行为人的表情、姿态、穿着,以及相机运动、光照变化、遮挡、背景等变化很大,接近于真实场景下的情况,因而对于行为的分析识别极具挑战性。

下载链接: http://www.di.ens.fr/~laptev/actions/hollywood2/


9、YouTube-8M

内容:

1、800万个标注视频,每个视频120s到500s。

下载链接: https://research.google.com/youtube8m/


10、Moments in Time Dataset

内容:

1、100万个标注视频,每个视频3秒。

下载链接: http://moments.csail.mit.edu/


11、TRECVID

内容:

如何下载,没看明白,暂时先不管。

下载链接: http://www-nlpir.nist.gov/projects/tv2008/tv2008.html#1


12、CMU Graphics Lab Motion Capture Database

内容:

应该是一些骨骼点动作捕捉,下载链接分散,很难下载,需要写脚本。

下载链接: http://mocap.cs.cmu.edu/


图像识别


1、ImageNet

内容: 物体识别

ImageNet是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。能够从图片识别物体。目前已经包含14197122张图像,是已知的最大的图像数据库。

下载链接: http://www.image-net.org/


2、CIFAR

内容: 物体识别

CIFAR-100由60000张图像构成,包含100个类别,每个类别600张图像,其中500张用于训练,100张用于测试。其中这100个类别又组成了20个大的类别,每个图像包含小类别和大类别两个标签。官网提供了Matlab,C,python三个版本的数据格式。

下载链接: http://www.cs.toronto.edu/~kriz/cifar.html


3、INRIA Person Dataset

内容: 行人检测

Inria数据集是最常使用的行人检测数据集。其中正样本(行人)为png格式,负样本为jpg格式。里面的图片分为只有车,只有人,有车有人,无车无人四个类别。图片像素为70134,96160,64*128等。

下载链接: http://pascal.inrialpes.fr/data/human/


4、CaltechPedestrian Detection Benchmark

内容: 行人识别

下载链接: http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/


5、Adience

内容: 性别年龄识别

该数据集来源为Flickr相册,由用户使用iPhone5或者其它智能手机设备拍摄,同时具有相应的公众许可。该数据集主要用于进行年龄和性别的未经过滤的面孔估计。同时,里面还进行了相应的landmark的标注。是做性别年龄估计和人脸对齐的一个数据集。图片包含2284个类别和26580张图片。

下载链接: http://www.openu.ac.il/home/hassner/Adience/data.html#agegender


6、HollywoodHeads dataset

内容: 人头检测

该数据集为从视频中截取的图片,包含224740张jpeg格式图片,还有xml格式的标注,和VOC的标注方式一样。

下载链接: http://www.di.ens.fr/willow/research/headdetection/release/HollywoodHeads.zip


[转载]如果你想练练视频识别,那么这些数据集或许可以为你所用相关推荐

  1. 【杂谈】如果你想快速系统掌握计算机视觉大部分领域,学习人脸图像是唯一选择...

    笔者是从传统图像算法开始进入计算机视觉行业的,那一批人基本上都是从人脸图像和文本图像开始学,而如今很多计算机视觉从业者却从来没有接触过人脸图像相关的算法,或许真的是时代变了吧. 但笔者想说的是,如果你 ...

  2. 什么是元宇宙?如果你想参与进Metaverse中去,应该采用什么策略?

    省时查报告-专业.及时.全面的行研报告库 省时查方案-专业.及时.全面的营销策划方案库 如果要选一个2021年最热的词,那非"元宇宙"莫属,究竟什么是元宇宙?元宇宙的未来又在哪里? ...

  3. 2016如果你想改变命运,请花几分钟读一下:(网上创业赚钱项目)

    ★★★不需要懂技术,不用发货,不用铺货,需要你做的只是去推广-- 关键一点事正规!!淘宝,东京合作,交易过程全部在东京,淘宝上完成,安全可靠,不用担心被骗,所以说网上购物,更省钱,更省心,赚钱更放心. ...

  4. 腾讯信息流亿级相似视频识别技术架构优化实践

    前言:本文转载自InfoQ,原链接如下.本人为作者之一. InfoQ官网文章 InfoQ微信公众号文章 腾讯信息流亿级别相似视频识别技术架构优化实践 作者:邹建勋,袁易之,常郅博 1.信息流业务背景介 ...

  5. 图像零交叉点,视频生成,视频识别,视频摘要,视频浓缩

    图像零交叉点,视频生成,视频识别,视频摘要,视频浓缩 一.视频生成,视频识别,视频摘要,视频浓缩 视频生成与视频识别 视频分析的两大任务,前者侧重于对下一帧的预测,而前者则侧重于视频内容的理解.由于视 ...

  6. !!!光线对视频识别技术的影响

    http://www.enet.com.cn/article/2006/0412/A20060412522057.shtml ITS技术发展的今天,识别技术以及识别手段正在不断的丰富完善.但不可否认的 ...

  7. ICCV 2021 Oral | AdaFocus:利用空间冗余性实现高效视频识别

    ©原创 · 作者 | 王语霖 单位 | 清华大学自动化系 研究方向 | 机器学习.计算机视觉 本文主要介绍我们被 ICCV 2021 会议录用为 Oral Presentation 的一篇文章:Ada ...

  8. AAAI 2020 | 腾讯优图10篇论文入选,含速算识别、视频识别等主题

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自腾讯优图. 人工智能领域的国际顶级会议AAAI 2020将于2月7日-2月12日在美国纽约举办.近年来随着人工智能的兴起,AAAI每年举办的学 ...

  9. 懒不是傻懒,如果你想少干,就要想出懒的方法。要懒出风格,懒出境界。

    今天是我第一次和雅虎的朋友们面对面交流.我希望把我成功的经验和大家分享,尽管我认为你们其中的绝大多数勤劳聪明的人都无法从中获益,但我坚信,一定有个别懒的去判断我讲的是否正确就效仿的人,可以获益匪浅. ...

最新文章

  1. Swift - AppDelegate.swift类中默认方法的介绍
  2. directory not found for option
  3. linux crontab 定时任务 计划任务 不执行 原因
  4. python各个解释器的用途-常见的Python五大解释器!
  5. 一种更清晰的Android架构
  6. 自定义异常禁用异常堆栈_如何在Mac上禁用或自定义自动更正
  7. 华为或正与联发科、紫光展锐就采购更多芯片事宜展开磋商
  8. 索尼发布工业设备用SWIR图像传感器 采用5微米像素尺寸
  9. Win10+Python3.6配置Spark创建分布式爬虫
  10. 设计模式十八:mediator(中介者模式)——对象行为型模式
  11. Linux系统上安装JDK和Tomcat服务器
  12. weex 项目开发(五)自定义 过滤函数 和 混合 及 自定义 Header 组件
  13. CE教程步骤8操作指南
  14. android手机怎么投屏到电视盒子,Android手机与电视同步投屏详细教程
  15. 电视hdmi接口在哪_HDMI是什么意思?花5分钟看完这篇文章:原来如此!我现在明白了...
  16. AndroidTV获取U盘路径
  17. OpenHarmony如何控制屏幕亮度
  18. 09组团队项目-Alpha冲刺-6/6
  19. LDMIA、LDMIB、LDMDB、LDMDA、STMIA、LDMFD、LDMFA、LDMED、LDMEA等指令详解
  20. 电子数字计算机的应用,你了解电子数字计算机的发展吗?人类是如何应用计算机技术的?...

热门文章

  1. 4.2 安卓触摸事件
  2. Impala命令行操作
  3. 2016计算机中级职称考试,2016.2年中级职称计算机考试模拟及题库.doc
  4. windows人大金仓定时备份脚本
  5. 戴尔电脑OptiPlex7080装机步骤
  6. java不足前面补0
  7. 1 OF 100DAYS
  8. php 上传文件 type,php 上传文件 $_FILES[\'\'][\'type\']的值-wwwkljoel-ChinaUnix博客
  9. office 图片插入题注,页眉
  10. 有哪些常用的安全算法?