深度学习视频数据集(动作识别):UCF-101
UCF-101
官网:https://www.crcv.ucf.edu/research/data-sets/ucf101/
网盘:链接:https://pan.baidu.com/s/1RsJuykWyUlQ4_c1TwqxR_Q
提取码:909g
官方解释
UCF101是一个现实动作视频的动作识别数据集,收集自YouTube,提供了来自101个动作类别的13320个视频。
该数据集是UCF50数据集的扩展,UCF50数据集有50个动作类别。
UCF101在动作方面提供了最大的多样性,并且在摄像机运动、对象外观和姿态、对象规模、视点、杂乱的背景、照明条件等方面有很大的变化。
101个动作类别中的视频被分成25组,每组可以包含一个动作的4-7个视频。同一组的视频可能有一些共同的特点,比如相似的背景,相似的观点等等。
包括5大类动作 :
- 人与物体交互
- 单纯的肢体动作
- 人与人交互
- 演奏乐器
- 体育运动
这些类别有:
化眼妆、涂唇膏、射箭、婴儿爬行、平衡木、乐队游行、棒球、打篮球、扣篮、卧推、骑自行车、台球、吹干头发、吹蜡烛、下蹲、保龄球、拳击、出气筒、蛙泳、刷牙、挺举、悬崖跳水、保龄球、板球、潜水、打鼓、击剑、曲棍球、体操、飞盘、爬泳、高尔夫挥杆、理发、扔链球、锤击、倒立俯卧撑…
注意:在训练和测试时,将属于同一组的视频分开是非常重要的。由于一组视频是由单个的长视频获得的,因此在训练和测试集中共享同一组的视频会获得较高的性能。
101个动作:
总时长与平均时长:
时长频次:
Summary
- 数据集名称:UCF-101(2012)
- 总视频数:13,320个视频
- 总时长:27个小时
- 视频来源:YouTube采集
- 视频类别:101 种
- 主要包括5大类动作 :人与物体交互,单纯的肢体动作,人与人交互,演奏乐器,体育运动
- 每个类别(文件夹)分为25组,每组4~7个短视频,每个视频时长不等
Notice
解压后就是分类数据集的标准目录格式,二级目录名为人类活动类别,二级目录下就是对应的视频数据。
每个短视频时长不等(零到十几秒都有),大小320*240, 帧率不固定,一般为25帧或29帧,一个视频中只包含一类人类行为。
预处理时需要将UCF101中的视频保持结构不变逐帧分解为图像。
相同的活动下,有不同的视频是截取自同一个长视频的片段,即视频中的人物和背景等特征基本相似。
1中的视频保持结构不变逐帧分解为图像。
相同的活动下,有不同的视频是截取自同一个长视频的片段,即视频中的人物和背景等特征基本相似。
因此为了避免此类视频被分别划分到train和test集合引起训练效果不合实际而精度过高,UCF提供了标准的train和test集合检索文件,有三种数据集划分方案,C3D论文中选择的方案是第三种。
深度学习视频数据集(动作识别):UCF-101相关推荐
- 麦子学院深度学习视频SVM人脸识别课程代码修改及实现
1.麦子学院深度学习SVM人脸识别原代码对应修改 2.代码实现 1.麦子学院深度学习SVM人脸识别原代码对应修改 1.1 from sklearn.cross_validation import tr ...
- 基于自动图像分割算法和扩展数据集深度学习的经济作物病害识别
基于自动图像分割算法和扩展数据集深度学习的经济作物病害识别 1.作物病害识别出现的问题 实际应用中作物图像的复杂背景信息和训练数据不足会导致深度学习的错误识别. 2.研究内容 提出了一种基于自动图像分 ...
- 25个深度学习开源数据集
简介 学习深度学习最重要的就是数据集啦.小编在刚开始学习深度学习的时候最头疼的一件事就是没有数据,徒有很多想法,但却无法实现,这里小编给大家介绍25个常用的深度学习开源数据集,这是从国外的一篇博客中看 ...
- 图像处理 语音识别 深度学习 开放数据集
从图像处理到语音识别,25款数据科学家必知的深度学习开放数据集 本文介绍了 25 个深度学习开放数据集,包括图像处理.自然语言处理.语音识别和实际问题数据集. 介绍 深度学习(或生活中大部分领域)的关 ...
- 从图像处理到语音识别,25款数据科学家必知的深度学习开放数据集
选自Analytics Vidhya,作者:Pranav Dar,机器之心编译. 本文介绍了 25 个深度学习开放数据集,包括图像处理.自然语言处理.语音识别和实际问题数据集. 介绍 深度学习(或生活 ...
- 【赠书】新手速递!深度学习视频理解!
视频理解是当前计算机视觉研究领域中备受学术界和工业界关注的方向,随着视频行业的高速发展,如何利用 AI 技术更好地对视频内容进行理解变得越来越重要.今天要给大家介绍的书是<深度学习视频理解 ...
- DeepEye:一个基于深度学习的程序化交易识别与分类方法
DeepEye:一个基于深度学习的程序化交易识别与分类方法 徐广斌,张伟 上海证券交易所资本市场研究所,上海 200120 上海证券交易所产品创新中心,上海 200120 摘要:基于沪市A股交 ...
- 【深度学习】OCR文本识别
OCR文字识别定义 OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程: ...
- 吴恩达老师深度学习视频课笔记:总结
吴恩达老师深度学习视频课网址为:https://mooc.study.163.com/smartSpec/detail/1001319001.htm/?utm_source=weibo.com& ...
- 视频时序动作识别(video action recognition)介绍
一.视频时序动作识别算法分类 根据网络的工作方式,可以将视频时序动作识别算法大致分为四大类: 采用2D卷积的方法 采用3D卷积的方法 双流法 引入VLAD的方法 1.1 采用2D卷积的方法 <T ...
最新文章
- SAP MM不常用功能之供应商Rebate
- android蓝牙扫描中断,一段时间后,Android蓝牙Le扫描仪停止运行
- ps软件怎么测试性能,怎么样提高Photoshop性能,让PS软件快速启动
- P4 前端编译器p4c-bm、后端编译器bmv2命令安装 make error问题
- 每日一题(5) —— 逗号表达式
- 字符串去重_文件数据去重示例
- (计算机组成原理)408之外内容补充(非统考考生需要了解|以白中英教材为准)
- 【安全牛学习笔记】抓包嗅探
- window下安装好postgreSQL 9.3用cmd命令进入数据库(搞的我这个菜鸟只剩半条命)...
- 地学计算方法/地统计学(第一章绪论)
- android版信用卡还款提醒器
- 会话语义角色标注:Conversational Semantic Role Labeling
- Google Guava 实战之List篇
- 学习SQLSugar,分享给更多人收益
- 产生虚假的用于欺骗的IP数据包程序实践——Teardrop
- 斑小将微商代理系统开发
- 安卓手机如何投影到电脑?手机屏幕投影到电脑
- STM32控制NRF24L01无线模块进行通信
- 一键完成:批量转pdf图片为png、svg格式图片
- 模拟a标签实现带header的下载