一、视频时序动作识别算法分类

根据网络的工作方式,可以将视频时序动作识别算法大致分为四大类:

  • 采用2D卷积的方法
  • 采用3D卷积的方法
  • 双流法
  • 引入VLAD的方法

1.1 采用2D卷积的方法

  • 《TSM: Temporal Shift Module for Efficient Video Understanding》算法详解
  • 《TEA: Temporal Excitation and Aggregation for Action Recognition》算法详解
  • 《TDN: Temporal Difference Networks for Efficient Action Recognition》论文详解
  • 《No frame left behind: Full Video Action Recognition》算法详解

1.2 采用3D卷积的方法

  • 《Learning Spatiotemporal Features with 3D Convolutional Networks》(C3D)算法详解
  • 《Rethinking Spatiotemporal Feature Learning: Speed-Accuracy Trade-offs in Video Classification》(S3D)算法详解
  • 《ECO: Efficient Convolutional Network for Online Video Understanding》算法详解
  • 《Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks》(P3D)算法详解
  • 《SlowFast Networks for Video Recognition》算法详解
  • 《X3D: Expanding Architectures for Efficient Video Recognition》算法详解

1.2 双流法

  • 《Two-Stream Convolutional Networks for Action Recognition in Videos》(TSN)算法详解
  • 《Temporal Segment Networks: Towards Good Practices for Deep Action Recognition》(TSM)算法详解

1.3 引入VLAD的方法

  • 《ActionVLAD算法详解》

二、常用数据集介绍

Sports-1M数据集介绍:* 1.1 millions运动视频* 487个视频类
UCF101数据集介绍:* 13320个视频片段* 9.5K训练,3.7K测试视频* 视频帧大小320*240* 总共101类,内容包含化妆刷牙、爬行、理发、弹奏乐器、体育运动五大类。* 每类动作由25个人做动作,每人做4-7组
ActivatyNet数据库介绍* 人类动作识别数据库
* v1.3版本中有19994段视频,包含200类
* 10024段视频为训练集,4926段视频为验证集,5044段视频为测试集
* 测试集label没有公开,一般就是使用验证集来作为测试集
HMDB51数据介绍* 6766个视频* 51个动作类别* 内容包括人面部、肢体、和物体交互的动作这几大类
Kinetic-400 数据库介绍* 240k训练视频,20k验证,35k测试
* 400类人类动作类别
* 内容为画画、大笑、拥抱、除草等
* 每个视频大约10秒
* 数据来源于YouTube
Kinetic-600 数据库介绍* Kinetic-400数据库的扩展
* 600类人类动作类别
* 总共500k段视频
Charades 数据库介绍* 9848段视频
* 157类室内日常行为
* 多标签
* 每个视频大约30s

其它视频任务介绍请查看-文章<<主流的视频动作类算法任务介绍>>

视频时序动作识别(video action recognition)介绍相关推荐

  1. 视频人员行为识别(Action Recognition)

    一. 提出背景 目标:给定一段视频,通过分析,得到里面人员的动作行为. 问题:可以定义为一个分类问题,通过对预定的样本进行分类训练,解决一个输入视频的多分类问题. 这里提出的问题是简单的图片(视频)分 ...

  2. python视频识别_视频人员行为识别(Action Recognition)

    一. 提出背景 目标:给定一段视频,通过分析,得到里面人员的动作行为. 问题:可以定义为一个分类问题,通过对预定的样本进行分类训练,解决一个输入视频的多分类问题. 这里提出的问题是简单的图片(视频)分 ...

  3. 论文笔记【A Comprehensive Study of Deep Video Action Recognition】

    论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...

  4. 视频动作识别--Convolutional Two-Stream Network Fusion for Video Action Recognition

    Convolutional Two-Stream Network Fusion for Video Action Recognition CVPR2016 http://www.robots.ox.a ...

  5. DMC-Net: Generating Discriminative Motion Cues for Fast Compressed Video Action Recognition 论文赏析

    DMC-Net: Generating Discriminative Motion Cues for Fast Compressed Video Action Recognition 论文赏析 前言 ...

  6. A Comprehensive Study of Deep Video Action Recognition 论文笔记

    A Comprehensive Study of Deep Video Action Recognition 论文链接: https://arxiv.org/abs/2012.06567 一. Pro ...

  7. 【论文笔记】Spatiotemporal Residual Networks for Video Action Recognition

    目录 摘要 1 介绍 3. 技术方法 3.1 Two-Stream residual 网络 3.2跨时间的卷积剩余连接 3.3建议结构 (Proposed architecture) 参考文献 参考 ...

  8. 论文阅读 - Large-scale weakly-supervised pre-training for video action recognition

    文章目录 1 概述 2 数据的收集方式 3 使用的模型 4 预训练时的一系列问题 4.1 预训练的数据是不是越多越好? 4.2 用于预训练的模型是不是越大越好? 4.3 预训练数据的标签种类和数量是不 ...

  9. 视频数据集 | 视频动作识别video recognition常用数据集整理

    一 写在前面 未经允许,不得转载,谢谢~~~ 这篇文章主要整理一下视频动作识别领域常用的数据集~~~ 大概但不严格按照时间顺序排列. 二 视频分类数据集 HMDB51 来源:HMDB: a large ...

最新文章

  1. 设置释放COCOS2D-X 的启动流程
  2. 电子工程可以报考二建_电子科学与技术专业能报考二级建造师吗?
  3. 【入门基础】写给小白看的入门级 Java 基本语法
  4. python列表间隔合并_Python使用zip合并相邻列表项的方法示例
  5. NSObject协议中方法:description 和 debugDescription
  6. git reset --hard_Git紧急自救简易指南(二)——版本的游历
  7. php 打印行数,php/html-按行和列配置钻石数量的打印格式
  8. cartographer编译过程遇到未定义的dlclose@@GLIBC_2.2.5
  9. 利用application在页面中显示访问次数
  10. php连接mysql代码+类_php连接mysql操作类
  11. win7下桌面IE快捷方式无法删除解决方法
  12. jle汇编_X86汇编指令
  13. 拼多多---多多果园怎么玩
  14. Python语言特色集锦
  15. C++程序设计:原理与实践读书笔记(第十二章)
  16. git pages部署静态页面,可以免费发布简历之类的静态网页。
  17. R语言逻辑运算符(Logical Operators,大于、小于、等于、不等于、与或非、是否为真)、R语言逻辑运算符(Logical Operators)实战示例
  18. 识别12306验证码脚本
  19. debian 11 安装bind9服务
  20. android零宽空格,零宽字符文本水印原理

热门文章

  1. 大会详细日程:O'Reilly AI Conference 北京站
  2. Java基础——程序员之家七月份Java基础总结
  3. Altium designer中文化设置
  4. 【整理】Makefile编写规则
  5. Java 小例子:分解质因数
  6. 什么是正向代理,开放的代理软件使用
  7. 网络爬虫 测试代理IP
  8. 第2节--深度学习基础介绍-机器学习--课程介绍(下)
  9. 新媒体运营是什么??新媒体运营通过哪些方式进行?
  10. 怎样关闭任务栏的Microsoft资讯