介绍:

其中C3D是3d卷积的比较有意义的开端,I3d在C3D之后做了一系列研究,包括引入双流网络,和LSTM网络,并使用已经训练好的2D图像分类模型的参数维数扩充后用做3D网络的预训练模型。S3D是在I3D的基础上,探索了卷积拆分,使得模型的量级下降,并在后续的工作中加入了Graph Convolution的一些思想。

TSN:time segment networks,主要时提出了一种新的采样策略,即将视频分K段,从每段中随机挑选若干(s)帧组成片段,则共有K*s帧被采样(这里不考虑反转裁剪等操作),最后融合K个段的预测结果。

TSM:time shift module则主要是引入了时间转移模块,沿时域做特征转移。加强了时域信息的交流融合。其帧采样策略采用的是稀疏采样策略(不同于传统的密集采样),继承了TSN的采样策略。

上面是一个整体的把握,如果有什么细节大家可以参考论文原文及github源码。

以下是几篇相对较好的博客,供大家参考

C3D:https://www.jianshu.com/p/09d1d8ffe8a4

TSM:https://zhuanlan.zhihu.com/p/66251207

S3D:https://blog.csdn.net/SIGAI_CSDN/article/details/85098096

I3D:https://zhuanlan.zhihu.com/p/58355093

TSN:https://blog.csdn.net/zhang_can/article/details/79618781

记录 之 最近阅读的动作识别(action recognition)工作相关推荐

  1. 视频数据集 | 视频动作识别video recognition常用数据集整理

    一 写在前面 未经允许,不得转载,谢谢~~~ 这篇文章主要整理一下视频动作识别领域常用的数据集~~~ 大概但不严格按照时间顺序排列. 二 视频分类数据集 HMDB51 来源:HMDB: a large ...

  2. 行为识别(Action Recognition)初探

    任务说明(截取视频行为分类) 对视频中人的行为动作进行识别,即读懂视频. Hand gesture:集中于处理视频片段中单人的手势 Action:短时间的行为动作,场景往往是短视频片段的单人行为 Ac ...

  3. 深度学习-视频行为识别:论文阅读——双流网络(Two-stream convolutional networks for action recognition in videos)

    这里写目录标题 视频的行为识别 前言 背景 内容组成 主要贡献 算法介绍 网络结构 双流(two stream)网络结构 空间流卷积网络(Spatial stream ConvNet) 时间流卷积网络 ...

  4. 基于tf-openpose的动作识别实现街头霸王5对战项目

    记录:基于tf-openpose的动作识别实现街头霸王5对战项目 基于开学2个月的学习,总算是对深度学习有了一些入门的感觉.目前,通过修改图片识别的DNN神经网络代码,使之成为了一个可以对人体部位坐标 ...

  5. 3D 卷积神经网络 视频动作识别

    转自:http://blog.csdn.net/AUTO1993/article/details/70948249 https://zhuanlan.zhihu.com/p/25912625 http ...

  6. 我的AI之路(54)--使用Pytorch内置的动作识别模型

    Pytorch内集成有视频分类功能,提供了三个基于Kinectis400/600/700数据集(https://deepmind.com/research/open-source/kinetics)训 ...

  7. DMC-Net: Generating Discriminative Motion Cues for Fast Compressed Video Action Recognition 论文赏析

    DMC-Net: Generating Discriminative Motion Cues for Fast Compressed Video Action Recognition 论文赏析 前言 ...

  8. 论文笔记【A Comprehensive Study of Deep Video Action Recognition】

    论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...

  9. 【论文学习】Two-Stream Convolutional Networks for Action Recognition in Videos

    Two-Stream Convolutional Networks for Action Recognition in Videos 原文地址 粗略翻译 摘要: 我们研究了视频中用于训练动作识别的深度 ...

最新文章

  1. 对话腾讯云汽车业务副总经理李博:构建出行大版图,腾讯云迈向新征程
  2. 同时阅读多个pdf文档怎么办?
  3. 内置方法-str方法定制变量输出信息
  4. java钱_在Java中如何表示钱Money?
  5. 接入gitment为hexo添加评论功能
  6. HDFS基本原理及数据存取实战
  7. 3.1 API : DecisionTreeClassifier、DecisionTreeRegressor
  8. 【UnityEditor】制作一个unity ui 脚本自动生成器
  9. 福利:appium+selenium+python 模拟手工点击趣头条(app赚钱软件)
  10. 用计算机完成计算win7,算天数转单位Win7计算器能做得更多
  11. 转!快速搭建视频直播平台
  12. 实现人脸手动祛痘效果---OpenCV-Python开发指南(60)
  13. 计算机不定时黑屏,宏基acer 4736ZG不定时黑屏,时亮时不亮通病维修
  14. halcon学习笔记-车牌号识别
  15. 计算机组装与维修(一)
  16. 推特(twitter)翻译
  17. react 的 render 函数
  18. KioptrixVM3-writeup
  19. 单相交流电机转动原理于启动电容的作用
  20. 有道智云OCR图片识别文字+返回数据处理技巧(实现语言-按键精灵脚本请求识别+java服务端处理数据)

热门文章

  1. 漫谈移动开发中的组件化
  2. MySql连接——内连接、外连接(左连接、右连接、全连接)
  3. eclipse 设置 默认编码为 utf-8
  4. 【数据结构作业—01】用单循环链表解决约瑟夫问题
  5. [Python图像处理] 九.形态学之图像开运算、闭运算、梯度运算
  6. 盖茨发文谈如何实现零碳目标 称看好电动车未来
  7. SQL开发技巧 join从句
  8. CCS5.5环境下使用clock()函数测试程序段运行时间
  9. 【机器视觉】 dev_set_check算子
  10. 【机器视觉】 endwhile算子