在youtube上看到这篇论文的视频,做的效果还不错,简单阅读一下:
- 视频链接:https://www.youtube.com/watch?v=G0PXKCEgIoA.
- 论文链接:https://arxiv.org/abs/1703.09783
- 该论文在NTU RGB+D 数据集上进行训练和测试
- 该论文整体也是行为识别领域流行的Two-stream结构,不同的是,其中一个stream是通过人体关节点坐标构建的,另一个stream是从RGB图像中提取的特征

  • 利用人体关节点构建行为特征,输入是两个人的关节坐标构成,即25*2=50维,主要使用GRU网络进行特征提取,作者使用两层GRU网络,后经BN层、droupout层。该部分使用tf实现,论文中有详细参数设置情况
  • RGB部分使用3Dcnn模型进行提取
  • 特征融合,该部分作者使用两种方法,一种是使用两个网络分别进行分类,最后将预测得分进行加权求和;另一种如上图所示,直接将两个网络最后一个全链接层的特征进行拼接,得到600+4096=4690维度的特征,然后利用svm分类
  • 本文并没有发表在会议或期刊上,也没有源代码,只是简单阅读了解一下思路

Two-Stream RNN/CNN for Action Recognition in 3D Videos-阅读笔记相关推荐

  1. VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION(VGG网络)-论文阅读笔记

    VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION VGG网络 论文阅读笔记 //2022.4.11上午9:53开始阅 ...

  2. Detection of Rail Surface Defects Based on CNN Image Recognition and Classification-论文阅读笔记

    Detection of Rail Surface Defects Based on CNN Image Recognition and Classification 基于CNN图像识别和分类的钢轨表 ...

  3. 车牌识别1:License Plate Detection and Recognition in Unconstrained Scenarios阅读笔记

    转载好文一篇 一.WHAT 论文下载地址:License Plate Detection and Recognition in Unconstrained Scenarios [pdf] github ...

  4. AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE(阅读笔记)

    论文来源:arxiv.org 本文作者:李炎,硕士研究生,目前研究方向为深度学习.计算机视觉. 目录 摘要 问题描述 本文核心工作 模型 实验 总结 其他相关文章 摘要 将基于自注意力机制的Trans ...

  5. SynFace Face: Recognition with Synthetic Data 阅读笔记

    SynFace: Face Recognition with Synthetic Data 该文主要目的是将合成的人脸数据用于人脸识别模型的训练,指出了用生成图像来训练无法达到真实图片效果的原因,并给 ...

  6. 视频人员行为识别(Action Recognition)

    一. 提出背景 目标:给定一段视频,通过分析,得到里面人员的动作行为. 问题:可以定义为一个分类问题,通过对预定的样本进行分类训练,解决一个输入视频的多分类问题. 这里提出的问题是简单的图片(视频)分 ...

  7. 行为识别(Action Recognition)初探

    任务说明(截取视频行为分类) 对视频中人的行为动作进行识别,即读懂视频. Hand gesture:集中于处理视频片段中单人的手势 Action:短时间的行为动作,场景往往是短视频片段的单人行为 Ac ...

  8. 论文笔记【A Comprehensive Study of Deep Video Action Recognition】

    论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...

  9. 行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

    行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition Temporal ...

最新文章

  1. 什么是BI?什么是DW?ETL(Extract-Transform-Load)是什么?
  2. uboot环境变量实现分析
  3. google Guava包的ListenableFuture解析
  4. Effective_STL 学习笔记(十九) 了解相等和等价的区别
  5. 树链剖分 讲解+模板+习题
  6. [转载]软件界面交互和易用性改进总结
  7. [JavaScript] 怎么使用JS禁止复制粘贴
  8. java 十进制十六进制转换_Java进制转换之十六进制转十进制
  9. 高版本SDK编译生成的apk放入低版本android源码中集成编译
  10. 《延禧攻略》不仅是中国色,还藏着中国美了千年的风景!
  11. 深度学习-22:信息论和信息熵
  12. 美国医院权威评估体系
  13. 蒲公英 · JELLY技术周刊 Vol.26: 请问您这个月要来点肝么?
  14. Airpods Pro连接Macbook Pro偶尔会没有声音
  15. codeforces 1567 B. MEXor Mixup
  16. 黑客利用0day,从General Bytes比特币ATM盗走150万美元
  17. arduino uno+驱动器控制42步进电机
  18. 如何使用Nginx来实现企业微信域名校验
  19. 江南春:30年,我用1000亿,换来这99句话
  20. VC6风格转XP风格界面的两种方法

热门文章

  1. ActiveReports 报表应用教程 (15)---报表换肤
  2. 讲解Java中的String几种类型
  3. 面试精讲之面试考点及大厂真题 - 分布式专栏 16 数据库如何做分库分表,读写分离
  4. 面试官系统精讲Java源码及大厂真题 - 14 简化工作:Guava Lists Maps 实际工作运用和源码
  5. maven报错:Failed to execute goal org.apache.maven.plugins:maven-surefire-plugin:x.x.x:test
  6. @vail 判断某字段在范围内_怎么判断一台二次元影像测量仪的可靠性?
  7. leaflet-webpack 入门开发系列二加载不同在线地图切换显示(附源码下载)
  8. Tomcat中的连接器是如何设计的
  9. 【springBoot】注解的详解
  10. git 子命令 git tag 常用命令实操教程