Two-Stream RNN/CNN for Action Recognition in 3D Videos

在youtube上看到这篇论文的视频，做的效果还不错，简单阅读一下：
- 视频链接：https://www.youtube.com/watch?v=G0PXKCEgIoA.
- 论文链接：https://arxiv.org/abs/1703.09783
- 该论文在NTU RGB+D 数据集上进行训练和测试
- 该论文整体也是行为识别领域流行的Two-stream结构，不同的是，其中一个stream是通过人体关节点坐标构建的，另一个stream是从RGB图像中提取的特征

利用人体关节点构建行为特征，输入是两个人的关节坐标构成，即25＊2＝50维，主要使用GRU网络进行特征提取，作者使用两层GRU网络,后经BN层、droupout层。该部分使用tf实现，论文中有详细参数设置情况
RGB部分使用3Dcnn模型进行提取
特征融合，该部分作者使用两种方法，一种是使用两个网络分别进行分类，最后将预测得分进行加权求和；另一种如上图所示，直接将两个网络最后一个全链接层的特征进行拼接，得到600+4096=4690维度的特征，然后利用svm分类
本文并没有发表在会议或期刊上，也没有源代码，只是简单阅读了解一下思路

Two-Stream RNN/CNN for Action Recognition in 3D Videos－阅读笔记相关推荐

VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION(VGG网络)-论文阅读笔记
VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION VGG网络论文阅读笔记 //2022.4.11上午9:53开始阅 ...
Detection of Rail Surface Defects Based on CNN Image Recognition and Classification-论文阅读笔记
Detection of Rail Surface Defects Based on CNN Image Recognition and Classification 基于CNN图像识别和分类的钢轨表 ...
车牌识别1：License Plate Detection and Recognition in Unconstrained Scenarios阅读笔记
转载好文一篇一.WHAT 论文下载地址:License Plate Detection and Recognition in Unconstrained Scenarios [pdf] github ...
AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE（阅读笔记）
论文来源:arxiv.org 本文作者:李炎,硕士研究生,目前研究方向为深度学习.计算机视觉. 目录摘要问题描述本文核心工作模型实验总结其他相关文章摘要将基于自注意力机制的Trans ...
SynFace Face: Recognition with Synthetic Data 阅读笔记
SynFace: Face Recognition with Synthetic Data 该文主要目的是将合成的人脸数据用于人脸识别模型的训练,指出了用生成图像来训练无法达到真实图片效果的原因,并给 ...
视频人员行为识别（Action Recognition）
一. 提出背景目标:给定一段视频,通过分析,得到里面人员的动作行为. 问题:可以定义为一个分类问题,通过对预定的样本进行分类训练,解决一个输入视频的多分类问题. 这里提出的问题是简单的图片(视频)分 ...
行为识别(Action Recognition)初探
任务说明(截取视频行为分类) 对视频中人的行为动作进行识别,即读懂视频. Hand gesture:集中于处理视频片段中单人的手势 Action:短时间的行为动作,场景往往是短视频片段的单人行为 Ac ...
论文笔记【A Comprehensive Study of Deep Video Action Recognition】
论文链接:A Comprehensive Study of Deep Video Action Recognition 目录 A Comprehensive Study of Deep Video A ...
行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition
行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition Temporal ...

Two-Stream RNN/CNN for Action Recognition in 3D Videos－阅读笔记

Two-Stream RNN/CNN for Action Recognition in 3D Videos－阅读笔记相关推荐

最新文章

热门文章