文章目录

  • 0. 前言
  • 1. 要解决什么问题
  • 2. 用了什么方法
  • 3. 效果如何
  • 4. 还存在什么问题&有什么可以借鉴

0. 前言

  • 相关资料:

    • cvpr页面
    • github
    • 论文解读(官方解读)
  • 论文基本信息
    • 领域:行为识别(虽然标题里有tube,但其实做的是行为识别……)
    • 作者单位:中国科技大学&微软亚洲研究院
    • 发表时间:CVPR 2018

1. 要解决什么问题

  • 3D卷积计算量太大,影响行为识别的效果。
  • 当时的3D模型还是C3D,没花头。

2. 用了什么方法

  • 提出了 Mixed Convolutional Tube (MiCT) 结构,降低计算量、提高性能。

    • 说白了就是用一些2D+3D的结构来替换之前C3D中的3D结构。
    • 主要灵感来源于:视频数据中,相比 spatial 纬度,temporal 纬度的信息更多,或者说,相邻帧中空间维度的信息随时间变化较小。
  • 3D/2D卷积串联结构
    • 先3D,再对temporal纬度每一个分别进行2D。
  • 3D/2D cross-domain residual connection
    • 看样子应该是3D和2D的融合
  • 网络总体结构,即 MiCT-Net 结构

3. 效果如何

  • 结果其实不是很想放,只有在UCF101和HMDB51上的结果,没有Kinetics400的


4. 还存在什么问题&有什么可以借鉴

  • 数据融合的这几个结构也许有机会可以尝试一下。

  • 效果在现在看来应该不太行。

  • 表格里写了300+fps,但好像没有硬件型号?。。。

论文浏览(45) MiCT: Mixed 3D/2D Convolutional Tube for Human Action Recognition相关推荐

  1. (论文笔记)SC4D: A Sparse 4D Convolutional Network for Skeleton-Based Action Recognition

    SC4D: A Sparse 4D Convolutional Network for Skeleton-Based Action Recognition 摘要 一.介绍 二.相关工作 1.骨架动作识 ...

  2. 论文笔记 Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition - CVPR

    Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition 2020 CVPR | c ...

  3. 行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition

    行为识别论文笔记|TSN|Temporal Segment Networks: Towards Good Practices for Deep Action Recognition Temporal ...

  4. 论文阅读_Spatial Temporal Graph Convolutional Networks for Skeleton-Based Action Recognition

    Abstract 人体骨架动力学为人体动作识别提供了重要信息.传统的骨架建模方法通常依赖于手工制作的部件或遍历规则,从而导致表达能力有限和泛化困难.在这项工作中,我们提出了一种新的动态骨架模型,称为时 ...

  5. 译:3D Convolutional Neural Networks for Human Action Recognition

    用于人体行为识别的三维卷积神经网络 摘要:我们考虑在监控视频中自动识别人体行为.当前大多数方法是基于原始输入计算得到的复杂手工特征构建分类器.卷积神经网络(CNN)是一种可以直接作用于原始输入的深度模 ...

  6. 论文翻译:Semantics-Guided Neural Networks for Efficient Skeleton-Based Human Action Recognition

    基于骨骼的人体动作识别由于其易于获取人体骨骼数据而引起了人们的极大兴趣.近年来,在不考虑计算效率的情况下,利用深度前馈神经网络对关节三维坐标进行建模成为一种趋势.在本文中,我们提出一种简单而有效的基于 ...

  7. spatial temporal graph convolutional network for skeleton-based action recognition

    PPSIG:Paddlesports ST-GCN动作识别 - 飞桨AI Studio数据集为fsd-10花样滑冰,项目为ST-GCN从PaddleVideo抽取代码,可直接运行,acc为0.48 - ...

  8. GCN代码超详解析Two-stream adaptive graph convolutional network for Skeleton-Based Action Recognition(三)

    代码地址https://github.com/lshiwjx/2s-AGCN 本篇解析对应 2s-AGCN/graph/ntu_rgb_d.py ,用于创建NTURGB-D对应的图结构,以及2s-AG ...

  9. GCN代码超详解析Two-stream adaptive graph convolutional network for Skeleton-Based Action Recognition(二)

    代码地址:https://github.com/lshiwjx/2s-AGCN 本篇解析代码为[2s-AGCN/model/aagcn.py] import mathimport numpy as n ...

  10. GCN代码超详解析Two-stream adaptive graph convolutional network for Skeleton-Based Action Recognition(一)

    代码地址:https://github.com/lshiwjx/2s-AGCN 这个图用于说明人体关键节点的定义及其连接方式 这个文件是根据NTURGB-D中关键点的定义计算骨骼长度 所以最终得到的数 ...

最新文章

  1. 设置Sysctl.conf用以提高Linux的性能(最完整的sysctl.conf优化方案)
  2. 【Ubuntu】将Ubuntu的源改为国内源
  3. 分类算法-支持向量机(SVM)
  4. boost::asio ssl
  5. MapReduce Java API-使用Partitioner实现输出到多个文件
  6. [转载]堆排序(HeapSort) Java实现
  7. Juniper Olive动态路由RIP配置案例
  8. 【BZOJ】1002: [FJOI2007]轮状病毒 递推+高精度
  9. 第三季-第24课-TCP通讯程序设计
  10. 如何在excel中打钩
  11. python爬虫爬取公众号_Python爬虫案例:爬取微信公众号文章
  12. 《信息安全技术—个人信息安全影响评估指南》pdf下载
  13. idea保存快捷键_windows10下idea快捷键文件
  14. 手机相机好坏测试软件,专业相机测试 画质表现均为中上等_手机评测-中关村在线...
  15. wow达拉然发礼物机器人_达拉然彩蛋:会把玩家变羊的NPC,并赠送礼物
  16. 洛谷 CF7E Defining Macros 题解
  17. python程序网站_Python程序到网站应用程序
  18. 【Ray Trace from Groud Up】光线追踪代码实现解析
  19. 提升制造卓越性 沿着价值链管理生产流程
  20. 外包公司程序员的水平真的很垃圾吗?

热门文章

  1. Windows XP安装sql2000企业版的办法
  2. Python笔记 · self,cls,实例方法,静态方法,类方法
  3. almon多项式_计量经济学 总结.docx
  4. java 不登录购物车_java-没有用户登录时存储购物车(playframework疑问)
  5. 用学校邮箱使用微软OneDrive云存储空间5120G
  6. undefined运算
  7. v-if报undefined
  8. SVN 提示svn-base: 系统找不到指定的文件
  9. 网页或公众号微信网页抓包软件Fiddler的正确安装使用!
  10. OPC DA 到 OPC UA