大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享视频分类的核心技术点。

作者&编辑 | 言有三

1 3D卷积

视频相对于图像多出了一个维度,而3D卷积正好可以用于处理这个维度,因此也非常适合视频分类任务,不过缺点是计算量比较大,下图展示了一个简单的3D模型。

2 RNN与LSTM

视频和语音信号都是时序信号,而RNN和LSTM正是处理时序信号的模型,也是早期用于视频分类的重要模型。

3 双流法

视频中的目标往往是运动的,因此光流也是非常重要的信息。双流法包含两个通道,一个是RGB图像通道,用于建模空间信息。一个是光流通道,用于建模时序信息。两者联合训练,并进行信息融合。

4 光流预测模型

由于双流模型是当前视频分类的主流模型,而其中光流信息对结果影响很大,因此光流预测模型至关重要,尤其是轻量级的光流预测模型非常值得研究。

5 多框架融合

Two-Stream网络和3D网络各有优点,都可以很好的建模时序关系,但是计算量巨大,因此有的框架致力于融合两类框架,并降低计算量。

6 其他

总的来说,视频分类和行为识别有非常多的研究方向,包括:

(1) 三维卷积的改进。

(2) 光流提取模型的改进。

(3) RGB和光流特征的融合改进。

(4) 多模态信息融合。

(5) 多标签视频分类。

(6) 更加细粒度的动作分类。

(7) 更长程信息的捕获。

(8) 行为定位。

(9) 视频标注。

以上内容,如果你不想自己学习,可以去我们知识星球的网络结构1000变板块—视频分类板块阅读。

有三AI知识星球

知识星球是有三AI的付费内容社区,里面包括各领域的模型学习,数据集下载,公众号的付费图文原稿,技术总结PPT和视频,知识问答,书籍下载,项目推荐,线下活动等资源,了解详细请阅读以下文章:

【杂谈】有三AI知识星球一周年了!为什么公众号+星球才是完整的?

【杂谈】万万没想到,有三还有个保密的‘朋友圈’,那里面都在弄啥!

转载文章请后台联系

侵权必究

往期精选

  • 【杂谈】2020年有三AI计算机视觉培养计划详解,该不该学&怎么学CV的简单讨论

  • 【年终总结】2019年有三AI做了什么,2020年我们要做什么?

  • 【总结】有三AI秋季划模型优化组3月直播讲了哪些内容,为什么每一个从事深度学习的同学都应该掌握模型优化的内容

  • 【总结】有三AI秋季划人脸算法组3月直播讲了哪些内容,计算机视觉你不可能绕开人脸图像

  • 【总结】有三AI秋季划图像质量组3月直播讲了哪些内容,为什么解决好底层图像处理问题那么重要

  • 【星球知识卡片】残差网络家族10多个变种学习卡片,请收下!

  • 【星球知识卡片】移动端高效率的分组网络都发展到什么程度了?

  • 【星球知识卡片】注意力机制发展如何了,如何学习它在各类任务中的应用?

  • 【星球知识卡片】模型剪枝有哪些关键技术,如何对其进行长期深入学习

  • 【星球知识卡片】模型量化的核心技术点有哪些,如何对其进行长期深入学习

  • 【星球知识卡片】模型蒸馏的核心技术点有哪些,如何对其进行长期深入学习

cv方向有哪些_【星球知识卡片】视频分类与行为识别有哪些核心技术,对其进行长期深入学习...相关推荐

  1. 【星球知识卡片】图像生成都有哪些核心技术,如何对其进行长期深入学习

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分图像生成的核心技术点. 作者&编辑 | 言有三 1 基本图像生成框架 一个基本的图像生成框架包括判别器和生成器,其中生成器输入噪声向量,判 ...

  2. 【星球知识卡片】模型压缩重要方向-动态模型,如何对其长期深入学习

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享模型压缩中的一个非常重要的方向,动态模型. 作者&编辑 | 言有三 1 基于样本动态变化的卷积权重 Dynamic Convolutio ...

  3. 【星球知识卡片】AutoML都有哪些核心技术,如何对其进行长期深入学习

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享AutoML的核心技术点. 作者&编辑 | 言有三 1 AutoML与数据增强 大家都知道数据增强很重要,是深度学习必备良药,写论文刷比 ...

  4. 【星球知识卡片】图像风格化与翻译都有哪些核心技术,如何对其长期深入学习...

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享图像风格化相关的资源. 作者&编辑 | 言有三 1 基本的图像风格化模型 2015年德国图宾根大学科学家在论文<A Neural ...

  5. 【星球知识卡片】人脸属性编辑都有哪些核心知识点,如何长期进行学习

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享人脸属性编辑的核心技术点. 作者&编辑 | 言有三 1 人脸表情编辑 人脸表情编辑即更改脸部的表情属性,包括嘴唇.鼻子等区域.可以广泛应 ...

  6. 【星球知识卡片】图像和视频超分辨都有哪些核心技术,如何对其长期深入学习...

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享图像和视频超分辨相关的资源. 作者&编辑 | 言有三 1 基本的超分辨模型 基本的超分辨模型根据上采样(upsampling)在网络结构 ...

  7. 【星球知识卡片】换脸算法和人脸驱动都有哪些核心技术,如何对其长期深入学习...

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享换脸算法和人脸驱动相关的资源. 作者&编辑 | 言有三 1 基于3D模型的换脸和人脸驱动 基于3D模型的换脸算法是一类非常经典的思路,它 ...

  8. 【星球知识卡片】深度学习图像降噪有哪些关键技术点,如何学习

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享图像降噪相关的资源. 作者&编辑 | 言有三 1 基本的CNN降噪模型 图像去噪模型的输出是无噪声的图像,与输入图像大小相同,所以可以使 ...

  9. 【星球知识卡片】深度学习换脸算法都有哪些?如何长期进行学习

    大家好,欢迎来到我们的星球知识小卡片专栏,本期给大家分享人脸换脸算法相关的资源. 作者&编辑 | 言有三 1 基于3D模型的换脸 基于3D模型的换脸算法是一类非常经典的思路,它首先对人脸进行三 ...

  10. 【星球知识卡片】残差网络家族10多个变种学习卡片,请收下!

    大家好,欢迎来到我们的星球知识卡片专栏,本期给大家分享残差网络模型的一些变种. 作者&编辑 | 言有三 1 残差连接诞生 残差连接的思想起源于中心化,在神经网络系统中,对输入数据等进行中心化转 ...

最新文章

  1. git分支指的是_你一定知道的Git分支模型
  2. react native的页面整体下拉刷新
  3. STL中的unique函数
  4. 【动态规划】叠放箱子问题(ssl 1640)
  5. Spark SQL UDF2的使用
  6. pat 乙级 1015 德才论(C++)
  7. 哈维玛德学院 计算机,哈维玛德学院优势多多,令人神往!
  8. liunx 命令手册 (chm)
  9. php订单日期分类,PHP订单即将到来的日期
  10. 诺基亚100G光传输网络助力Jio泛印度4G网络大幅增长
  11. 51单片机怎么显示当前时间_历史曲线按照时间截取,并且显示波峰波谷值应该怎么做?...
  12. python安装包后找不到指定模块
  13. 招银网络Java后端笔试题
  14. Linq查找最大值max最小值min效率比较
  15. 云环境下搭建FTP服务器(不使用21端口)
  16. hiar sdk for android,HiAR | HiAR SDK for Unity | 涂涂乐开发教程
  17. PPT一次性压缩图片
  18. 怎么把vue改写成html,vue将字符串转为为html
  19. 【今日CV 计算机视觉论文速览 第101期】Wed, 17 Apr 2019
  20. 一、什么是JavaWeb?

热门文章

  1. Rewrite HTTP to HTTPS in Nginx
  2. 值栈ValueStack的原理与生命周期
  3. mac使用php-version切换PHP版本
  4. C++求解汉字字符串的最长公共子序列 动态规划
  5. hdu 1026【Ignatius and the Princess I】
  6. Javascript中eval函数的用法
  7. mysql视图高峰事务_MySQL-视图与事务「程序员培养之路第二十六天」
  8. java 开发必备的安全架构知识
  9. springcloud之gateway服务网关
  10. RocketMQ消费端消息回退(消费重试)机制源码解析