本节课主要是对视频分类的发展进行了介绍,包括任务与背景,分类方法,前沿进展等。课程地址为:https://aistudio.baidu.com/aistudio/course/introduce/1340?directly=1&shared=1。

文章目录

  • 1. 任务与背景
  • 2. 视频分类方法
    • 2.1 双流网络方法
    • 2.2 静态图像特征聚合
    • 2.3 3D卷积方法
  • 3. 前沿进展
    • 3.1 高效视频网络
    • 3.2 运动增强的RGB分类
    • 3.3 快慢信息结合网络
    • 3.4 光流表示学习
    • 3.5 时序金字塔网络

1. 任务与背景

这里首先给出了什么是视频分类的定义:将一段视频分类到预先制定类别集合中的某一个或多个。

然后给出了视频分类的发展历程:分为前深度学习时代深度学习时代


2. 视频分类方法

视频与图像不同,它由空间维度和时间维度组成。包括静态图像特征,运动特征,音频特征,外部特征等。由于其特征之多和复杂,视频处理可以看作是CV皇冠上的明珠。
目前主要的方法有:双流网络,静态图像特征聚合,3D卷积

2.1 双流网络方法

借鉴人类大脑处理视觉信息的方式,研究人员设计了全新的网络结构,实现静态图像特征和运动信息统一,互补的提取和分类,主要论文有以下三篇。

NIPS-2014 CVPR-2016 ECCV-2016

2.2 静态图像特征聚合

方法主要是提取视频不同时刻多帧图像的特征,聚合生成视频级特征,进而分类。

主要代表论文有以下4篇:
首先是用CNN+LSTM提取静态图像特征并构建时序关系,然后进行分类。

CVPR-2015 ICMR-2016

然后也有学者对视频图像和光流进行特征提取,也有的学者使用Attention进行最后分类:


2.3 3D卷积方法

3D卷积是从水平、垂直和时序三个方向同时提取视频时空特征,但是计算量太大。

后来又学者借鉴残差结构,降低了3D卷积的计算复杂度,处理时先在图像空间卷积,再在时间维度卷积。

后来学者又进行了改进,提出了图像+视频联合预训练的方法。


3. 前沿进展

最新的视频处理方法主要有:高效视频网络,运动增强的RGB分类,快慢信息结合网络,光流表示学习,时序金字塔网络。

3.1 高效视频网络

这是本次课程论文复现里的一篇:ECO网络。


3.2 运动增强的RGB分类

这篇论文也是开创性的,避免了光流的计算。


3.3 快慢信息结合网络

这篇论文设计了两条通道,快速与慢速通道,降低了计算量。


3.4 光流表示学习

这篇论文主要工作是把光流信息用网络学习了出来。


3.5 时序金字塔网络

这也是本次课程需要复现的论文之一,

最后是未来展望:

百度顶会论文复现(3):视频分类综述相关推荐

  1. 百度顶会论文复现(1):课程概述

    最近百度推出了一款重磅课程<全球顶会论文作者,28天免费手把手带你复现顶会论文>.这个课程真的是很硬核的课程,这里简单记录下自己的学习过程. 文章目录 1. 课程设计思路和安排 2. 课程 ...

  2. 百度顶会论文复现(2):GAN综述

    本节课主要是对GAN的发展进行了介绍,包括基本原理,训练方法,存在问题,改进以及应用场景等.实践作业则为手写数字生成.课程地址为:https://aistudio.baidu.com/aistudio ...

  3. 百度顶会论文复现(4):飞桨API详解

    本节课主要是对飞桨常用API进行了介绍,课程地址为:https://aistudio.baidu.com/aistudio/education/group/info/1340. 文章目录 1.飞桨AP ...

  4. 这个顶会论文复现比赛,单篇最高现金奖3W!

    飞桨论文复现挑战赛(第六期)和春天一起来啦!本次挑战赛再度升级,无论是奋战过前五期比赛的复现冠军,还是首次接触论文复现的潜力选手,都有惊喜赛题任务等你来挑战. 论文复现是深入掌握前沿模型原理的最优方式 ...

  5. 计算机视觉顶会论文复现,计算机视觉论文_2014年 计算机视觉会议征稿_accv

    计算机视觉哪个领域更有市场前景和就业前景,更可能出论文专利成果? 本人在一所大学的视觉实验室学习,面临方向选择,有语义分割,显著性检测,slam,医学图像,希望大佬们能- 在计算机视觉论文中bench ...

  6. 百度飞桨顶会论文复现(5):视频分类论文之《Representation Flow for Action Recognition》篇

    这次老师在课上总共领读了4篇分类论文,我这里分享其中的一篇论文,是关于使用神经网络对光流进行学习. 课程地址是:https://aistudio.baidu.com/aistudio/educatio ...

  7. PaddlePaddle顶会论文复现 | ECO视频动作识别网络

    论文题目:ECO: Efficient Convolutional Network for Online Video Understanding 论文链接:https://arxiv.org/abs/ ...

  8. 百度飞桨论文复现训练营笔记1

    需要复现的论文涉及到torch模型到paddle模型的转换,才开始了解到百度智能云平台.在过去我对它的认识仅集中在调用人家写好的接口实现功能,这次的任务是通过学习训练营课程去复现一篇论文,其中就涉及到 ...

  9. 百度Paddle视频分类论文3D Resnet论文复现

    前段时间参加了百度深度学习论文复现营--视频分类论文复现,在此做一些学习记录,希望可以帮助到有需要的朋友 学习资源 百度顶会论文复现营 https://aistudio.baidu.com/aistu ...

最新文章

  1. LSI SAS 3108 配置操作
  2. 路飞学城14天集训营作业2—三级菜单
  3. C#基础16:事件与观察者模式
  4. 用python写的游戏有哪些_想用Python写个小游戏?这个项目里有21个例子
  5. Drool规则引擎介绍
  6. java中json转对象_Java开发中json使用,各对象与json相互转换
  7. ws协议绑定服务器域名,Websocket直接域名连接
  8. MyExcel 3.9.8 版本发布
  9. Android 关于 ActionBarSherlock 的使用
  10. android 讯飞语音 提示组件未安装,迅雷看看提示“未安装组件”原因及其解决方法...
  11. Messari:21年第二季度Web3及NFT报告
  12. Arduino安装与配置ESP8266开发板(超简单,亲测有效)
  13. 高级查询组件下拉框联动(三)
  14. 虹科资讯| 虹科AR荣获汽车后市场“20佳”维修工具评委会提名奖!
  15. 使用python动手爬取智联招聘信息并简单分析
  16. 解题笔记(39)——过河问题
  17. legacy引导gpt分区_传统Legacy引导和MBR硬盘格式无损更换UEFI和GPT的操作
  18. 2016百度之星 - 测试赛 1002 列变位法解密 (模拟)
  19. Linux复习_铁之ppt
  20. hpunix oracle rac,hp unix oracle rac节点一磁盘损坏,节点修复

热门文章

  1. 旅馆客未满 计算机术语,前厅测试题
  2. 北京交通大学计算机系2018年录取情况,北京交通大学2018年高招录取分数线汇总...
  3. 上海大学c语言作业答案,《上海大学C语言选择题》.doc
  4. mysql编译安装后目录空_MySQL源码安装完成后修改安装路径启动问题
  5. java符号引用 直接引用_Java -- JVM的符号引用和直接引用
  6. linux安装mysql 5.6_linux 安装mysql5.6
  7. exception日志 php_PHP 错误与异常的日志记录
  8. 上的img表示什么_方向盘上的SET、RES和CNL,表示什么意思?别弄错了
  9. 爬虫技术python流程图_基于Python的网络爬虫技术研究
  10. rabbitmq 拉取消息太慢_面试官:消息队列这些我都要问