简单总结一下视频特征提取的常见范式:

  1. 直接使用3D卷积(时间轴stride>=2,实现时间维度的下采样) + 3D avg pooling,得到视频的全局表征
  2. 使用帧级别的图像特征 + 序列模型:
  • 使用2D卷积神经网络提取帧图像特征
  • 使用3D卷积神经网络提取帧图像特征(使每帧的图像特征考虑到了近邻帧的特征)
  • 使用ViT模型抽取图像帧特征, patch embedding可以考虑使用2d或者3d嵌入

使用2D卷积提取视频特征的时候,时间轴维度T,先堆叠到batch维度, e.g. NxTxCxHxW - > (NxT)xCxHxW -> 特征提取: (NxT)xD -> reshape回序列特征: NxTxD

序列模型:可以使用lstm以及transformer模型

视频特征提取常用范式总结相关推荐

  1. 多人视频通讯常用架构Mesh/MCU/SFU

    问题:为什么要搞这么多架构? webrtc虽然是一项主要使用p2p的实时通讯技术,本应该是无中心化节点的,但是在一些大型多人通讯场景,如果都使用端对端直连,端上会遇到很带宽和性能的问题,所以就有了下图 ...

  2. 剪辑视频怎么加音效 视频音效常用都有哪些类型

    系统:Windows 10家庭版 软件版本:会声会影2023旗舰版 在剪辑视频方面,大神和小白的区别往往在于细节,比如说视频的音效.为啥大神的视频那么搞笑,其实不单单是剧情给力,音效也很加分.可是剪辑 ...

  3. 视频编辑常用软件有哪些

    视频编辑常用软件有哪些 随着各类短视频软件流行,再加上自媒体的迅速崛起,越来越多人开始选择做视频自媒体账号,把生活中的趣事剪辑成短视频发布至平台,分享给网友,那么视频编辑常用软件有哪些? 1.快剪辑 ...

  4. 模式识别或智能视频处理常用的视频库素材库

    [致谢]http://www.cnblogs.com/rosekin/archive/2013/03/28/2986080.html 模式识别或者智能视频处理常用的视频库: 基本都可以打开,好用,赞一 ...

  5. 【FFmpeg】做一个抖音/快手视频模板常用哪些功能

    最近用ffmpeg做了一批视频模板供公司业务使用,结合shell脚本实现,常用的功能有如下几个: scale:缩放 pad:填补 drawtext:加文字 ffprobe:获取视频一些属性 简单说几个 ...

  6. 音视频开发常用分析工具介绍

    综述 工欲善其事,必先利其器:兵马未到,粮草先行. 在音视频开发过程中,利用工具可以更方便.更直观.更快捷的分析音视频的数据,便于开发过程中分析.调试和解决问题. 现总结一些音视频开发过程中常用的分析 ...

  7. 音视频开发常用名词解释

    音频3A算法 AEC 回声消除(AEC)是指在二线传输的两个方向上同时间.同频谱地占用线路,在线路两个方向传输的信号完全混在一起,本端发信号的回波就成为了本端信号的干扰信号,利用自适滤波器可抵消回波以 ...

  8. 视频输入输出常用接口

    转自http://hi.baidu.com/junlin8848/item/1a8e2bd7fc8b1d312b35c781 随着视频清晰度的不断提升,这也促使我们对高清视频产生了浓厚的兴趣,而如果要 ...

  9. 音视频基础概念(4)—音视频开发常用工具

    目录 1.VLC播放器简介 1.1 VLC 播放器 1.2 VLC的功能列表 1.3 VLC播放网络串流 1.4 VLC作为流媒体服务器 2. MediaInfo简介 2.1 MediaInfo 2. ...

最新文章

  1. 干掉 Postman?测试接口直接生成API文档,这个工具我爱了
  2. Android编程 系统资源的介绍
  3. 编译DirectShow Samples
  4. 编程之美-分层遍历二叉树方法整理
  5. lstm 输入数据维度_LSTM 股票市场预测入门
  6. 精品软件 推荐 360 安全卫士
  7. android textview 动态高度自适应,TextView自适应高度(解决_UITextContainerView布局问题)...
  8. DB2 V9 默认帐户信息和服务启动信息
  9. PHP疗法,人体穴位疗法的秘密-咔咔养生网
  10. 5. DOM解析XML
  11. Python 安装skimage即Scikit-Image
  12. C语言实战之猜拳游戏
  13. Docker 视频教程 ( 猿课 )
  14. 多卡聚合路由器在视频直播中的解决方案
  15. Oracle 容灾方案选择
  16. js中的contains()方法记录
  17. sqlserver数据库练习3
  18. 安卓电子书格式_[技巧] 无敌的boss级电子书阅读app,全能高手就要一个打十个。...
  19. InnoDB log file 设置多大合适?
  20. vue路由、无痕浏览和nodeJS环境搭建、ElementUI简介

热门文章

  1. 对话旷视科技孙剑:iPhone X之外 人脸识别到底安不安全? | AI英雄
  2. SpringBoot JPA 懒加载的问题 ---No session
  3. 神经网络建模的适用范围,神经网络建模步骤视频
  4. [蓝桥杯单片机 八位共阳数码管](4)
  5. fabio docker
  6. bmob php支付,GitHub - bmob/bmob-php-sdk: PHP SDK相关源码
  7. vb.net 编写的简易串口调试程序
  8. python2和pytho3切换_电脑上同时安装Python2和Pytho
  9. mysql数据库熔断_服务熔断
  10. AFEPack 使用 Tutorial(二):解带系数二维泊松方程