Github-blog
CSDN-blog

原理简介

在动作视频中,运动区域像素发生剧烈的变化,但是在完成一套动作前,其动作代表的含义是不变的,即其视频表达的高层语义未发生变化。慢特征分析算法,通过剧烈变化的像素寻找其内含的高层语义信息,计算相应的特征来表征其高层语义信息,用以识别。视频中的动作识别大致可分为视频预处理、特征兴趣点提取、输入视频信息整理、慢特征分析、特征描述、特征分类。本文主要解析其中核心算法 慢特征分析部分。

算法数学推导过程

将I维输入信号记作:X(t)= [x1(t), x2(t), …, xi(t)]T,其中t属于(t0 , t1)。慢特征分析算法的目的是要寻找一组映射函数:G(x)=[g1(x), g2(x) , … , gj(x)],使得输出信号:`Y(t) = [ y1(t), y2(t), … , yj(t)]T在时间维度上缓慢变化。其中:yj(t) = gj(x(t))。其中g1(x) , g2(x) , …. ,gj(x)即为所求的慢特征函数。

慢特征分析算法的核心就是寻找一组映射函数使得输入信号经过变换后得到的输出信号变化缓慢。输出信号变化缓慢用数学公式表达即为:Δj = Δ(yj) = < y(。)j2> t 最小,其中 j属于{ 1,…,J}。(注:“y(。)”表示“y”的一阶导数点应该在y上方的==下同理,“t”表示y在t时刻的瞬时平均值。)确定这一目标表达式后,为该表达式添加约束条件:

< y1 >t = 0 ; (1)

< yj2>t = 1 ; (2)

对于任意j’ < j : < yj’ yj > t=0 ; (3)

约束条件(1)的作用是方便满足约束条件(2)和约束条件(3)的要求;约束条件(2)的作用是保证输出信号携带有用信息,避免一些简单的解决方案使得输出信号变成常数;约束条件(3)表示去相关,输出信号的每一维yj都表示信号中不同类型的信息,同时,约束条件(3)也使得输出信号中y1是变化最缓慢的,y2的变化缓慢的程度其次,y3更次之,依次类推。

如果映射函数是线性的,即gj(x) = wjTx ,其中x是输入信号,wj是其相应的加权值。那么SFA映射函数的求解问题可以等同于广义特征值的求解问题:

AW = BWΛ

其中,A = < x(。)x(。)T>t表示输入信号在时间维度上一阶导数协方差的统计平均,B=< xxT>t 表示输入信号协方差的统计平均。Λ是广义特征值组成的对角矩阵,W是广义特征向量组成的矩阵。其推导过程可为:

< Y(。)2> = <(wjTx(。))2> = < wjTx(。)x(。)Twj>= < wjTAW>

= < wjTXXTwj>=< wjTBW>

< Y(。)2>t=Λ= < Y2>tΛ, 所以 AW = BWΛ

此外,慢特征函数是由特征值Λ决定的,即特征值越小,对应的慢特征函数求得的输出函数变化越慢。

对于非线性的变换,可以认为是在非线性空间中的线性变换。非线性变换函数h(x)可以定义为: h(x)=[h1(x), … ,hM(x)].

例如:h(x)= [x12, x1x2 , x1x3, 22 , x2x3, x32, x1, x2, x3] 可以认为是对三维输入信号:x = [ x1, x2, x3] 的二次非线性扩展。因此,慢特征分析可以在非线性空间求解,从而获得非线性的慢特征映射函数。

简而言之,慢特征函数的获取大体可分为以下两个步骤:

1、非线性扩展:

应用非线性函数h(x)对原始输入信号进行非线性扩展,并是h(x)聚拢:z := h(x) – h0,其中:h0 = < h(x)>t。这一操作的目的是使约束条件(1)得到满足。在本文中,我们使用的非线性扩展函数是:h(x)=[x1, … , xi, x1x1, … , xixi]

2、解决广义特征值问题: AW= BWΛ

其中 A := < z(。)z(。)T>t, B = < zzT>t 假设矩阵A 和矩阵B 是M维矩阵,对应于最小的前K个特征值 λ1 ≤λ2 ≤ … ≤λk 的K个特征向量:w1, w2, … , wK 即为所要求的非线性的慢特征函数: g1(x), g2(x), …gK(x):

gj(x) = wjT(h(x) – h(0))

这些g(x) 就可以同时满足约束条件(1)、(2)、(3)以及使得目标表达式最小。

主要参考文献:Zhang Zhang and Dacheng Tao,Slow Feature Analysis for Human Action Recognition,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINEINTELLIGENCE,2012,VOL. 34, NO. 3,page:436-450

以上~

视频识别算法:慢特征分析算法相关推荐

  1. CV Code | 本周计算机视觉新出开源代码汇总(含目标检测、深度估计、视频识别、网络加速算法等)...

    点击我爱计算机视觉标星,更快获取CVML新技术 计算机视觉技术发展迅速,很多时候,可悲的不是我们没有努力,而是没有跟上时代的步伐.努力coding终于出来结果了,却发现早就有人开源了,效果还比自己写的 ...

  2. R-C3D 视频活动检测的经典算法

    R-C3D 视频活动检测的经典算法 目录 论文信息 主要贡献 存在问题 基本思想 关键原理 实验结果 Experimentson THUMOS'14 Experimentson ActivityNet ...

  3. 综述:视频和图像去雾算法以及相关的图像恢复和增强研究

    综述:视频和图像去雾算法以及相关的图像恢复和增强研究 翻译自IEEE的一篇文章<Review of Video and Image Defogging Algorithms and Relate ...

  4. 行为识别笔记:improved dense trajectories算法(iDT算法)

    https://blog.csdn.net/wzmsltw/article/details/53023363 转于:http://blog.csdn.net/wzmsltw/article/detai ...

  5. 人脸识别(7)---国内人脸识别技术 十大算法公司排名

    国内人脸识别技术 十大算法公司排名 科技特讯11月18日讯:1.云从科技 背靠"计算机视觉之父",中科院实验室创业团队创立云从科技 云从科技团队成员除了来自中科大的校友外,还来自中 ...

  6. 十大视频场景化应用工具+五大视频领域冠军/顶会算法开源

    导读 随着短视频的快速发展以及安全管理的需求不断增多,视频领域的相关技术应用包括视频智能标签.智能教练.智能剪辑.智能安全管理.文本视频检索.视频精彩片段提取.视频智能封面正逐渐成为人们生活中的重要部 ...

  7. 基于OpenCV人脸识别Eigenfaces(特征脸)算法、Fisherfaces算法、Local Binary, Patter Histogram(LBPH)算法认识

    一.Eigenfaces(特征脸)算法 在如今的世界,人脸识别也变得越来越重要,应用越来越广泛,比如人脸识别可用于身份认证.摄影.支付.视频等领域.现在人脸识别一般采用三种经典算法:Eigenface ...

  8. 图像和视频的快速去雾算法研究

    王昕, 孙莹莹, 李影昉. 图像和视频的快速去雾算法研究[J]. 影像科学与光化学, 2016, 34(1): 82-87.   WANG Xin, SUN Yingying, LI Yingfang ...

  9. 比微软kinect更强的视频跟踪算法--TLD跟踪算法介绍

    TLD (Tracking-Learning-Detection)是英国萨里大学的一个捷克籍博士生在其攻读博士学位期间提出的一种新的单目标长时间( long term tracking )跟踪算法.该 ...

最新文章

  1. 考研结束了,使用SpringBoot开发一个考研管理系统
  2. 北斗导航 | 监测和减轻空间天气对GNSS应用的影响
  3. C++设计模式之装饰模式
  4. PHP里10个鲜为人知但却非常有用的函数
  5. ubuntu下配置jdk(离线压缩包方式)
  6. 《R语言与数据挖掘最佳实践和经典案例》—— 3.5 将图表保存到文件中
  7. Python类、模块、包的概念及区别
  8. LINUX下opencv的编译安装
  9. C语言 二进制文件读写实例讲解
  10. 电量统计(1)-原理
  11. 评测|抢鲜体验飞凌Linux版LS1028A系列嵌入式开发板
  12. 宏定义是什么?为什么要进行宏定义?宏定义的格式
  13. 使用CYUSB3014实现SPIFlash读写擦除控制
  14. Jdt-compiler是什么?有什么作用
  15. COSOSWAP官网2.0升级——线上圆桌会议重点回顾
  16. 上个厕所的功夫,搞懂MySQL事务隔离级别,Java学习视频百度云盘
  17. 基于PHP+MySQL教务管理系统的设计与实现
  18. 【深入理解TcaplusDB技术】详细介绍TDR表数据类型
  19. LBP(局部二进制模式)
  20. 超级计算机在天文学的应用,破世界记录:交大π2.0超算系统实现天文学N体模拟粒子数新突破...

热门文章

  1. KBEngine demo搭建简介
  2. 互联网大厂面试要求:技术广度、技术深度、系统设计以及项目经验
  3. mysql根据身份证查询年龄
  4. java: 错误: 无效的源发行版:15
  5. 计算机二进制转化教案及ppt,二进制和十进制之间的转换.ppt
  6. 【GEE笔记】制作数据集GIF,自定义可视化参数
  7. GHISALBA GHOPC-600B接触器HYDAC ENS 311P-8-0250-000-K 技术文章
  8. 【学习笔记】【C++】【Leetcode 分门别类讲解】
  9. 基于Android的菜谱推荐系统,基于Android的健康食谱推荐系统研建
  10. swift Kingfisher更新SDK针对downloadImage方法改变