基于张量秩一分解的多目标跟踪方法

张量秩一分解
数据关联
多目标跟踪

读‘X. Shi, H.Ling, J.Xing, W.Hu, Multi-target Tracking by Rank-1 Tensor Approximation[J],CVPR,2014’笔记

这篇文章利用了张量的秩一分解建模了多目标跟踪中的data association问题。

首先我们了解下张量的基本知识

张量

张量是向量的推广,阶张量表示为,每一个元素表示为.

张量的n模积:张量与矩阵的n模积表示为,得到的是新的张量.

显然,当张量与向量进行n模积时,新的张量的阶数就减少一阶。

秩一张量:如果一个K阶张量能够表示成K个向量的外积,那么该向量称为秩一张量,即

张量的近似秩一分解:对于K阶张量,寻找K个单位向量和尺度因子,使重构误差

最小,则称之为张量近似秩一分解。

,那么上述最小化问题转化为

因为都是单位向量,所以,于是.
那么等价于

这里表示点乘.

所以张量的近似秩一分解问题就转化为下面的最大化问题

Multi-Dimensioanl Assignment (MDA)

那么张量和多目标跟踪有毫子关系呢?我们先来看看多维数据关联的目标式

这里面呢其实是用来给不同的轨迹标号的,表示第一帧中的第个目标在该轨迹上。

将轨迹线表示成下面的形式更容易理解

就表示前后两帧中目标的关联,

考虑到关联匹配中都是非负变量,我们将(2)式写成类似于(1)式的形式

这里的是对两帧之间的关联进行的重新编号,如下图所示。

1477145036424.jpg

所以(3)式和(1)式的不同点就在于约束条件的不同,张量的秩一分解中要求是单位向量,而(3)式中要求得到的满足对应的关联矩阵的每行每列的单位范数。

文中给出了一种单位范数约束的张量近似迭代算法,如下

1477145485732.jpg

并且给出了算法的收敛性证明,我觉得这点很重要~

1477145603758.jpg

1477145652159.jpg

而(3)式中要求的是行列分别单位化,所以这里对算法进行稍微的修改,在每一次更新后对所对应的矩阵进行行列的单位化,下面给出了具体算法,其实能发现算法5和算法4除了归一化方式不一样,其他都一毛一样。

1477146182293.jpg

这里对应着第n个关联集合中的第个关联。对应的是,对应的是所对应的关联矩阵。


基于张量近似的多目标跟踪算法

在实际应用中,对视频进行分批处理,当然批之间存在部分时间重叠,每一批使用算法5得到轨迹段,然后通过重复的点实现轨迹段的串接,形成更长的轨迹。

1477146432065.jpg

张量的构建

算法已经有了,现在问题就是张量的构建问题了,其元素项表示由连续的两帧轨迹假设组成的全局关联假设所对应的能量。

文中给了两种组织形式,分别类似于两帧匹配问题和网络流优化问题。

如果将轨迹的全局能量表示成局部两帧关联的能量之和,那么求解问题就转化为求解K个两帧匹配问题的最优解

其中表示第i帧中目标的个数。

如果将轨迹的全局能量表示成局部两帧关联的能量之积,那么求解问题就和网络流的优化形式相似。

关联假设的产生

实际应用中相邻帧之间的目标往往距离较近的才可能存在关联关系,所以为了降低张量的大小,可以对关联加上区域约束,即目标仅可能与一定范围内的下帧中目标产生关联。

对于目标的遮挡、进入和离开问题,论文中引入了虚拟目标的概念。虚拟目标没有实际的物理意义例如位置、表观等,其作用是将孤立的目标引导出去,避免干扰存在真实关联的目标。对每一帧中每个目标的检测,都在相邻帧中设置一个对应的虚拟目标。

算法的初始和终止

三种初始方案:

  1. 所有的局部关联均等

  2. 权值初始化,按照关联的强度赋予不同的权重

  3. 决策初始化,先用匈牙利算法进行两帧关联,然后对结果进行扰动(这里要保证, 0-1将使算法陷入静态点)
    初始化之后必须行列规范化

两种终止方案:

  1. 满足最大迭代次数

  2. 相邻迭代能量变化微小

后续处理:
因为最终输出要求是0-1值,所以要对近似张量分解得到的结果进行二值处理,这个时候可以采用匈牙利算法寻找使全局轨迹概率最大的轨迹。

分析与总结

论文的主要创新点在于将MDA(multi-dimensional association)问题放到了张量的近似秩一分解的框架中,通过对张量的分解来获得相邻帧之间的关联关系。

由于标准的张量秩一分解中基向量要求规范化的,而在MDA问题中的约束是对应的关联矩阵行列都是规范化的,所以论文中给出了一种迭代算法,并通过证明算法每一步都能够使目标函数上升推断出算法是收敛的(单调有界)。

接下来我们来看一看该模型是怎么包括MTT中待解决的几个要素的。

  1. 观测变量与状态变量。该模型直接使用的是观测变量,也就是说仅仅是将检测到的变量进行MDA,并不能保证跟踪结果的光滑等特性

  2. 动态模型。这部分内容主要包括运动的惯性问题,体现在张量的构建中,论文中给出的体现了这部分内容

其中

其中分别表示该轨迹上k,k+1帧目标的速度矢量,显然第一项表示速度方向差异,第二项表示速度大小差异。

  1. 表观模型。显然相邻帧中同一目标应该是变化缓慢的,(4)式中则表示的是表观相似性。

其中第一项计算的是直方图的交,第二项刻画的关联目标的面积大小相似性。

  1. 遮挡

  2. 轨迹开始与终止
    论文中仅仅在两帧关联时添加了一个虚拟节点,用来处理遮挡、轨迹开始和轨迹终止。
    个人觉得这里处理的太粗糙,没有考虑到目标被遮挡程度的问题,也没有说明什么情况下认为是漏检,什么情况下是轨迹终止,更重要的是没有说明什么情况下认为是轨迹的开始,因为不能保证第t帧结束的轨迹与第t+1帧的虚拟目标和第t+1帧新进入的目标谁的关联性更大。

Note. 论文中的算法可以并行处理。且算法中将的行列规范化松弛成规范化进行软决策,能够减少引入关联误差的风险。

转载于:https://www.cnblogs.com/YiXiaoZhou/p/5990097.html

基于张量秩一分解的多目标跟踪方法相关推荐

  1. AI论文解读:基于Transformer的多目标跟踪方法TrackFormer

    摘要:多目标跟踪这个具有挑战性的任务需要同时完成跟踪目标的初始化.定位并构建时空上的跟踪轨迹.本文将这个任务构建为一个帧到帧的集合预测问题,并提出了一个基于transformer的端到端的多目标跟踪方 ...

  2. 9.3 低秩矩阵分解-机器学习笔记-斯坦福吴恩达教授

    低秩矩阵分解(Low Rank Matrix Factorization) 我们将用户对电影的评分表格: 用矩阵表示: Y=[55005??0?40?00540050]Y=\left[\begin{m ...

  3. 社交网络中基于张量分解的好友推荐

    社交网络中基于张量分解的好友推荐 摘要 引言 相关研究 问题描述 所提好友推荐方法 实验验证 结论 摘要 社交网络中快速增长的用户对现有好友推荐系统提出了挑战.本文我们用张量分解模型基于用户的标签行为 ...

  4. 基于低秩张量的高光谱图像重建理论基础-基础知识学习

    原文<基于张量低秩稀疏恢复理论的遥感高光谱图像降噪研究> 本文为选择学习的部分章节的节选内容,根据个人学习侧重点,内容有所删减调整. [1]黎波. 基于张量低秩稀疏恢复理论的遥感高光谱图像 ...

  5. 基于张量分解的遥感图像恢复及常用高光谱遥感数据集

    本文为初期学习总结,本篇文章总结了遥感高光谱图像研究背景.高光谱图像噪声的分类,介绍了基于张量的图像恢复方法及近年来对于张量分解的相关研究,总结了几个常用的图像评价指标,总结了高光谱遥感图像常用的数据 ...

  6. 基于张量分解和关系约束的多种类型的MicroRNA-疾病预测

    今天给大家介绍的文章是"Tensor Decomposition with Relational Constraints for Predicting Multiple Types of M ...

  7. 基于张量的多元多阶马尔科夫多模态预测方法

      本博客整理自研读的论文,文末会附上出处. 基于张量的多元多阶马尔科夫多模态预测方法 一.问题背景 二.多元多阶马尔科夫模型 1.张量连接和张量统一乘 2.多元多阶马尔科夫转移模型 3.多元多阶马尔 ...

  8. 论文浅尝 | TuckER:基于张量分解的知识图谱补全

    笔记整理:孙泽群,南京大学计算机科学与技术系,博士研究生. 论文链接:https://arxiv.org/abs/1901.09590   背景 知识图谱是图结构的数据库,以三元组(es, r, eo ...

  9. Nature Communications:基于弥散张量成像的人类纤维束连接体方法面临的挑战

         纤维束成像是一种基于弥散加权磁共振成像(diffusion-weighted magnetic resonance imaging, DWI)的计算重建方法,它试图揭示人脑白质通路的轨迹,并 ...

最新文章

  1. python Pil byteio转换
  2. 11kw星三角启动延时几秒_电机星三角降压启动原理图
  3. Vue2.0环境安装
  4. STM32F10X的boot分析
  5. 如何在input输入框中加一个搜索的小图片_前端开发困难重重,如何把握机会学习?...
  6. 结尾的单词_22个以“ez”结尾的西语单词,你掌握了吗?
  7. 全字符微信名 php,PHP方法处理微信昵称特殊符号过滤
  8. 【OS学习笔记】三十二 保护模式九:分页机制对应的汇编代码之---内核代码
  9. Windows Registry
  10. 教你如何使用win7系统屏幕键盘--win7w.com
  11. 主动学习,半监督学习,直推学习
  12. 《css揭秘》读书笔记(1)-背景与边框
  13. Phonetic symbol 单元音 - 长元音 -- ɜː (新) / ə: (旧) 与 ɔː
  14. Multipart/form-data文件上传简介
  15. 【干货】Android实现支付宝当面付
  16. 嵌入式C设计模式---工厂设计模式
  17. 艾伟:MSBuild 简解
  18. 概率论与数理统计 Chapter3. 随机变量的数字特征
  19. 快速生成APP的平台
  20. Java怎么打开文件夹

热门文章

  1. 使用jQuery获取GridView的数据行的数量
  2. PHP安全新闻早8点_1127
  3. UML类图中会涉及到的一些概念、关系
  4. 大数据之-Hadoop3.x_Yarn_生产环境核心参数配置案例---大数据之hadoop3.x工作笔记0150
  5. Sharding-JDBC读写分离_实现_Sharding-Sphere,Sharding-JDBC分布式_分库分表工作笔记017
  6. 疫苗:Java HashMap的死循环(转)
  7. zeromq+python安装手册
  8. 编程之美——数字哑谜
  9. 随想录(豆瓣网站的爬行)
  10. C语言和设计模式(之组合模式)