论文阅读——《Robust Superpixel Tracking》

  • 论文阅读——《Robust Superpixel Tracking》
    • 《Robust Superpixel Tracking》

论文阅读——《Robust Superpixel Tracking》

《Robust Superpixel Tracking》

这是2014年发表在 IEEE Transactions on Image Processing上的一篇文章,主要基于超像素的方法解决外观发生剧烈变化的物体追踪问题,下面是论文实验的结果



第一个表是定位的误差,第二个表是成功追踪的帧数,看上去本文的方法(SPT)都很棒啊,但是好奇的是为什么SPT在Tracking的圈子里好像不是很出名,在这篇知乎回答 计算机视觉中,目前有哪些经典的目标跟踪算法里都没有提到SPT的方法,是因为太慢?(五帧每秒),博主对Tracking接触得不多,因此这个问题还有待考证。

这里我就简单总结下论文提到的方法,作为学习参考,下面是本文算法的伪代码:


算法的主要步骤是 初始化过程追踪过程,其中
初始化过程
(1)对视频流的前四帧进行超像素分割,并对分割出来的超像素提取特征(这里的特征是 HSI颜色空间的颜色分布直方图),然后用这些特征构建一个特征池 F={ftr∣t=1,…,m;r=1,…,Nt}F=\left\{f_{t}^{r} | t=1, \ldots, m ; \quad r=\right.1, \ldots, N_{t} \}F={ftr​∣t=1,…,m;r=1,…,Nt​};

(2)对特征池内的特征进行Kmeans聚类获得基于超像素的外观辨别模型(superpixle-based discriminative appearance model):
外观辨别模型其实指的是各个聚类的特征描述符,的主要由四个参数构成,分别是聚类的中心fc(i)f_{c}(i)fc​(i),聚类的半径rc(i)r_{c}(i)rc​(i),聚类的超像素的数量{ftr∣ftr∈clst(i)}\left\{f_{t}^{r} | f_{t}^{r} \in c l s t(i)\right\}{ftr​∣ftr​∈clst(i)},以及聚类的置信度CicC_{i}^{c}Cic​(属于前景还是背景的概率),其计算公式如下Cic=S+(i)−S−(i)S+(i)+S−(i),∀i=1,…,nC_{i}^{c}=\frac{S^{+}(i)-S^{-}(i)}{S^{+}(i)+S^{-}(i)}, \forall i=1, \ldots, n Cic​=S+(i)+S−(i)S+(i)−S−(i)​,∀i=1,…,n其中S+(i)S^{+}(i)S+(i)和S−(i)S^{-}(i)S−(i)分别表示聚类iii和前景、背景的覆盖面积(这里我就有一个问题啦,难道还得先确定哪个像素属于前景哪个像素属于背景?)

追踪过程
(1)对图像进行超像素的分割并提取各个超像素的特征,计算目标背景的置信图
这个置信图是针对各个超像素来说的,主要包括两个部分构成,一部分是这个超像素属于哪个聚类,另一部分是这个超像素与聚类中心超像素的特征的距离,其计算公式如下:Crs=w(r,i)×Cic,∀r=1,…,NtC_{r}^{s}=w(r, i) \times C_{i}^{c}, \quad \forall r=1, \ldots, N_{t} Crs​=w(r,i)×Cic​,∀r=1,…,Nt​其中w(r,i)=exp⁡(−λd×∥fIF−fc(i)∥2rc(i))∀r=1,…,Nt,i=1,…,n\begin{array}{l}{w(r, i)=\exp \left(-\lambda_{d} \times \frac{\left\|f_{I}^{F}-f_{c}(i)\right\|_{2}}{r_{c}(i)}\right)} \\ {\forall r=1, \ldots, N_{t}, \quad i=1, \ldots, n}\end{array} w(r,i)=exp(−λd​×rc​(i)∥fIF​−fc​(i)∥2​​)∀r=1,…,Nt​,i=1,…,n​CrsC_{r}^{s}Crs​就是第ttt帧的第rrr个超像素的置信度(属于前景还是背景的概率)。

(2)基于置信图采样NNN个状态(其实指的就是追踪用的bounding box)
本文的贝叶斯更新是通过采样更新的,其实我觉得指的就是SIR粒子滤波,根运动模型采样预测的状态,然后根据观测模型判断哪个状态是最合理的X^t=argmax⁡Xt(l)p(Xt(l)∣Y1:t)∀l=1,…,N\hat{X}_{t}=\underset{X_{t}^{(l)}}{\operatorname{argmax}} p\left(X_{t}^{(l)} | Y_{1 : t}\right) \forall l=1, \ldots, N X^t​=Xt(l)​argmax​p(Xt(l)​∣Y1:t​)∀l=1,…,N

(3)计算运动模型和观测模型:
运动模型如下:p(Xt∣Xt−1)=N(Xt;Xt−1,Ψ)p\left(X_{t} | X_{t-1}\right)=\mathcal{N}\left(X_{t} ; X_{t-1}, \Psi\right) p(Xt​∣Xt−1​)=N(Xt​;Xt−1​,Ψ)其中Ψ\PsiΨ是运动的参数(σc\sigma_{c}σc​表示移动变换的参数,σs\sigma_{s}σs​表示尺度变换的参数,但是σc\sigma_{c}σc​和σs\sigma_{s}σs​的具体表达式文中并诶有给出)的方差
观测模型如下:p(Yt∣Xt(l))=C^l,∀l=1,…,Np\left(Y_{t} | X_{t}^{(l)}\right)=\hat{C}_{l}, \forall l=1, \ldots, N p(Yt​∣Xt(l)​)=C^l​,∀l=1,…,N其中C^l\hat{C}_{l}C^l​表示各个采样的归一化置信度C^l=Cl×[S(Xt(l))/S(Xt−1)],∀l=1,…,N\hat{C}_{l}=C_{l} \times\left[S\left(X_{t}^{(l)}\right) / S\left(X_{t-1}\right)\right], \forall l=1, \ldots, N C^l​=Cl​×[S(Xt(l)​)/S(Xt−1​)],∀l=1,…,NCl=∑(i,j)∈Mlvl(i,j)C_{l}=\sum_{(i, j) \in M_{l}} v_{l}(i, j) Cl​=(i,j)∈Ml​∑​vl​(i,j)其中vl(i,j)v_{l}(i, j)vl​(i,j)表示像素(i,j)(i,j)(i,j)处的置信度大小(查询它位于哪个超像素就能知道)ClC_{l}Cl​指的是没有归一化的状态置信度,而S(Xt(l))S\left(X_{t}^{(l)}\right)S(Xt(l)​)和S(Xt−1)S\left(X_{t-1}\right)S(Xt−1​)表示的是当前状态的采样和前一状态(这里的状态都可以理解为跟踪的bounding box)的面积,这一步的具体操作可以根据下图理解


右边四个图就是采样结果,然后根据观测可以判断 xt(1)x_{t}^{(1)}xt(1)​是对合理的,因此将 xt(1)x_{t}^{(1)}xt(1)​更新为当前状态。

(4)基于最大似然概率估计最有可能的状态
这个其实就是上面的更新过程

(5)检测和解决严重冲突的情况(这个机制我们先不去关注它,先搞清楚算法是怎样实现追踪的)
这里的步骤还没有细看,但是是很巧妙的,SPT之所以能具有良好的了鲁棒性和这一步的操作是分不开的,这个具体流程之后再看。

未完待续…

论文阅读——《Robust Superpixel Tracking》相关推荐

  1. 《基于卷积神经网络的深度迁移学习,用于燃气轮机燃烧室的故障检测》论文阅读

    目录 突出 抽象 引言 1.1动机 1.2文献综述获得的结论 1.3贡献 1.4组织 2方法 2.1燃汽轮机组故障知识共享 2.2迁移学习 2.3 基于卷积神经网络的深度迁移学习 2.4用于燃气轮机燃 ...

  2. 基于卷积神经网络和投票机制的三维模型分类与检索 2019 论文笔记

    作者:白静 计算机辅助设计与图形学学报 1.解决的问题 由于三维模型投影得到的视图是由不同视点得到,具有相对独立性,这种像素级的融合运算并没有直接的物理或者几何意义,更有可能造成图像有益信息淹没和混淆 ...

  3. TextCNN——基于卷积神经网络的文本分类学习

    1.CNN基础内容 CNN的全称是Convolutional Neural Network,是一种前馈神经网络.由一个或多个卷积层.池化层以及顶部的全连接层组成,在图像处理领域表现出色. 本文主要学习 ...

  4. 读懂深度迁移学习,看这文就够了 | 赠书

    百度前首席科学家.斯坦福大学副教授吴恩达(Andrew Ng)曾经说过:迁移学习将是继监督学习之后的下一个促使机器学习成功商业化的驱动力. 本文选自<深度学习500问:AI工程师面试宝典> ...

  5. 一种基于卷积神经网络的图像去雾研究-含matlab代码

    目录 一.绪论 二.去雾卷积网络 2.1 特征提取 2.2 多尺度映射 2.3 局部均值 2.4 非线性回归 三.实验与分析 四.Matlab代码获取 一.绪论 雾是一种常见的大气现象,空气中悬浮的水 ...

  6. 机械臂论文笔记(一)【基于卷积神经网络的二指机械手 抓取姿态生成研究 】

    基于卷积神经网络的二指机械手 抓取姿态生成研究 论文下载 摘要 第1章 绪论 1.1 抓取生成国内外研究现状 1.1.1已知物体抓取生成 1.1.2相似物体抓取生成 1.1.3 未知物体抓取生成 1. ...

  7. 毕业设计 - 基于卷积神经网络的乳腺癌分类 深度学习 医学图像

    文章目录 1 前言 2 前言 3 数据集 3.1 良性样本 3.2 病变样本 4 开发环境 5 代码实现 5.1 实现流程 5.2 部分代码实现 5.2.1 导入库 5.2.2 图像加载 5.2.3 ...

  8. 基于卷积神经网络与迁移学习的油茶病害图像识别

    基于卷积神经网络与迁移学习的油茶病害图像识别 1.研究思路 利用深度卷积神经网络强大的特征学习和特征表达能力来自动学习油茶病害特征,并借助迁移学习方法将AlexNet模型在ImageNet图像数据集上 ...

  9. Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类)

    Python深度学习实例--基于卷积神经网络的小型数据处理(猫狗分类) 1.卷积神经网络 1.1卷积神经网络简介 1.2卷积运算 1.3 深度学习与小数据问题的相关性 2.下载数据 2.1下载原始数据 ...

  10. 基于卷积神经网络实现图片风格的迁移 1

    卷积神经网络详解 一.实验介绍 1.1 实验内容 Prisma 是最近很火的一款APP,它能够将一张普通的图像转换成各种艺术风格的图像.本课程基于卷积神经网络,使用Caffe框架,探讨图片风格迁移背后 ...

最新文章

  1. python读取文件名存到list_批量读取文件夹中的文件名
  2. UNIX再学习 -- 文件和目录
  3. 科目三中模拟灯光使用考试常见的错误 广州学车网光大国际驾校学车
  4. 关于信贷业务中常用的模型说明
  5. 渗透测试入门5之内网信息搜集
  6. JavaScript字符串String常用方法介绍
  7. python怎么安装json_python里面怎么安装json包
  8. python request模块下载_python中的Requests模块
  9. 金士顿优盘突然出现写保护,无法删除更改数据也没有办法格式化
  10. 【QT】信号和槽机制
  11. jbpm5.4 mysql_5.BDF2-JBPM4
  12. 低电平有效的三种表示方法
  13. 从羽泉演唱会大数据看在线演出前景
  14. win7浏览器主页修改不过来_Win7 IE无法修改默认主页怎么办?解决IE浏览器主页无法修改主页...
  15. MySql超详细分析(InnoDb存储引擎,日志文件,调优,索引,主从复制简单操作等)
  16. matlab之设置坐标轴范围和纵横比函数axis
  17. 3t硬盘用什么软件测试显卡,【转】希捷酷鱼3TB网友试用---玩转3T硬盘,就是这么容易...
  18. 解决桌面图标无法拖动的方法
  19. 11.集合之List
  20. vue动态路由传参---query传参和params传参

热门文章

  1. 解决从github上拉取代码慢的问题
  2. 使用IDEA基于Maven搭建多模块聚合工程(springmvc+spring+mybatis整合)
  3. springmvc教程(2)
  4. php+json对象格式,PHP 创建对象来输出 JSON 格式
  5. 剑指offer(26-33题)详解
  6. 大学期间承接软件项目的一些个人观点
  7. Linux下的命令总结笔记(二)
  8. [转](总结)Linux/UNIX的scp命令用法详解
  9. android恶意代码检测报告,用机器学习检测Android恶意代码
  10. shell+中sum的用法_SUM函数从入门到进阶,不用放弃!