理解出错之处望不吝指正。

本文模型就是大名鼎鼎的CSK。

本文的贡献:

(1)稠密采样、循环移位;

(2)循环矩阵带来的快速计算;

(3)计算了不同的核函数的封闭解。

.

  • 稠密采样、循环移位

如上图所示,以往的方法中,采用的都是随机采样,作者说这会带来很大的冗余,并且只使用到了bbox的局部特征。而作者提出的稠密采样可以将整张图片的特征都利用起来。

实际上,训练样本是通过循环移位产生的。首先,稠密采样得到的样本与循环移位产生的样本很像,可以用循环移位来近似;其次,卷积(or互相关)运算在傅里叶域对应可以转化为点乘,且循环矩阵经过傅里叶变换会对角化,这两点都可以减小计算量。

  • 循环矩阵带来的快速计算

首先,我们要知道,对于tracking任务,可以形式化的描写为下式:

这里的代表的是一个线性分类器.

作者使用的是RLS(Regularized Least Squares)损失:.

通过使用kernel trick,这里核函数使用表示。根据表示定理,我们可以得出:.

进一步,我们可以得出RLS with Kernels(KRLS)的封闭解:

这里为kernel martix,为单位矩阵。注意到这个公式中存在矩阵的求逆操作,这会带来很大的计算量,作者接下来的目的就是简化上式的计算量。

作者观察到,一个向量通过循环移位可以得到一个循环矩阵:

若是将循环矩阵和矩阵相乘,即求,可以变换到傅里叶域进行快速计算:

同时作者在论文中提到,循环矩阵的和、点积、求逆都还是循环矩阵。接下来,就是将循环矩阵的性质应用到求解中。

对于一个给定的图片,我们将其转化为一个的向量,则采样操作可以看为:

这里的矩阵是用来实现循环移位的置换矩阵。

接下来,作者证明了,若是一个unitarily invariant kernel,则由元素组成的kernel martix 是一个循环矩阵。这对于KRLS来说是满足的(满足的还有:高斯核函数、线性核函数、多项式核函数等)。则对于组成的向量,这里。参照的变换,可以得到的解:

至此,我们可以快速的计算出,训练过程可以很快速的完成。

注意,我们通篇的目的实际上就是要求解,细心的朋友会问,那呢?论文中第四页最下面有这样一句话:“The bias term b is not important in practice, when finding the maximum response.”。

  • 快速检测过程

对于一个输入图像,response可以通过下式计算:

使用前文中提到的技巧,我们可以通过下式快速的得到response:

这里向量中的元素为.

到目前为止,基本上已经没有矩阵运算了,不过为什么说基本上呢?因为还有一个地方需要矩阵运算,就是计算。接下来,作者对核矩阵的快速计算进行了推导,使上式中彻底没有了矩阵运算,这里就不做介绍了。

  • 本模型的缺点:

(1)采用单通道的灰度特征,特征表达能力有限(KCF/DCF中解决);

(2)循环矩阵会导致边界效应(SRDCF中解决);

(3)模型中没有尺度更新,对尺度变换不敏感(DSST中解决)。

  • 啥是边界效应?

训练阶段,目标中心移动到边缘附近,此时应视为负样本,在检测阶段,当目标移动到边界附近,此时的目标和训练时使用的负样本是比较接近的,但是此时应当把此作为正样本来检测目标。实际算法会将其视为负样本,所以经常会导致跟踪失败。

ECCV 2012 CSK:《Exploiting the circulantstructure of tracking-by-detection with kernels》论文笔记相关推荐

  1. ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss》论文笔记

    理解出错之处望不吝指正. 本文模型叫做DSLT,将跟踪任务视为回归问题去解决.主要贡献包括:①.提出一种收缩损失函数,降低背景信息中的那些简单负样本对损失函数的贡献:②.使用残差连接,融合多个卷积层和 ...

  2. CVPR 2018 FlowTrack:《End-to-end Flow Correlation Tracking with Spatial-temporal Attention》论文笔记

    理解出错之处望不吝指正. 本文模型叫做FlowTrack.本文将光流信息和特征表示结合在一起进行目标跟踪,据作者所说,这是第一个在CNN based tracking中使用光流的模型. 光流的warp ...

  3. ECCV 2020 《Propagating Over Phrase Relations for One-Stage Visual Grounding》论文笔记

    目录 简介 动机 贡献 方法 实验 简介 本文出自香港大学的sibei,二作是中山大学李冠斌老师 下载链接 动机 Phrase level visual grounding具有两个challenge: ...

  4. ECCV 2020 《Improving One-stage Visual Grounding by Recursive Sub-query Construction》论文笔记

    目录 简介 动机 贡献 方法 实验 简介 本文出自罗彻斯特大学+腾讯AI Lab 下载链接 动机 现有的visual grounding方法可以分为两类:一阶段.两阶段.本文面向一阶段方法,提升现有方 ...

  5. CVPR 2019 ATOM:《ATOM: Accurate Tracking by Overlap Maximization》论文笔记

    目录 简介 动机 贡献 方法 实验 理解出错之处忘不吝指正. 简介 本文是MD在ECO系列之后的新paper,CVPR2019的oral,文章质量很高. 文章链接 代码链接 动机 目前,目标跟踪领域的 ...

  6. CVPR 2018 VITAL:《VITAL: VIsual Tracking via Adversarial Learning》论文笔记

    理解出错之处望不吝指正. 本文模型叫做VITAL.作者提到,当前使用DNN的trackers的性能受限于两方面:(1).每一帧中的positive sample在空间上高度重叠,模型不能和好的捕获较好 ...

  7. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

  8. 北大核心期刊2012《科技通报》杂志简介《科技通报》论文范文

    北大核心期刊2012<科技通报>杂志简介<科技通报>论文范文 转载▼ 标签: 刘兴 柳林 科技通报 中文核心期刊 动态规划 文化   刊名: 科技通报 Bulletin of ...

  9. 论文笔记:3D-CVF(ECCV 2020)

    论文笔记:3D-CVF: Generating Joint Camera and LiDAR Features Using Cross-View Spatial Feature Fusion for ...

最新文章

  1. 靠 GitHub 打赏谋生的程序员,他们是怎么做的?
  2. MAT分析OOM问题
  3. vc设备工程师_4注册公用设备工程师专业基础考试真题.
  4. mysql存储过程模糊查询_Mysql之存储过程“模糊查询drop表”
  5. .NET Core on K8S 学习与实践系列文章索引 (更新至20191126)
  6. go语言io reader_Go语言中的io.Reader和io.Writer以及它们的实现
  7. mysql简单增删改查(CRUD)
  8. HDFS副本放置策略
  9. 《MFC游戏开发》笔记五 定时器和简单动画
  10. 一步步教你优化Delphi字串查找(转载)
  11. mysql acid介绍_InnoDB ACID模型介绍
  12. 基于React 的前端UI开发框架 及与Electron 的结合 https://cxjs.io/
  13. zend framework 重定向方法(render, forward, redirect)总结
  14. aliy 数据库连接池加密_Druid数据库连接池 实现数据库账号密码加密
  15. 加载中动画(gif)
  16. Linux系统录制gif动画
  17. python能开发微信公众号吗_用python如何开发微信公共帐号?
  18. 单肩包属于什么类目_包包属于什么商标类目
  19. 桌面计算机休眠快捷键,Win7怎么在桌面创建休眠快捷方式|win7休眠快捷键
  20. python脚本分享:xml文件批量修改

热门文章

  1. 科大星云诗社动态20210312
  2. 2018 NLP圣经《自然语言处理综述》最新手稿已经发布!
  3. c语言使用数组计算最大数。_程序设计入门——C语言_浙江大学_第10次开课
  4. VTK修炼之道26:图像基本操作_三维图像切片提取
  5. vs2010没有 最近使用的项目和解决方案
  6. delphi中採用bpl共享模塊的幾點釋疑
  7. Linux-0.00 代码解析(四)
  8. 汇编复制字符串小程序笔记
  9. 【译】BINDER TRANSACTIONS IN THE BOWELS OF THE LINUX KERNEL
  10. Get Cache Info in Linux on ARMv8 64-bit Platform