ECCV 2012 CSK:《Exploiting the circulantstructure of tracking-by-detection with kernels》论文笔记
理解出错之处望不吝指正。
本文模型就是大名鼎鼎的CSK。
本文的贡献:
(1)稠密采样、循环移位;
(2)循环矩阵带来的快速计算;
(3)计算了不同的核函数的封闭解。
.
稠密采样、循环移位
如上图所示,以往的方法中,采用的都是随机采样,作者说这会带来很大的冗余,并且只使用到了bbox的局部特征。而作者提出的稠密采样可以将整张图片的特征都利用起来。
实际上,训练样本是通过循环移位产生的。首先,稠密采样得到的样本与循环移位产生的样本很像,可以用循环移位来近似;其次,卷积(or互相关)运算在傅里叶域对应可以转化为点乘,且循环矩阵经过傅里叶变换会对角化,这两点都可以减小计算量。
循环矩阵带来的快速计算
首先,我们要知道,对于tracking任务,可以形式化的描写为下式:
这里的代表的是一个线性分类器.
作者使用的是RLS(Regularized Least Squares)损失:.
通过使用kernel trick,这里核函数使用表示。根据表示定理,我们可以得出:.
进一步,我们可以得出RLS with Kernels(KRLS)的封闭解:
这里为kernel martix,为单位矩阵。注意到这个公式中存在矩阵的求逆操作,这会带来很大的计算量,作者接下来的目的就是简化上式的计算量。
作者观察到,一个向量通过循环移位可以得到一个循环矩阵:
若是将循环矩阵和矩阵相乘,即求,可以变换到傅里叶域进行快速计算:
同时作者在论文中提到,循环矩阵的和、点积、求逆都还是循环矩阵。接下来,就是将循环矩阵的性质应用到求解中。
对于一个给定的图片,我们将其转化为一个的向量,则采样操作可以看为:
这里的矩阵是用来实现循环移位的置换矩阵。
接下来,作者证明了,若是一个unitarily invariant kernel,则由元素组成的kernel martix 是一个循环矩阵。这对于KRLS来说是满足的(满足的还有:高斯核函数、线性核函数、多项式核函数等)。则对于组成的向量,这里。参照的变换,可以得到的解:
至此,我们可以快速的计算出,训练过程可以很快速的完成。
注意,我们通篇的目的实际上就是要求解,细心的朋友会问,那呢?论文中第四页最下面有这样一句话:“The bias term b is not important in practice, when finding the maximum response.”。
快速检测过程
对于一个输入图像,response可以通过下式计算:
使用前文中提到的技巧,我们可以通过下式快速的得到response:
这里向量中的元素为.
到目前为止,基本上已经没有矩阵运算了,不过为什么说基本上呢?因为还有一个地方需要矩阵运算,就是计算。接下来,作者对核矩阵的快速计算进行了推导,使上式中彻底没有了矩阵运算,这里就不做介绍了。
本模型的缺点:
(1)采用单通道的灰度特征,特征表达能力有限(KCF/DCF中解决);
(2)循环矩阵会导致边界效应(SRDCF中解决);
(3)模型中没有尺度更新,对尺度变换不敏感(DSST中解决)。
啥是边界效应?
训练阶段,目标中心移动到边缘附近,此时应视为负样本,在检测阶段,当目标移动到边界附近,此时的目标和训练时使用的负样本是比较接近的,但是此时应当把此作为正样本来检测目标。实际算法会将其视为负样本,所以经常会导致跟踪失败。
ECCV 2012 CSK:《Exploiting the circulantstructure of tracking-by-detection with kernels》论文笔记相关推荐
- ECCV 2018 DSLT:《Deep Regression Tracking with Shrinkage Loss》论文笔记
理解出错之处望不吝指正. 本文模型叫做DSLT,将跟踪任务视为回归问题去解决.主要贡献包括:①.提出一种收缩损失函数,降低背景信息中的那些简单负样本对损失函数的贡献:②.使用残差连接,融合多个卷积层和 ...
- CVPR 2018 FlowTrack:《End-to-end Flow Correlation Tracking with Spatial-temporal Attention》论文笔记
理解出错之处望不吝指正. 本文模型叫做FlowTrack.本文将光流信息和特征表示结合在一起进行目标跟踪,据作者所说,这是第一个在CNN based tracking中使用光流的模型. 光流的warp ...
- ECCV 2020 《Propagating Over Phrase Relations for One-Stage Visual Grounding》论文笔记
目录 简介 动机 贡献 方法 实验 简介 本文出自香港大学的sibei,二作是中山大学李冠斌老师 下载链接 动机 Phrase level visual grounding具有两个challenge: ...
- ECCV 2020 《Improving One-stage Visual Grounding by Recursive Sub-query Construction》论文笔记
目录 简介 动机 贡献 方法 实验 简介 本文出自罗彻斯特大学+腾讯AI Lab 下载链接 动机 现有的visual grounding方法可以分为两类:一阶段.两阶段.本文面向一阶段方法,提升现有方 ...
- CVPR 2019 ATOM:《ATOM: Accurate Tracking by Overlap Maximization》论文笔记
目录 简介 动机 贡献 方法 实验 理解出错之处忘不吝指正. 简介 本文是MD在ECO系列之后的新paper,CVPR2019的oral,文章质量很高. 文章链接 代码链接 动机 目前,目标跟踪领域的 ...
- CVPR 2018 VITAL:《VITAL: VIsual Tracking via Adversarial Learning》论文笔记
理解出错之处望不吝指正. 本文模型叫做VITAL.作者提到,当前使用DNN的trackers的性能受限于两方面:(1).每一帧中的positive sample在空间上高度重叠,模型不能和好的捕获较好 ...
- 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
- 北大核心期刊2012《科技通报》杂志简介《科技通报》论文范文
北大核心期刊2012<科技通报>杂志简介<科技通报>论文范文 转载▼ 标签: 刘兴 柳林 科技通报 中文核心期刊 动态规划 文化 刊名: 科技通报 Bulletin of ...
- 论文笔记:3D-CVF(ECCV 2020)
论文笔记:3D-CVF: Generating Joint Camera and LiDAR Features Using Cross-View Spatial Feature Fusion for ...
最新文章
- 靠 GitHub 打赏谋生的程序员,他们是怎么做的?
- MAT分析OOM问题
- vc设备工程师_4注册公用设备工程师专业基础考试真题.
- mysql存储过程模糊查询_Mysql之存储过程“模糊查询drop表”
- .NET Core on K8S 学习与实践系列文章索引 (更新至20191126)
- go语言io reader_Go语言中的io.Reader和io.Writer以及它们的实现
- mysql简单增删改查(CRUD)
- HDFS副本放置策略
- 《MFC游戏开发》笔记五 定时器和简单动画
- 一步步教你优化Delphi字串查找(转载)
- mysql acid介绍_InnoDB ACID模型介绍
- 基于React 的前端UI开发框架 及与Electron 的结合 https://cxjs.io/
- zend framework 重定向方法(render, forward, redirect)总结
- aliy 数据库连接池加密_Druid数据库连接池 实现数据库账号密码加密
- 加载中动画(gif)
- Linux系统录制gif动画
- python能开发微信公众号吗_用python如何开发微信公共帐号?
- 单肩包属于什么类目_包包属于什么商标类目
- 桌面计算机休眠快捷键,Win7怎么在桌面创建休眠快捷方式|win7休眠快捷键
- python脚本分享:xml文件批量修改
热门文章
- 科大星云诗社动态20210312
- 2018 NLP圣经《自然语言处理综述》最新手稿已经发布!
- c语言使用数组计算最大数。_程序设计入门——C语言_浙江大学_第10次开课
- VTK修炼之道26:图像基本操作_三维图像切片提取
- vs2010没有 最近使用的项目和解决方案
- delphi中採用bpl共享模塊的幾點釋疑
- Linux-0.00 代码解析(四)
- 汇编复制字符串小程序笔记
- 【译】BINDER TRANSACTIONS IN THE BOWELS OF THE LINUX KERNEL
- Get Cache Info in Linux on ARMv8 64-bit Platform