ICCV 2017 UCT:《UCT: Learning Unified Convolutional Networks forReal-time Visual Tracking》论文笔记

理解出错之处望不吝指正。

本文模型叫做UCT。就像论文题目一样，作者提出了一个基于卷积神经网络的end2end的tracking模型。模型的整体结构如下图所示（图中实线代表online tracking过程，虚线框内和虚线表示离线训练过程和在第一帧进行训练）：

模型的目的是从样本中学习出一系列convolution filter $f$ ，则在样本 $x$ 上进行卷积得到的卷积response为（其中 $d$ 代表channel数）：

则损失函数可以写为：

在测试阶段，可以看作：

作者把模型的训练过程分为两部分：

（1）.off-line training

这部分训练即为在训练集上最小化损失函数，不同的是，由于最后一帧中的目标位置经常不在cropped patch的中心，所以作者将train patch cropped with jittering（抖动）。

（2）.traing on first frame

这部分训练的目的是使模型适应于跟踪特定的目标。在训练时，虚线框内的权值使用均值为0的高斯分布进行随机初始化，然后使用SGD进行训练。

Online Tracking的过程主要包括以下两部分：

（1）.Model update

作者认为在每一帧或者固定间隔帧进行更新是不合理的，于是作者提出了一个定义，PNR（peak-versus-noise ratio）：

这里分母表示对response map中除去峰值的地方求均值。

当以下两个阈值都被满足的时候，才进行模型的更新。

（2）.Scale estimation

这部分作者使用了DSST中一样的尺度估计方法，下面回顾一下。

①.在第一帧中以目标正中间为中心，截取S张不同尺度的图像，每张图像提取一个d维的特征向量，得到S*d的特征矩阵；

②.构造相关图g，大小为S*1，中间值最大，向两端递减；

③.计算出尺度滤波模板h；

④.对于当前帧，选取S张不同尺度的图像，和位置估计一样，计算出当前帧的相关图g，响应最大值对应的尺度即为估计的尺度。

ICCV 2017 UCT:《UCT: Learning Unified Convolutional Networks forReal-time Visual Tracking》论文笔记相关推荐

KDD 2017 《ReasoNet: Learning to Stop Reading in Machine Comprehension》论文笔记
目录简介动机贡献方法实验简介本文面向机器阅读理解问题(Machine Reading Comprehension),作者来自微软研究院. 下载链接动机现有的方法可以分为两类:单步推理 ...
ICCV 2017 《Multi-label Image Recognition by Recurrently Discovering Attentional Regions》论文笔记
本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.
ICCV 2017《Unsupervised Laerning of Important Objects from First-Person Videos》论文笔记
本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.
论文复现：Learning Efficient Convolutional Networks through Network Slimming
论文核心论文提出了一种结构化剪枝策略,剪枝对象为 channel ,对 channel 重要性的评价标准使用的是 Batch Normalization 层中的缩放因子,这不会给网络带来额外的开销. ...
模型剪枝经典论文解读：《Learning Efficient Convolutional Networks through Network Slimming》
Learning Efficient Convolutional Networks through Network Slimming 摘要: CNN在落地中的部署,很大程度上受到其高计算成本的限制.在 ...
Fully Convolutional Networks for Semantic Segmentation (FCN)论文翻译和理解
论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...
《Communication-Efficient Learning of Deep Networks from Decentralized Data》论文阅读
4.29 天气:阴. 看论文看不懂,所以找回来这篇经典的FedAvg看看. AISTATS 2017. <Communication-Efficient Learning of Deep Net ...
论文笔记 Very Deep Convolutional Networks for Large-Scale Visual Recognition - ICLR 2014
VGG Very Deep Convolutional Networks for Large-Scale Visual Recognition Karen Simonyan and Andrew Zi ...
ICCV 2017奖项公布：最大赢家何恺明获最佳论文，参与最佳学生论文
当地时间 10 月 22 日,两年一度的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)在意大利威尼斯开幕.今日,大 ...

ICCV 2017 UCT:《UCT: Learning Unified Convolutional Networks forReal-time Visual Tracking》论文笔记

作者把模型的训练过程分为两部分：

Online Tracking的过程主要包括以下两部分：

ICCV 2017 UCT:《UCT: Learning Unified Convolutional Networks forReal-time Visual Tracking》论文笔记相关推荐

最新文章

热门文章