理解出错之处望不吝指正。

本文模型叫做UCT。就像论文题目一样,作者提出了一个基于卷积神经网络的end2end的tracking模型。模型的整体结构如下图所示(图中实线代表online tracking过程,虚线框内和虚线表示离线训练过程和在第一帧进行训练):

模型的目的是从样本中学习出一系列convolution filter ,则在样本上进行卷积得到的卷积response为(其中代表channel数):

则损失函数可以写为:

在测试阶段,可以看作:

  • 作者把模型的训练过程分为两部分:

(1).off-line training

这部分训练即为在训练集上最小化损失函数,不同的是,由于最后一帧中的目标位置经常不在cropped patch的中心,所以作者将train patch cropped with jittering(抖动)。

(2).traing on first frame

这部分训练的目的是使模型适应于跟踪特定的目标。在训练时,虚线框内的权值使用均值为0的高斯分布进行随机初始化,然后使用SGD进行训练。

  • Online Tracking的过程主要包括以下两部分:

(1).Model update

作者认为在每一帧或者固定间隔帧进行更新是不合理的,于是作者提出了一个定义,PNR(peak-versus-noise ratio):

这里分母表示对response map中除去峰值的地方求均值。

当以下两个阈值都被满足的时候,才进行模型的更新。

(2).Scale estimation

这部分作者使用了DSST中一样的尺度估计方法,下面回顾一下。

①.在第一帧中以目标正中间为中心,截取S张不同尺度的图像,每张图像提取一个d维的特征向量,得到S*d的特征矩阵;

②.构造相关图g,大小为S*1,中间值最大,向两端递减;

③.计算出尺度滤波模板h;

④.对于当前帧,选取S张不同尺度的图像,和位置估计一样,计算出当前帧的相关图g,响应最大值对应的尺度即为估计的尺度。

ICCV 2017 UCT:《UCT: Learning Unified Convolutional Networks forReal-time Visual Tracking》论文笔记相关推荐

  1. KDD 2017 《ReasoNet: Learning to Stop Reading in Machine Comprehension》论文笔记

    目录 简介 动机 贡献 方法 实验 简介 本文面向机器阅读理解问题(Machine Reading Comprehension),作者来自微软研究院. 下载链接 动机 现有的方法可以分为两类:单步推理 ...

  2. ICCV 2017 《Multi-label Image Recognition by Recurrently Discovering Attentional Regions》论文笔记

    本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.

  3. ICCV 2017《Unsupervised Laerning of Important Objects from First-Person Videos》论文笔记

    本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.

  4. 论文复现:Learning Efficient Convolutional Networks through Network Slimming

    论文核心 论文提出了一种结构化剪枝策略,剪枝对象为 channel ,对 channel 重要性的评价标准使用的是 Batch Normalization 层中的缩放因子,这不会给网络带来额外的开销. ...

  5. 模型剪枝经典论文解读:《Learning Efficient Convolutional Networks through Network Slimming》

    Learning Efficient Convolutional Networks through Network Slimming 摘要: CNN在落地中的部署,很大程度上受到其高计算成本的限制.在 ...

  6. Fully Convolutional Networks for Semantic Segmentation (FCN)论文翻译和理解

    论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...

  7. 《Communication-Efficient Learning of Deep Networks from Decentralized Data》论文阅读

    4.29 天气:阴. 看论文看不懂,所以找回来这篇经典的FedAvg看看. AISTATS 2017. <Communication-Efficient Learning of Deep Net ...

  8. 论文笔记 Very Deep Convolutional Networks for Large-Scale Visual Recognition - ICLR 2014

    VGG Very Deep Convolutional Networks for Large-Scale Visual Recognition Karen Simonyan and Andrew Zi ...

  9. ICCV 2017奖项公布:最大赢家何恺明获最佳论文,参与最佳学生论文

    当地时间 10 月 22 日,两年一度的计算机视觉国际顶级会议 International Conference on Computer Vision(ICCV 2017)在意大利威尼斯开幕.今日,大 ...

最新文章

  1. 如何在Django1.6结合Python3.3版本中使用MySql
  2. javafx canvas_JavaFX技巧2:使用Canvas API进行清晰绘图
  3. 尝试引用非结构体数组的字段_剖析PHP底层数组是如何实现的
  4. C++语言string类介绍和示例
  5. 06-4.部署高可用 kube-scheduler 集群
  6. uniapp scroll-view组件横向滚动不生效
  7. CTPN源码解析2-代码整体结构和框架
  8. less中使用global的两种用法
  9. 都说在阿里年薪百万不难,面试入职阿里需要准备什么?
  10. python数据可视化字段,Python数据可视化
  11. 省市区地址三级联动jQuery插件Distpicker使用
  12. 超融合网络常见问题及解决思路
  13. Elasticsearch(022):es常见的字段映射类型之地理形状类型(geo_shape、多边的复杂的地址形状)
  14. [摘录]第一部分 掌舵领航(1)
  15. CMWAP与CMNET
  16. recurdyn和matlab联合仿真,recurdyn与simulink机电联合仿真,求助
  17. python用smtp发邮件怎么抄送_python使用SMTP发邮件时使用Cc(抄送)和Bcc(密送)...
  18. Mathematica视频处理实例-边缘检测
  19. Solr4:查询参数fq的用法(对结果进行过滤;两组关键词组合查询)
  20. 放大器知识体系-滤波器Chebychev Butterworth Bessel 仿真测试

热门文章

  1. 云炬Qtpy5开发与实战笔记 0搭建开发环境(傻瓜式安装)
  2. 函数的多态性以及虚函数
  3. ubuntu安装curl报错或get update失败
  4. 在IE下,当eval遇上function
  5. main() 函数解析(一)——Linux-0.11 剖析笔记(六)
  6. Tensorflow2.0与Tensorflow1.0的理解
  7. RPC和Restful深入理解
  8. volatile关键字及JMM模型
  9. PyTorch基础(七)----- torch.nn.AdaptiveAvgPool2d()方法
  10. 深度增强学习前沿算法思想