目录

  • 动机
  • 主要贡献
  • 整体框架
  • 详细介绍
    • 重构DCF
    • 剩余学习
      • Spatial层
      • Temporal层
  • 跟踪过程
  • 实验结果

动机

本文基于DCF进行改进,摘要中提到,基于DCF的跟踪器无法受益于端到端的训练。

主要贡献

理解出错之处望不吝指正。
       主要包括一下三方面:
       1. 将CF重构为一个卷积层,这样使其受益于端到端的训练;
       2. 在时空上(spatiotemporal)使用剩余学习(residual learning)学习目标的外观变换;
       3. 本文提出的模型CREST在多个数据集上验证均可达到很好的效果。

整体框架


       模型的整体架构如上图所示,在跟踪第T帧时,将第T帧和第1帧送入特征提取层,得到特征图后,将第T帧特征图送入Base层(重构的DCF)和Spatial层,第1帧特征图送入Temporal层,将三个层的输出融合后得到响应图。

详细介绍

重构DCF

DCF实际是优化以下函数:
       
       传统的损失函数形式如下:
       
       作者将DCF重构为一个卷积层,损失函数设置如下:
       
       
       这样就可以用梯度下降去计算权重,而不是通过计算封闭解。

剩余学习

作者提到,只使用一个卷积层来重构DCF得不到效果很好的响应图,但是又不想堆叠很多的卷积层(会带来梯度消失)。作者通过添加两个剩余层(我的理解:学习差异性)来解决这个问题,即:Spatial和Temporal。这样,响应图的计算就可为以下三部分:
       
       这样,计算响应图的流程则如下:
       

Spatial层

首先介绍Spatial层。
       在我的理解下,这一部分实际上就是用于学习Base层的输出和真实输出的偏差(相当于微调),也就是用Spatial层的输出去改进Base层的输出。

Temporal层

Temporal层的作用是,防止当前的跟踪结果和初始帧的跟踪目标偏差较大。本层旨在学习Base层的输出和第一帧跟踪目标的差异性(防止跟丢?)。

跟踪过程

跟踪过程实际上和传统的DCF没啥区别。

  • 特征提取部分使用VGG网络;
  • Base、Spatial和Temporal层使用高斯函数初始化;
  • 尺度处理和以往的模型都一样,获取不同尺度的search patch,再resize到相同尺寸;
  • 每一帧的跟踪结果作为训练数据放到样本库中,每隔T帧对模型进行更新。

实验结果

  • 模型效果展示

  • OTB2013实验结果


  • OTB2015实验结果
  • VOT2016实验结果

ICCV 2017 CREST:《CREST: Convolutional Residual Learning for Visual Tracking》论文笔记相关推荐

  1. ICCV 2017 《Chained Cascade Network for Object Detection》论文笔记

    本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.

  2. ICCV 2017 《Illuminating Pedestriant via Simultaneous Detection Segmentation》论文笔记

    本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.

  3. 目标跟踪算法五:MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

    目标跟踪算法五:MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking 原文:https://zh ...

  4. Learning Spatio-Temporal Transformer for Visual Tracking——精读笔记

    本篇精读笔记,对原文重要部分做了严格翻译,如摘要和总结.对正文部分做了提炼,对重点部分突出标注.对参考文献做了分类.本文内容较长,如果时间有限可以直接跳到感兴趣的小节阅读. 论文地址:https:// ...

  5. Deep Learning for Visual Tracking: A Comprehensive Survey(单目标跟踪目前最好的综述类文章)

    Deep Learning for Visual Tracking: A Comprehensive Survey https://arxiv.org/pdf/1912.00535.pdf 摘要 视觉 ...

  6. earning Multi-Domain Convolutional Neural Networks for Visual Tracking

    论文笔记<Learning Multi-Domain Convolutional Neural Networks for Visual Tracking> 0. 摘要 基于CNN的一个跟踪 ...

  7. RESIDUAL GATED GRAPH CONVNETS (ResGatedGraphConv论文笔记)

    RESIDUAL GATED GRAPH CONVNETS (ResGatedGraphConv论文笔记) 我在知乎上也发布了一份,希望大家看在创作不易的份上都来点个赞,名字还是叫杰克船长有烦恼,也希 ...

  8. Deep Meta Learning for Real-Time Target-Aware Visual Tracking 论文阅读

    这篇文章是韩国的一个组做的,一直没中, 直到19年中了ICCV,据说是第一篇将元学习引入目标跟踪的文章,用的架构是siamese网络的架构,但是在模型在线更新的时候使用了meta-learning的思 ...

  9. Deep Clustering via Joint Convolutional Autoencoder Embedding and RelativeEntropy Minimization论文笔记

    Deep Clustering via Joint Convolutional Autoencoder Embedding and RelativeEntropy Minimization 论文链接 ...

最新文章

  1. C++ Primer 5th笔记(8)chapter8 类:IO库-流的状态
  2. 光储充一体化充电站_福建全省首座光储充一体化公交充电站投入使用
  3. SendMessage 循环按1 到6 F1到F8_2
  4. centos后台登录ftp_「vscode remote ssh 免登录」mac
  5. P2662 牛场围栏(同余最短路)
  6. RDLC报表---自定义数据集
  7. ES6异步编程: co函数库的含义与用法
  8. 5u以太网用交换机连接电脑_干货丨如何用自己的电脑直接连接NUS打印机
  9. 【Flink】Flink NoSuchFieldError BIND_PORT
  10. python列表、元组、集合、字典、json相互转换以及其他基础入门
  11. opencv 鼠标事件
  12. 英特尔AIDC2018:神经计算棒二代从天而降,软硬生态合作圈尽露锋芒
  13. Ubuntu samba 安装与配置 实现windows和虚拟机中的Ubuntu共享文件
  14. 网卡在linux系统下的驱动怎么安装,RedHat Linux系统如何安装无线网卡驱动
  15. [POI2013]LUK-Triumphal arch【树形DP+二分答案】
  16. Tomcat启动之后遇到“ran out of the normal time range, it consumed [2000] milliseconds.”?
  17. 数据结构:关于链表直接free(p)会不会造成断链
  18. 浅谈DOS扩展器和DPMI
  19. 3dsmax烘焙模型
  20. 计算机专业必要要买游戏本吗,吾空:致大学想买游戏笔记本的学生,这几个点必须要知道...

热门文章

  1. java中属于常量_java中的常量和属性
  2. Delphi指针大全
  3. wireshark应用--wireshark原来那么简单
  4. 二进制转十进制-栈的方式实现
  5. python基础——注释、字符串、输出换行
  6. 同一进程中同一端口如何区分不同的Socket
  7. 烧写文件系统——韦东山嵌入式Linux学习笔记11
  8. 【⛔C语言“数组名”,不得不说的秘密!⛔】c语言“数组名字“初探
  9. 备考信息系统项目管理师-----Day2
  10. Android init第三、四部分详细分析