目录

  • 简介
  • 动机
  • 贡献
  • 方法
  • 实验

理解出错之处忘不吝指正。

简介

本文是MD在ECO系列之后的新paper,CVPR2019的oral,文章质量很高。
文章链接
代码链接

动机

目前,目标跟踪领域的研究重点集中于分类准确度,这导致目标分类效果好的模型,目标估计(target state estimation)低于预期,相反一些以前的模型能够获得更好的目标估计效果,但这些模型的目标分类效果差。

贡献

  1. 本文提出了一种新颖的跟踪架构,由目标估计和目标分类两部分组成。
  2. 在目标估计网络部分引入了IoU-Net(出自ECCV2018),使损失更加合理。
  3. 目标分类网络使用深度回归网络,由两个全卷积层组成,并提出新的专用在线训练的优化算法。
  4. 在新的大型TrackingNet数据集上,ATOM相对于之前的最佳方法实现了15%的相对增益,同时运行速度超过30 FPS。

方法

本文方法的整体架构如下图所示,其实较为主要的是两部分,蓝色的IoU Modulation+蓝色的IoU Predictor可以统称为目标估计网络,绿色的Classifier即为目标分类网络

目标估计网络用于输出当前帧的bbox的IoU,使用IoU-Net+Siamese架构得到,具体的如下图所示。其中,PrPool是IoU-Net中提出的,如下下图所示。文中提到,直接使用Siamese的架构无法得到很好的效果,作者提出了基于调制(Modulation)的方法。关于这里的“调制”,我的个人理解是,由于直接使用Siamese架构不能得到很好的结果,我们可以将Reference Branch的特征进行一下变化,使其能够“适应”Test Branch的“信道”。


由于目标估计网格的判别能力不足,故引入目标分类网络。这部分本文使用了两层卷积,直接回归出以目标为中心的高斯label,且使用online training实现target-specific。但是使用梯度下降法收敛速度过慢,作者将问题转化为了高斯-牛顿最优化问题,可以使用共轭梯度法解决。具体步骤如下:

可以看下,本文的online training方法和梯度下降的比较。

具体的跟踪流程为:

  • 使用目标分类网络计算置信度,置信度最高的位置记为(x,y)(x, y)(x,y),使用(x,y)(x, y)(x,y)+上一帧目标的www和hhh作为初始跟踪结果BBB。
  • 基于BBB生成10个候选bbox,利用目标估计网络计算它们的IoU,取前三个作为候选结果。
  • 将三个候选结果取均值,得到最终跟踪结果。

实验

首先是消融实验,Multi-Scale代表多尺度搜索方法;No Classif.代表无在线目标分类分支;GD是梯度下降,和本文优化方法的“反向传播”调用次数相同,即运算速度相同,同时GD的学习率和动量参数经过精心调整;GD++是5倍运算量版的梯度下降;No HN代表没有难负样本。

接下来,是在NFS和UAV123数据集上的实验结果:

在TrackingNet数据集上的实验结果:

在LaSOT数据集上的实验结果:

在VOT2018上的实验结果:

CVPR 2019 ATOM:《ATOM: Accurate Tracking by Overlap Maximization》论文笔记相关推荐

  1. 目标跟踪 ATOM(ATOM: Accurate Tracking by Overlap Maximization)

    文章标题:<ATOM: Accurate Tracking by Overlap Maximization> 文章地址:https://arxiv.org/pdf/1811.07628.p ...

  2. CVPR 2021 《Causal Attention for Vision-Language Tasks》论文笔记

    目录 简介 动机 方法 实验 简介 本文出自张含望老师课题组. 论文链接 动机 文章的第一句就说明了本文的动机,也就是,本文提出了一个新颖的注意力机制,可以消除现有的基于注意力的视觉语言方法中的混杂效 ...

  3. 2019 DGF(深度引导滤波网络) 相关的论文笔记

    文章目录 *Fast End-to-End Trainable Guided Filter* *KeyPoint* *overview* *keywords* *extends* 摘要 引言 相关工作 ...

  4. VITAL: VIsual Tracking via Adversarial Learning论文笔记

    本文是一篇很不错的关于目标跟踪算法的文章,收录于CVPR2018. 论文链接:https://arxiv.org/pdf/1804.04273.pdf 本文主要分析了现有的检测式跟踪的框架在模型在线学 ...

  5. CVPR 2019 论文大盘点-目标跟踪篇

    点击我爱计算机视觉标星,更快获取CVML新技术 跟踪在计算机视觉里有很广泛的内涵,本文所指的跟踪为通用目标跟踪,不包括比如人脸特征点跟踪.视线跟踪等特定领域. 本文总结了 19 篇相关论文,列出了代码 ...

  6. IIAI CVPR 2019 跟踪、检测、分割论文荐读

    点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自起源人工智能研究院. 撰稿:Fahad Khan,孙国磊,廖胜才,卢宪凯 导语 CVPR (Conference on Computer Vi ...

  7. CVPR 2019 Oral 论文精选汇总,值得一看的 CV 论文都在这里(持续更新中)

    CVPR 2019 即将于 6 月在美国长滩召开.今年有超过 5165 篇的大会论文投稿,最终录取 1299 篇,其中 Oral 论文近 300 篇.为了方便社区开发者和学术青年查找和阅读高价值论文, ...

  8. ccot 目标跟踪全称_Siamese:CVPR 2019 接收论文作者为你解读视频跟踪领域 | CVPR 2019...

    雷锋网(公众号:雷锋网) AI 科技评论按,本文作者 Qiang Wang,原载于知乎,雷锋网获得授权转载. 今年的 CVPR 的结果已经完全公布,我参与的两篇文章 SiamMask 和SiamRPN ...

  9. CVPR 2019视频目标跟踪算法Pipeline集合

    文章目录 1. SiamMask: "Fast Online Object Tracking and Segmentation: A Unifying Approach." 2. ...

最新文章

  1. 【OpenCV 】Sobel 导数/Laplace 算子/Canny 边缘检测
  2. 交叉验证 Cross-validation
  3. jquery 沟选项获取点击添加和删除的数据
  4. PAT甲级1106 Lowest Price in Supply Chain:[C++题解]树、结点到根结点的距离、树形dp、记忆化搜索
  5. 临时表与表变量深入探究
  6. 基本排序算法之4——归并排序mergesort
  7. 微软也走先使用后收费的路子--创业企业扶植计划(Microsoft BizSpark™)
  8. Eclipse里代码自动完成 auto completion的快捷键设置
  9. ubuntu 清空/tmp目录
  10. 移动混合应用HTML5数据查询优化
  11. 小红书去水印代码_小红书商家须知!小红书引流靠谱吗?
  12. devops 解决方案_DevOps是值得投资的职业倦怠解决方案
  13. 力扣 填充每个节点的下一个右侧节点指针
  14. python多线程 _thread没有上lock时程序提前给你把可执行的都执行,不按代码编写顺序执行
  15. web开发人员必备的提高开发水平的20个参考手册
  16. FFmpeg总结(六)AV系列结构体之AVPacket
  17. acrobat PDF删除部分_【低碳环保打印四大金刚】四款优秀的专业PDF虚拟打印机分享...
  18. Windows系统下使用Wampserver64快捷安装GLPI9.4.5开源IT资产管理软件(图解)
  19. OpenLayers多源数据加载一:数据组织
  20. 蒸馏 (distill_Distill-BERT:使用BERT进行更智能的文本生成

热门文章

  1. [云炬创业基础笔记]第五章创业机会评估测试9
  2. 科大星云诗社动态20201206
  3. 腾讯产品课观后感之定位2018-08-22
  4. 学长毕业日记 :本科毕业论文写成博士论文的神操作20170319
  5. 十四、“沥沥雨丝如落泪,麻麻密密总为愁。”(2021.5.2)
  6. 十大开源推荐系统简介 [转自oschina]
  7. 目标跟踪:CamShift算法
  8. IE、FF的基本注意事项
  9. 求一段内存中的字节型数据的和
  10. SpringBoot代码复用——thymeleaf提取导航栏并插入或替换元素