CVPR 2019 ATOM:《ATOM: Accurate Tracking by Overlap Maximization》论文笔记
目录
- 简介
- 动机
- 贡献
- 方法
- 实验
理解出错之处忘不吝指正。
简介
本文是MD在ECO系列之后的新paper,CVPR2019的oral,文章质量很高。
文章链接
代码链接
动机
目前,目标跟踪领域的研究重点集中于分类准确度,这导致目标分类效果好的模型,目标估计(target state estimation)低于预期,相反一些以前的模型能够获得更好的目标估计效果,但这些模型的目标分类效果差。
贡献
- 本文提出了一种新颖的跟踪架构,由目标估计和目标分类两部分组成。
- 在目标估计网络部分引入了IoU-Net(出自ECCV2018),使损失更加合理。
- 目标分类网络使用深度回归网络,由两个全卷积层组成,并提出新的专用在线训练的优化算法。
- 在新的大型TrackingNet数据集上,ATOM相对于之前的最佳方法实现了15%的相对增益,同时运行速度超过30 FPS。
方法
本文方法的整体架构如下图所示,其实较为主要的是两部分,蓝色的IoU Modulation+蓝色的IoU Predictor可以统称为目标估计网络,绿色的Classifier即为目标分类网络。
目标估计网络用于输出当前帧的bbox的IoU,使用IoU-Net+Siamese架构得到,具体的如下图所示。其中,PrPool是IoU-Net中提出的,如下下图所示。文中提到,直接使用Siamese的架构无法得到很好的效果,作者提出了基于调制(Modulation)的方法。关于这里的“调制”,我的个人理解是,由于直接使用Siamese架构不能得到很好的结果,我们可以将Reference Branch的特征进行一下变化,使其能够“适应”Test Branch的“信道”。
由于目标估计网格的判别能力不足,故引入目标分类网络。这部分本文使用了两层卷积,直接回归出以目标为中心的高斯label,且使用online training实现target-specific。但是使用梯度下降法收敛速度过慢,作者将问题转化为了高斯-牛顿最优化问题,可以使用共轭梯度法解决。具体步骤如下:
可以看下,本文的online training方法和梯度下降的比较。
具体的跟踪流程为:
- 使用目标分类网络计算置信度,置信度最高的位置记为(x,y)(x, y)(x,y),使用(x,y)(x, y)(x,y)+上一帧目标的www和hhh作为初始跟踪结果BBB。
- 基于BBB生成10个候选bbox,利用目标估计网络计算它们的IoU,取前三个作为候选结果。
- 将三个候选结果取均值,得到最终跟踪结果。
实验
首先是消融实验,Multi-Scale代表多尺度搜索方法;No Classif.代表无在线目标分类分支;GD是梯度下降,和本文优化方法的“反向传播”调用次数相同,即运算速度相同,同时GD的学习率和动量参数经过精心调整;GD++是5倍运算量版的梯度下降;No HN代表没有难负样本。
接下来,是在NFS和UAV123数据集上的实验结果:
在TrackingNet数据集上的实验结果:
在LaSOT数据集上的实验结果:
在VOT2018上的实验结果:
CVPR 2019 ATOM:《ATOM: Accurate Tracking by Overlap Maximization》论文笔记相关推荐
- 目标跟踪 ATOM(ATOM: Accurate Tracking by Overlap Maximization)
文章标题:<ATOM: Accurate Tracking by Overlap Maximization> 文章地址:https://arxiv.org/pdf/1811.07628.p ...
- CVPR 2021 《Causal Attention for Vision-Language Tasks》论文笔记
目录 简介 动机 方法 实验 简介 本文出自张含望老师课题组. 论文链接 动机 文章的第一句就说明了本文的动机,也就是,本文提出了一个新颖的注意力机制,可以消除现有的基于注意力的视觉语言方法中的混杂效 ...
- 2019 DGF(深度引导滤波网络) 相关的论文笔记
文章目录 *Fast End-to-End Trainable Guided Filter* *KeyPoint* *overview* *keywords* *extends* 摘要 引言 相关工作 ...
- VITAL: VIsual Tracking via Adversarial Learning论文笔记
本文是一篇很不错的关于目标跟踪算法的文章,收录于CVPR2018. 论文链接:https://arxiv.org/pdf/1804.04273.pdf 本文主要分析了现有的检测式跟踪的框架在模型在线学 ...
- CVPR 2019 论文大盘点-目标跟踪篇
点击我爱计算机视觉标星,更快获取CVML新技术 跟踪在计算机视觉里有很广泛的内涵,本文所指的跟踪为通用目标跟踪,不包括比如人脸特征点跟踪.视线跟踪等特定领域. 本文总结了 19 篇相关论文,列出了代码 ...
- IIAI CVPR 2019 跟踪、检测、分割论文荐读
点击我爱计算机视觉标星,更快获取CVML新技术 本文转载自起源人工智能研究院. 撰稿:Fahad Khan,孙国磊,廖胜才,卢宪凯 导语 CVPR (Conference on Computer Vi ...
- CVPR 2019 Oral 论文精选汇总,值得一看的 CV 论文都在这里(持续更新中)
CVPR 2019 即将于 6 月在美国长滩召开.今年有超过 5165 篇的大会论文投稿,最终录取 1299 篇,其中 Oral 论文近 300 篇.为了方便社区开发者和学术青年查找和阅读高价值论文, ...
- ccot 目标跟踪全称_Siamese:CVPR 2019 接收论文作者为你解读视频跟踪领域 | CVPR 2019...
雷锋网(公众号:雷锋网) AI 科技评论按,本文作者 Qiang Wang,原载于知乎,雷锋网获得授权转载. 今年的 CVPR 的结果已经完全公布,我参与的两篇文章 SiamMask 和SiamRPN ...
- CVPR 2019视频目标跟踪算法Pipeline集合
文章目录 1. SiamMask: "Fast Online Object Tracking and Segmentation: A Unifying Approach." 2. ...
最新文章
- 【OpenCV 】Sobel 导数/Laplace 算子/Canny 边缘检测
- 交叉验证 Cross-validation
- jquery 沟选项获取点击添加和删除的数据
- PAT甲级1106 Lowest Price in Supply Chain:[C++题解]树、结点到根结点的距离、树形dp、记忆化搜索
- 临时表与表变量深入探究
- 基本排序算法之4——归并排序mergesort
- 微软也走先使用后收费的路子--创业企业扶植计划(Microsoft BizSpark™)
- Eclipse里代码自动完成 auto completion的快捷键设置
- ubuntu 清空/tmp目录
- 移动混合应用HTML5数据查询优化
- 小红书去水印代码_小红书商家须知!小红书引流靠谱吗?
- devops 解决方案_DevOps是值得投资的职业倦怠解决方案
- 力扣 填充每个节点的下一个右侧节点指针
- python多线程 _thread没有上lock时程序提前给你把可执行的都执行,不按代码编写顺序执行
- web开发人员必备的提高开发水平的20个参考手册
- FFmpeg总结(六)AV系列结构体之AVPacket
- acrobat PDF删除部分_【低碳环保打印四大金刚】四款优秀的专业PDF虚拟打印机分享...
- Windows系统下使用Wampserver64快捷安装GLPI9.4.5开源IT资产管理软件(图解)
- OpenLayers多源数据加载一:数据组织
- 蒸馏 (distill_Distill-BERT:使用BERT进行更智能的文本生成
热门文章
- [云炬创业基础笔记]第五章创业机会评估测试9
- 科大星云诗社动态20201206
- 腾讯产品课观后感之定位2018-08-22
- 学长毕业日记 :本科毕业论文写成博士论文的神操作20170319
- 十四、“沥沥雨丝如落泪,麻麻密密总为愁。”(2021.5.2)
- 十大开源推荐系统简介 [转自oschina]
- 目标跟踪:CamShift算法
- IE、FF的基本注意事项
- 求一段内存中的字节型数据的和
- SpringBoot代码复用——thymeleaf提取导航栏并插入或替换元素