理解出错之处望不吝指正。

本文模型叫做DaSiamRPN。本文首先分析了已有的孪生网络方法中的特征和缺点,如下图所示:

如上图所示,是几种孪生模型对ROI提取出的特征图。论文中提到,造成这种现象的原因是,在目标周围的背景信息中,非语义背景(即真正的“背景”信息,如地板、天空等)占据了主要部分,语义背景(背景中的人、狗等实体,我是这么理解的)占据了极少一部分。这种不平衡的分布使得模型趋向于去学习到一个区分前景(目标+语义背景)和背景(非语义背景)的模型,而不是学习一个实例级别的表示方法。为了处理这个问题,作者在训练集中添加了三类样本对,提高模型的学习效果。

  • 添加了三类样本对

首先,是使用检测数据集中样本对。如上图中(a)。

作者认为,使用ILSVRC和Youtube-BB检测数据集,数据量还是太少,且数据集中的类别较少,不利于模型学习到泛化能力。作者提出使用ImageNet Detection和COCO数据集,通过一些数据增强技术(后文中提到包括平移、缩放、灰度变换、运动模糊等)构造出样本对,这类样本对用于提高模型的泛化能力。

其次,使用来自相同类别的负样本对。如上图中(b)。最后,使用来自不同类别的负样本对。如上图中(c)。

添加这两类负样本可以使模型在超出视线、全遮挡的情况下,避免模型漂移到其他的目标上去。这两类样本对用于提高模型的判别能力。

  • 提出了一种增量学习方法

传统的详细学习在进行相似度计算时,使用下式:

本文中提出了一种新的选择最优bbox的标准,如下式(用csdn的公式编辑器没打出来argmax,有会的大佬教教我,哭...):

从上式中我们可以看出,其实就是当前位置和模板计算相似度之后,减去当前位置与search region中其他位置的相似度的加权和。

由于交叉相关(互相关)操作是一个线性操作,我们可以使用这个特性对计算进行加速,如下式:

再考虑结合律,我们可以将式子改为如下所示的增量学习公式,式中是学习率。

  • 将DaSiamRPN用于Long-term跟踪

当模型跟踪失败的时候,模型采取一种“局部-全局”增大search region的策略去重新跟踪目标。如下图所示(红色是ground truth,绿色的是跟踪结果,蓝色的是search region):

至于如何判断模型何时跟踪失败,论文中提到“Since the distractor-aware training and inference enable highquality detection score, it can be adopted to indicate the quality of tracking results.”

  • 模型的实验结果

VOT:

UVA:

提出的方法带来的效果改进:

ECCV 2018 DaSiamRPN:《Distractor-aware Siamese Networks for Visual Object Tracking》论文笔记相关推荐

  1. Distractor-aware Siamese Networks for Visual Object Tracking 论文学习

    Distractor aware of Siamese Networks for visual object tracking 论文学习 论文阅读总结 Translation Abstract 1 I ...

  2. Distractor-aware Siamese Networks for Visual Object Tracking全文翻译

    摘要   最近,Siamese 网络因其平衡的准确性和速度而在视觉跟踪界引起了极大的关注.然而,大多数连体跟踪方法中使用的特征只能区分前景和非语义背景.语义背景总是被认为是干扰因素,这阻碍了连体跟踪器 ...

  3. ICCV 2017 DSiam:《Learning Dynamic Siamese Network for Visual Object Tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做DSiam.作者提出一个Dynamic Siamese Network,可以使用一个transformation learning model来在线学习目标的外观 ...

  4. Learning Dynamic Siamese Network for Visual Object Tracking全文翻译

    摘要   如何有效地学习目标外观的时间变化,排除杂乱背景的干扰,同时保持实时响应,是视觉目标跟踪的一个重要问题.最近,Siamese 网络显示出基于匹配的跟踪器在实现平衡精度和超越实时速度方面的巨大潜 ...

  5. CVPR 2018 SA-Siam:《A Twofold Siamese Network for Real-Time Object Tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做SA-Siam.本文提出了一个结合Semantic features(语义特征)和Appearance features(表征特征)的模型,其实类似于一个双路模型 ...

  6. CVPR 2020 HAN:《Hypergraph Attention Networks for Multimodal Learning》论文笔记

    目录 简介 动机 贡献 方法 实验 简介 本文提出了一种用于多模态学习的超图注意力网络,作者来自Kakao公司和首尔大学. Kakao公司的主要产品是Kakao talk,类似于国内的微信,且腾讯是其 ...

  7. Feature Pyramid Networks for Object Detection 论文笔记

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/Jesse_Mx/article/details/54588085 论文地址:Feature Pyra ...

  8. 《Multi-scale Convolutional Neural Networks for Crowd Counting》论文笔记

    Multi-scale Convolutional Neural Networks for Crowd Counting 论文地址 论文翻译 ABSTRACT 1. INTRODUCTION 2. M ...

  9. ICDM‘20 AANE: Anomaly Aware Network Embedding For Anomalous Link Detection论文笔记

    AANE: Anomaly Aware Network Embedding For Anomalous Link Detection ICDM'20 1. Abstract 现有的网络嵌入模型将网络中 ...

最新文章

  1. Scrum Master的职业发展路线
  2. oracle忘记实例名,Oracle的安装和MS SQL Server实例名
  3. 文件包含和文件上传结合
  4. 两则爵士鼓的基础练习
  5. jenkins 实践
  6. Ubuntu linux下的录屏
  7. dbf如何导入oracle_克服Oracle导数一切难题
  8. BGP中的联盟原理和实验(华为设备)
  9. 协同过滤相关算法(1):SVD
  10. java dem数据格式解析_ArcGIS读取dem格式数据
  11. 十大算法(动图讲解)❤️超详细!
  12. 分享两款免费的MySQL性能监控工具
  13. 艾默生Ev3100变频器源码,汇编语言的。电梯变频器
  14. sucks倒计时插件笔记
  15. 社团招新如何吸引新人,制作一张好的海报最关键
  16. 如何编写功能测试报告
  17. Drools 7 用OOPath遍历嵌套类型的实体对象
  18. Android 开发 有道翻译
  19. linux可用直播软件,linux 下的直播软件 nslive
  20. Postgres时间字段设置默认值

热门文章

  1. [云炬python学习笔记]Numpy中内置函数min(),max(),sum()与Python中内置函数min(),max(),sum()性能对比分析
  2. <马哲>科学技术在社会发展中的作用2017-12-27
  3. 二十、“安化辞骚千万卒,康吾故土祭吾躯”(2021.6.14)
  4. 云炬Android开发笔记 7登陆注册功能开发
  5. 云炬Android开发笔记 3-2字体图标库集成与封装
  6. 【附源码】一看就懂的感知机算法PLA
  7. 重磅 | 吴恩达新书《Machine Learning Yearning》最新版分享
  8. 华为手机asph啥机型_华为正式宣布!19款机型开启新系统内测,你的手机榜首有名吗?...
  9. 3DSlicer23:Module-Create Loadable
  10. Unresolved compilation problem: String liter