Progressive Unsupervised Learning for Visual Object Tracking(用于视觉目标跟踪的渐进式无监督学习 )

因为是无监督学习,所以需要对样本数据充分挖掘,产生适合跟踪的训练样本。本文首先使用contrastive learning学前景、背景区分的能力。在数据集ILSVRC 2015中,PUL算法首先使用EdgeBox生成高质量的proposal,并借助前景、背景区分模块进行时序上的训练样本收集。最后,由于这些无监督收集到的样本无可避免的存在噪声,作者又重新优化了SiamFC的loss function,以适应当前的无监督数据。最后就是用收集的样本做正常的SiamFC跟踪。

一 Background Discrimination Learning(背景辨别模型)

基本思想就是采用对比学习,本文类似SiamCLR,训练分类前景和背景的网络。但因为所需BatchSize太大,所以加入了AHM(Anchor-based Hard Negative Mining)

伪代码:

 Algorithm 1: Anchor-based Hard Negative Mining
Input: Frame set F, rounds R, iterations per round T ,
batch size N and the initial model M0.
Output: Background discrimination model Mb.
1 for i=1:R do
2 Sample patch set E from F;
3 Randomly select candidate anchors Pi from E;
4 Candidate anchor evaluation using (5);
5 Get anchor set {Ai}Ti=1;
6 for t=1:T do
7 Select N-1 nearest neighbors N (At) of At;
8 Use N (At) and At for one mini-batch
contrastive learning with (4);
9 Update the model Mi;
10 end
11 end

使用ILSVRC-2015 dataset,在视频的每10帧中采样一个训练帧,得到训练集F。应用EdgeBox为F中的每个帧生成500个object proposals

使用NMS为每一帧生成64个建议(表示为P)。对于每个epoch,我们通过在每个视频的一个随机帧中随机选择12个建议,从F中随机抽样一个基于补丁的训练集E。

每次迭代选择N个样本,增强后有N*E个。对这些样本做AHM,按照如下的分数选择前N-1个最近的样本组成一个样本集合
N(At)N (A_t) N(At​)
因为每轮有T次迭代,最终组成
A=Aii=1TA = {A_i}_{i=1}^T A=Ai​i=1T​

si=∑j=1N−1ϕt(zi)⋅ϕt(zj),zi∈Pt,zj∈N(zi)si = \sum_{j=1}^{\N-1} ϕ_t(z_i) · ϕ_t(z_j), z_i ∈ P_t, z_j ∈ N (z_i) si=j=1∑N−1​ϕt​(zi​)⋅ϕt​(zj​),zi​∈Pt​,zj​∈N(zi​)

训练时,先做20轮正常SiamFC训练,在做40轮加上AHM的(Use N (At) and At for one mini-batch)。LOSS采用
Lc(i,j)=−logexp(ϕ(zi)⋅ϕ(zj)/τ)∑k=12NI[i!=k]exp(ϕ(zi)⋅ϕ(zk)/τ)Lc(i, j) = −log \frac{exp(ϕ(z_i) · ϕ(z_j)/τ)}{\sum_{k=1}^{2N}I[i!=k]exp(ϕ(z_i) · ϕ(z_k)/τ)} Lc(i,j)=−log∑k=12N​I[i!=k]exp(ϕ(zi​)⋅ϕ(zk​)/τ)exp(ϕ(zi​)⋅ϕ(zj​)/τ)​
本质就是在做simCLR类的对比学习,将N (At) 作为正样本, 所有At作为负样本。训练结果即将追踪目标作为前景,其他部分作为背景。训练网络分辨前背景的能力,以实现下面对跟踪训练样本的收集。

二 Temporal Mining(时态挖掘)

收集即是随机从数据集中随机选择一个开始帧。然后从该帧中随机选择一个proposal(跟踪目标)以开始挖掘。在对视频中采样的连续帧进行跟踪后,我们在最后一帧中获得了一个具有时间外观变化的跟踪面片。然后将第一个和最后一个面片收集为面片对进行训练,表示为S。又因为如此产生的样本必然会有噪声,所以为SiameseFC设计一种新的LOSS
Lall=LNR(f)+λLc(f)L_{all} = L_{N R}(f) + λL_c(f) Lall​=LNR​(f)+λLc​(f)

PULT:Progressive Unsupervised Learning for Visual Object Tracking(用于视觉目标跟踪的渐进式无监督学习)相关推荐

  1. Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记

    Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...

  2. SeqTrack: Sequence to Sequence Learning for Visual Object Tracking

    摘要 在本文中,我们提出了一种新的序列到序列学习框架的视觉跟踪,称为SeqTrack.它将视觉跟踪转换为一个序列生成问题,它以自回归的方式预测对象边界盒.这与之前的Siamese跟踪器和transfo ...

  3. Quasi-Dense Similarity Learning for Multiple Object Tracking(用于多目标跟踪的拟密集相似度学习)

    Quasi-Dense Similarity Learning for Multiple Object Tracking 论文:下载地址 代码:下载地址 QDTrack: 一. 介绍 二. 方法 1. ...

  4. Online Object Tracking Benchmark(OTB)目标跟踪系统评估方式

    主要涉及到一些评估方式的讲解: 评估数据集: OTB50和OTB100(OTB50这里指OTB-2013,OTB100这里指OTB-2015) Wu Y, Lim J, Yang M H. Onlin ...

  5. Distractor-aware Siamese Networks for Visual Object Tracking 论文学习

    Distractor aware of Siamese Networks for visual object tracking 论文学习 论文阅读总结 Translation Abstract 1 I ...

  6. facebook新无监督论文-Unsupervised Learning of Visual Features by Contrasting Cluster Assignments

    最近比较关注无监督论文,因此只要发现有新的文章都会读一遍,facebook近期刚出了一篇Unsupervised Learning of Visual Features by Contrasting ...

  7. 文献学习(part44)--Aberrance suppresse dspatio-temporal correlation filters for visual object tracking

    学习笔记,仅供参考,有错必纠 关键词:视觉对象跟踪:相关滤波器:时空信息:彻底的改变 Aberrance suppresse dspatio-temporal correlation filters ...

  8. Quasi-Dense Similarity Learning for Multiple Object Tracking

    QDTrack 论文标题:Quasi-Dense Similarity Learning for Multiple Object Tracking 论文地址:https://arxiv.org/pdf ...

  9. VOT(Visual Object Tracking)评价指标综述

    2022.04.05更新 更正了第1节 第t帧上的accuracy 公式的错误 2018.09.30更新: 在VOT2015部分补充R score的定义 上一篇博文简单介绍了vot-toolkit的使 ...

最新文章

  1. 网络工程师成长日记333-某城市政府项目
  2. Flutter——设置appBar的高度
  3. 中文的csv文件python读取编码问题
  4. Idea运行web项目时,提示java.lang.ClassNotFoundException: com.mysql.jdbc.Driver解决方法
  5. Python并发Gevent库(一)
  6. win8网速怎么测试软件,Windows8小技巧:查看当前网速
  7. 关于vue父子组件之间事件触发及数据传递问题
  8. 【个人笔记】关于IO类中流的整理
  9. 关于js字符串替换的一道笔试题目
  10. 【转】第7篇:Xilium CefGlue 关于 CLR Object 与 JS 交互类库封装报告:全自动注册与反射方法分析...
  11. Lock-Free 编程
  12. 在Python中将列表转换为元组
  13. ffmpeg文档1:制作屏幕录像
  14. (2022最新)Java毕业设计参考题目-题目新颖(值得收藏)
  15. 电脑的复制粘贴功能用不了?
  16. oracle 同义词转换错误,一次对dual表的恢复操作(ORA-00980:同义词转换不再有效错误解决方法) (转载)...
  17. mysql 未找到 WinSxS_window_win7系统如何使用WinSxS工具安全删除WinSxS文件夹垃圾?,WinSxS文件: WinSxS是系统文件Wi - phpStudy...
  18. 防火墙文件打印共享服务器,防火墙 网络打印机共享服务器
  19. 无需Root权限新型Android木马SpyNote在多个论坛泄露
  20. C++的数据复合类型

热门文章

  1. 计算机软件著作权必须登记吗?根据国家法律法规规定,计算机软件著作权登记与取得著作权有没有关系?
  2. C语言第十九讲——函数(2)
  3. Java JVM:垃圾回收(GC 在什么时候,对什么东西,做了什么事情)
  4. grep 正则表达式 sed awk expect
  5. python函数可以改变哪种数据类型的实参_Python函数参数的几种类型
  6. CRC常用参数模型及C#代码实现
  7. Marvolo Gaunt‘s Ring
  8. 做程序员必须懂英语吗?_您必须懂英语才能成为程序员吗?
  9. 从uart到serial-ringbuff(环形缓存)
  10. Java程序突然死掉的原因