SiamRPN++

  • 动机
  • 解决方法
    • 1.均匀采样策略
    • 2.ResNet 驱动的孪生跟踪
    • 3. 多层特征融合
    • 4.深度互相关
  • 结果
  • 总结

动机

该论文主要解决的问题是将深层基准网络ResNet、Inception等网络应用到基于孪生网络的跟踪网络中。在SiameseFC算法之后,尽管已经有很多的基于孪生网络的跟踪算法,但是大家可能会注意到一个问题是,这些网络都使用浅层的类AlexNet做为基准特征提取器。其实在这之前,也有学者们尝试着使用深层的网络,但是发现直接使用预训练好的深层网络反而会导致跟踪算法精度的下降,因此,这成为了一个基于孪生网络的跟踪器需要解决的一个关键问题!

解决方法

经过详细分析,发现阻止Siamese tracker使用深度网络的核心原因与这两个方面有关。一个原因是深度网络中的填充会破坏严格的平移不变性。另一个是RPN需要不对称特征进行分类和回归。

1.均匀采样策略

针对第一个问题,提出了一种简单而有效的采样策略来打破空间不变性限制,该策略成功地训练了由 ResNet 架构驱动的连体跟踪器。
这种采样策略通过均匀分布的采样方式让目标在中心点附近进行偏移,可以缓解网络因为破坏了严格平移不变性带来的影响,即消除了位置偏见,让有padding的更深层网络可以应用于跟踪算法中。
"shift"是指由于数据扩充目标产生的最大平移范围。

具体的效果如上图所示:将shift设置为0时,网络只会关注图像中心的位置,对应到图中就是只有中心位置具有较大的响应值;而将shift设置为16时,网络开始关注更多的图像范围,对应到图中就是响应的范围会扩大,颜色由深变浅;而将shift设置为32时,网络会关注更大额图像范围,对应到图中就是响应的范围变得更大,颜色也更加多样化。

按照这个思想进行了实际的实验验证,在训练过程中,不再把正样本块放在图像正中心,而是按照均匀分布的采样方式让目标在中心点附近进行偏移。由上图可以看出,随着偏移的范围增大,深度网络可以由刚开始的完全没有效果逐渐变好。
所以说,通过均匀分布的采样方式让目标在中心点附近进行偏移,可以缓解网络因为破坏了严格平移不变性带来的影响,即消除了位置偏移,让更深层的网络可以应用于跟踪算法中。

2.ResNet 驱动的孪生跟踪

既然已经解决了平移不变性问题,那么就可以将深度网络应用到SiamRPN算法之中。
原始的 ResNet 有 32 个像素的大步幅,不适合密集的 Siamese 网络预测。

如上图所示,我们通过将 conv4 和 conv5 块修改为具有单位空间步幅,将最后两个块的有效步幅从 16 像素和 32 像素减少到 8 像素,并通过扩张卷积增加其感受野 。
在训练过程中采用了新的采样策略后,我们可以训练ResNet网络了,并且能够正常跟踪一些视频了。对backbone进行finetune以后,又能够进一步得到一些性能提升。

3. 多层特征融合

浅层特征主要集中在颜色、形状等低级信息上,对于定位是必不可少的,而缺乏语义信息;深层特征具有丰富的语义信息,在运动模糊、大变形等挑战场景中有利于定位。假设使用这种丰富的分层信息有助于跟踪。
在我们的网络中,提取多分支特征以协同推断目标定位。对于 ResNet50,我们探索从最后三个残差块中提取的多级特征,用于我们的逐层聚合。我们将这些输出分别称为 F3(z)、F4(z) 和 F5(z)。
conv3、conv4、conv5 的输出分别馈入三个 Siamese RPN 模块。由于三个 RPN 模块的输出大小具有相同的空间分辨率,因此在 RPN 输出上直接采用加权和。加权融合层结合了所有输出。

因为它们的域是不同的,组合权重被分开用于分类和回归。权重与网络一起进行端到端优化离线。

4.深度互相关

针对第二个问题引入了深度互相关

(a) 互相关 (XCorr) 层预测 SiamFC [1] 中目标模板和搜索补丁之间的单通道相似度图。
(b) 上行通道互相关 (UP-XCorr) 层通过在 SiamRPN [25] 中将重卷积层与几个独立的 XCorr 层级联来输出多通道相关特征。
© 深度互相关 (DW-XCorr) 层预测模板和搜索补丁之间的多通道相关特征。

沉重的上通道模块导致参数分布严重不平衡(即 RPN 模块包含 20M 参数,而特征提取器仅包含 4M 参数在 [25] 中),这使得 SiamRPN 中的训练优化变得困难。
我们提出了一个名为 Depthwise Cross Correlation的轻量级互相关层,以实现高效的信息关联。DW-XCorr 层包含的参数比 SiamRPN 中使用的 UP-XCorr 少 10 倍,而性能与之相当。

结果




总结

论文提出了一种名为SiamRPN++的框架,相比于其他Siamese系列框架,该框架可以使用深度神经网络作为backbone,可以使用较深的网络进行特征提取。也得益于使用较深的网络,则不同层可以表现出不同的语义特征,该框架将不同层的语义特征进行融合,共同作用得出了建议区域。同时,使用Depthwise Conv的方法,缩小了不同分支之间参数数据不平衡的问题,有效的提升了训练过程的稳定性,提高了收敛速度。在多个数据集上测试,取得了较好的效果,具备一定的泛化性。

SiamRPN++阅读笔记相关推荐

  1. trainer setup_Detectron2源码阅读笔记-(一)Configamp;Trainer

    一.代码结构概览 1.核心部分 configs:储存各种网络的yaml配置文件 datasets:存放数据集的地方 detectron2:运行代码的核心组件 tools:提供了运行代码的入口以及一切可 ...

  2. VoxelNet阅读笔记

    作者:Tom Hardy Date:2020-02-11 来源:VoxelNet阅读笔记

  3. Transformers包tokenizer.encode()方法源码阅读笔记

    Transformers包tokenizer.encode()方法源码阅读笔记_天才小呵呵的博客-CSDN博客_tokenizer.encode

  4. 源码阅读笔记 BiLSTM+CRF做NER任务 流程图

    源码阅读笔记 BiLSTM+CRF做NER任务(二) 源码地址:https://github.com/ZhixiuYe/NER-pytorch 本篇正式进入源码的阅读,按照流程顺序,一一解剖. 一.流 ...

  5. Mina源码阅读笔记(一)-整体解读

    2019独角兽企业重金招聘Python工程师标准>>> 今天的这一节,将从整体上对mina的源代码进行把握,网上已经有好多关于mina源码的阅读笔记,但好多都是列举了一下每个接口或者 ...

  6. “CoreCLR is now Open Source”阅读笔记

    英文原文:CoreCLR is now Open Source 阅读笔记如下: CoreCLR是.NET Core的执行引擎,功能包括GC(Garbage Collection), JIT(将CIL代 ...

  7. QCon 2015 阅读笔记 - 团队建设

    QCon 2015阅读笔记 QCon 2015 阅读笔记 - 移动开发最佳实践 QCon 2015 阅读笔记 - 团队建设 中西对话:团队管理的五项理论和实战 - 谢欣.董飞(今日头条,LinkedI ...

  8. 05《软件需求模式》阅读笔记

    剩下的两个阅读笔记写第二部分.各类需求模式,共八个领域和它的需求模式,这一次写前四个. 基础需求模式,它是所有种类的系统都可能需要的一些东西.系统间接口需求模式使用系统间接口需求模式定义被定义的系统和 ...

  9. [置顶] Linux协议栈代码阅读笔记(一)

    Linux协议栈代码阅读笔记(一) (基于linux-2.6.21.7) (一)用户态通过诸如下面的C库函数访问协议栈服务 int socket(int domain, int type, int p ...

最新文章

  1. python面试常见问题-常见Python面试题
  2. Java若_【JAVA基础】JAVA四种引用(强软若虚)
  3. 多米诺骨牌(洛谷-P1282)
  4. django数据库事务
  5. STM32Cube_FW_F1_V1.0.0固件库学习(四)外部中断 中
  6. python 正则表达式 前瞻_我应该如何在python中编写这个正则表达式(How should I write this regex in python)...
  7. [蛋蛋四格漫画]-贺沪江日语四周年版庆
  8. 右键文件夹没有git clone命令的解决方法
  9. 安卓10不支持qmc解码_如何开启 安卓10 隐藏的桌面模式并或者显示器拓展支持
  10. 实现计算机系统的资源共享,实现多操作系统计算机的资源共享
  11. 衡量测试的充分性和完整性-测试覆盖率
  12. 关于vlc编解码器暂不支持: VLC 无法解码格式“MIDI” (MIDI Audio)解决
  13. OpenCV之彩色视频转黑白视频
  14. 踩坑日记 - word转pdf
  15. 游戏计算机电源,吃鸡一族看过来,游戏PC应配什么电源?
  16. matlab命令行窗口显示长度设置_MATLAB中如何设置坐标轴的显示长度?
  17. void指针(void *的用法)
  18. 肠道重要基石菌属——普雷沃氏菌属 prevotella
  19. 文件切割器 合并器
  20. Android 阿里推送正常推送以及辅助通道走过的坑,字节跳动+阿里+华为+腾讯等大厂Android面试题

热门文章

  1. centos7的freeswitch1.10.3自动安装脚本
  2. JVM系列之故障排查与性能调优(重点)
  3. qPCR ddPCR
  4. 独角数卡PHP自动化售货发卡网源码下载
  5. StNet: Local and Global Spatial-Temporal Modeling for Action Recognition
  6. 华为发布敏捷交换机备战大数据
  7. 考研政治---马克思主义基本原理概论---辩证法
  8. IDEA2021启动报错 Faild to create jvm
  9. 全球及中国碳纤维复合辊市场运行状况及行业前景调研报告2021年版
  10. 教你用 Python 快速获取行业板块股,辅助价值投资