该文是注意力机制应用的巅峰。简单的说本文就是:Siamese+CSR-DCF

该文首先对SRDCF.CSR-DCF等使用了特征加权的非深度学习方法和SimaseFC等的深度学习方法进行了介绍,指出非深度学习方法都是基于手动特征,然后优化理论的传统方法,而Siamese等深度学习方法则没有使用注意机制,从而无法消除边缘效应。该文将两类跟踪方法的优点进行结合并做了很多加强。代码地址(要等到六月份..)https://github.com/foolwood/RASNet.

网络结构:

训练:首先通过imagenet的视频序列,离线训练一般注意力权重,然后输入a pair images 给Siamese,上面的网络接受前一帧的跟踪目标框,特征提取,然后输入到残差注意网络和通道注意网络里得到注意力权重, 然后三部分注意力进行融合得到最终注意力权重,最后将注意力权重,前一帧特征和当前帧搜索框进行互相关运算求出置信度映射。

测试阶段:将测试图片对输入到Siamase和普通注意力网络,其他过程和测试阶段类似。

实验:在matlab with matconvnet上实现,Intel(R) Xeon(R) CPU E5-2630 v4 @2.20GHz and a NVIDIA TITAN Xp GPU.

OTB数据集:

VOT数据集:

效果真的很棒,VOT效果好过ECO和CCOT,那岂不是比某讯的VITAL(http://xueshu.baidu.com/s?wd=paperuri%3A%28e45482204e16e29bdb602e35f9cde2ef%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Farxiv.org%2Fabs%2F1804.04273&ie=utf-8&sc_us=5643655420424511566)还要叼,而且速度干到了80!

总结:

优点:该文的三重注意力还是很有创新性的,尤其是残差注意力的提出,可以很好解决离线训练的过拟合问题。

缺点:1)单该文的模型结构过于松散,其中需要一个单独的结构去提取General attention,这与端到端的思想不符,是一个可以改进的地方。

2)WXCorr的运算用一个网络去近似,也是一个值得考虑的点。

3)由于Siamese的原因,使得网络的两端输入SIZE必须一致,所以作者才会在目标帧CROP出多个框,去计算WXC,很显然这使得网络的灵活性降低,如果在下端网络的特征后端加入一些用于特征对齐的层或者直接FC,可能处理起来更方便一些。

Learning Attentions: Residual Attentional Siamese Network for High Performance Online Visual Track笔记相关推荐

  1. RASNet阅读笔记:Learning Attentions: Residual Attentional Siamese Network for High Performance Online Vis

    CVPR2018 论文在此 文章全称:Learning Attentions: Residual Attentional Siamese Network for High Performance On ...

  2. CVPR 2018 RASNet:《Learning Attentions: Residual Attentional Siamese Network for Tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做RASNet,在Siamese框架下重构了CF,提出了三种attention机制(general.residual.channel),这三种attention的提 ...

  3. RFA-Net: Residual feature attention network for fine-grained image inpainting 论文阅读笔记

    RFA-Net: Residual feature attention network for fine-grained image inpainting 论文阅读笔记 摘要 尽管大多数使用生成对抗性 ...

  4. CVPR 2018 SA-Siam:《A Twofold Siamese Network for Real-Time Object Tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做SA-Siam.本文提出了一个结合Semantic features(语义特征)和Appearance features(表征特征)的模型,其实类似于一个双路模型 ...

  5. 孪生网络(Siamese Network)实现手写数字聚类

    Siamese Network通常用于小样本的学习,是meta learning的方法. Siamese Network,其使用CNN网络作为特征提取器,不同类别的样本,共用一个CNN网络,在CNN网 ...

  6. ICCV 2017 DSiam:《Learning Dynamic Siamese Network for Visual Object Tracking》论文笔记

    理解出错之处望不吝指正. 本文模型叫做DSiam.作者提出一个Dynamic Siamese Network,可以使用一个transformation learning model来在线学习目标的外观 ...

  7. 2019_WSDM_Social Attentional Memory Network Modeling Aspect- and Friend-level Differences in Recomme

    [论文阅读笔记]2019_WSDM_Social Attentional Memory Network Modeling Aspect- and Friend-level Differences in ...

  8. 读论文《SNUNet-CD: A Densely Connected Siamese Network for Change Detection of VHR Images》

    SNUNet-CD: A Densely Connected Siamese Network for Change Detection of VHR Images SNUNet-CD:稠密连接孪生网络 ...

  9. 论文笔记:孪生神经网络(Siamese Network)

    Siamese Network 原文:<Learning a Similarity Metric Discriminatively, with Application to Face Verif ...

最新文章

  1. SBB:石油污染土壤微生物群落构建与生物多样性研究
  2. linux fcitx启动 窗口,Linux系统Fcitx中文输入法开机启动方法
  3. Android一键多渠道分发打包实战和解析
  4. SpringCloud配置中心高可用搭建
  5. java程序表头出不来_JAVA SWING 表头不显示问题
  6. linux一键安装node+npm
  7. veket linux软件下载6,veket linux官方
  8. SQL Server之游标
  9. PostgreSQL的notify 与listen (一)
  10. Sqlplus 联机文档学习
  11. Java字符编码知识简介
  12. mysql的过程返回执行成功与失败_进行数据库操作的时候,操作错误或者失败,但是不报错...
  13. shell中的比较与测试
  14. linux虚拟磁带机管理,RHEL6 虚拟磁带机使用指南
  15. Pandas 安装到Pycharm
  16. 【前后端异常】http/https post请求 返回415错误状态码的解决方法
  17. java毕业设计宠物寄养预约系统Mybatis+系统+数据库+调试部署
  18. 计算机c盘空间满了应该怎么办,C盘空间满了怎么办?我来教你你如何解决
  19. 将Excel表格中的文本格式存储的数字批量转换为数字
  20. Linux软件包安装与卸载

热门文章

  1. 华为蓝牙耳机推荐哪款?值得入手的蓝牙耳机推荐
  2. 收起键盘时,露出黑色或桌面
  3. Spoon Virtual Application Studio 绿色便携软件制作工具
  4. vivado+zedboard之音频分析仪_HW
  5. 教你怎样把一个价值0.5元苹果卖到100万元
  6. Facebook Java爬虫获取视频数据
  7. 根据verilog画出对应的电路图
  8. [work]从贝叶斯方法谈到贝叶斯网络
  9. biome-BGC模型小白求助
  10. WPF实现圆形菜单动态展开折叠效果