Learning Attentions: Residual Attentional Siamese Network for High Performance Online Visual Track笔记
该文是注意力机制应用的巅峰。简单的说本文就是:Siamese+CSR-DCF
该文首先对SRDCF.CSR-DCF等使用了特征加权的非深度学习方法和SimaseFC等的深度学习方法进行了介绍,指出非深度学习方法都是基于手动特征,然后优化理论的传统方法,而Siamese等深度学习方法则没有使用注意机制,从而无法消除边缘效应。该文将两类跟踪方法的优点进行结合并做了很多加强。代码地址(要等到六月份..)https://github.com/foolwood/RASNet.
网络结构:
训练:首先通过imagenet的视频序列,离线训练一般注意力权重,然后输入a pair images 给Siamese,上面的网络接受前一帧的跟踪目标框,特征提取,然后输入到残差注意网络和通道注意网络里得到注意力权重, 然后三部分注意力进行融合得到最终注意力权重,最后将注意力权重,前一帧特征和当前帧搜索框进行互相关运算求出置信度映射。
测试阶段:将测试图片对输入到Siamase和普通注意力网络,其他过程和测试阶段类似。
实验:在matlab with matconvnet上实现,Intel(R) Xeon(R) CPU E5-2630 v4 @2.20GHz and a NVIDIA TITAN Xp GPU.
OTB数据集:
VOT数据集:
效果真的很棒,VOT效果好过ECO和CCOT,那岂不是比某讯的VITAL(http://xueshu.baidu.com/s?wd=paperuri%3A%28e45482204e16e29bdb602e35f9cde2ef%29&filter=sc_long_sign&tn=SE_xueshusource_2kduw22v&sc_vurl=http%3A%2F%2Farxiv.org%2Fabs%2F1804.04273&ie=utf-8&sc_us=5643655420424511566)还要叼,而且速度干到了80!
总结:
优点:该文的三重注意力还是很有创新性的,尤其是残差注意力的提出,可以很好解决离线训练的过拟合问题。
缺点:1)单该文的模型结构过于松散,其中需要一个单独的结构去提取General attention,这与端到端的思想不符,是一个可以改进的地方。
2)WXCorr的运算用一个网络去近似,也是一个值得考虑的点。
3)由于Siamese的原因,使得网络的两端输入SIZE必须一致,所以作者才会在目标帧CROP出多个框,去计算WXC,很显然这使得网络的灵活性降低,如果在下端网络的特征后端加入一些用于特征对齐的层或者直接FC,可能处理起来更方便一些。
Learning Attentions: Residual Attentional Siamese Network for High Performance Online Visual Track笔记相关推荐
- RASNet阅读笔记:Learning Attentions: Residual Attentional Siamese Network for High Performance Online Vis
CVPR2018 论文在此 文章全称:Learning Attentions: Residual Attentional Siamese Network for High Performance On ...
- CVPR 2018 RASNet:《Learning Attentions: Residual Attentional Siamese Network for Tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做RASNet,在Siamese框架下重构了CF,提出了三种attention机制(general.residual.channel),这三种attention的提 ...
- RFA-Net: Residual feature attention network for fine-grained image inpainting 论文阅读笔记
RFA-Net: Residual feature attention network for fine-grained image inpainting 论文阅读笔记 摘要 尽管大多数使用生成对抗性 ...
- CVPR 2018 SA-Siam:《A Twofold Siamese Network for Real-Time Object Tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做SA-Siam.本文提出了一个结合Semantic features(语义特征)和Appearance features(表征特征)的模型,其实类似于一个双路模型 ...
- 孪生网络(Siamese Network)实现手写数字聚类
Siamese Network通常用于小样本的学习,是meta learning的方法. Siamese Network,其使用CNN网络作为特征提取器,不同类别的样本,共用一个CNN网络,在CNN网 ...
- ICCV 2017 DSiam:《Learning Dynamic Siamese Network for Visual Object Tracking》论文笔记
理解出错之处望不吝指正. 本文模型叫做DSiam.作者提出一个Dynamic Siamese Network,可以使用一个transformation learning model来在线学习目标的外观 ...
- 2019_WSDM_Social Attentional Memory Network Modeling Aspect- and Friend-level Differences in Recomme
[论文阅读笔记]2019_WSDM_Social Attentional Memory Network Modeling Aspect- and Friend-level Differences in ...
- 读论文《SNUNet-CD: A Densely Connected Siamese Network for Change Detection of VHR Images》
SNUNet-CD: A Densely Connected Siamese Network for Change Detection of VHR Images SNUNet-CD:稠密连接孪生网络 ...
- 论文笔记:孪生神经网络(Siamese Network)
Siamese Network 原文:<Learning a Similarity Metric Discriminatively, with Application to Face Verif ...
最新文章
- SBB:石油污染土壤微生物群落构建与生物多样性研究
- linux fcitx启动 窗口,Linux系统Fcitx中文输入法开机启动方法
- Android一键多渠道分发打包实战和解析
- SpringCloud配置中心高可用搭建
- java程序表头出不来_JAVA SWING 表头不显示问题
- linux一键安装node+npm
- veket linux软件下载6,veket linux官方
- SQL Server之游标
- PostgreSQL的notify 与listen (一)
- Sqlplus 联机文档学习
- Java字符编码知识简介
- mysql的过程返回执行成功与失败_进行数据库操作的时候,操作错误或者失败,但是不报错...
- shell中的比较与测试
- linux虚拟磁带机管理,RHEL6 虚拟磁带机使用指南
- Pandas 安装到Pycharm
- 【前后端异常】http/https post请求 返回415错误状态码的解决方法
- java毕业设计宠物寄养预约系统Mybatis+系统+数据库+调试部署
- 计算机c盘空间满了应该怎么办,C盘空间满了怎么办?我来教你你如何解决
- 将Excel表格中的文本格式存储的数字批量转换为数字
- Linux软件包安装与卸载