理解出错之处望不吝指正。

本文模型叫做MemTrack。本文的模型是基于相似学习的,主要有两个创新点:①.设计一个动态记忆网络;②.使用门控剩余模板和初始模板,生成最终的匹配模板。模型的整体架构如下:

  • 大致流程

①.对当前帧,使用上一帧的预测位置进行剪裁,得到搜索区域

②.对进行特征提取,这里特征提取模块使用和SiamFC一样的结构;

③.使用注意力机制,获得输出,使LSTM的输入更多的注意object,而不是background;

④.将和LSTM的上一个隐层状态一起输入LSTM,得到隐层状态和记忆库控制信号(包括read key 、read strength 、衰减率和一些偏置项);

⑤.使用read key 、read strength 获得read weight ,再进一步获得剩余模板

⑥.对剩余模板和初始模板进行加权累加,得到最终匹配模板

⑦.使用最终匹配模板与搜索区域进行相似度计算,得到当前帧的预测结果,将结果进行剪裁得到

⑧.对进行特征提取,得到新的匹配模板,根据一些规则,将其写入动态记忆库。

  • 注意力机制

先对进行特征提取,得到,使用的池化核对进行AvgPooling得到,对分为个patch,第个patch用表示,根据下式得到输出

其中,通过下式计算:

效果如下图:

  • LSTM控制

如图所示:

  • Memory Reading

通过下式得到read key 、read strength (用于表示read key的置信度):

再计算出read weight

这里的是用于计算余弦相似度的函数。最终得到剩余模板:

  • 获得最终模板

最终模板可以通过下式得到:

其中,是通过LSTM得到的。

  • Memory Writing

得到新的匹配模板后,根据以下三条准则,将其写入到动态记忆库中:

①.如果的置信度低(包含大量背景信息),则不进行write;

②.如果和以前帧相比变化不大,则用其替代以前帧;

③.如果和以前帧相比变化较大,则用其覆盖动态记忆库中一个新位置。

文中定义了一个write weight:

这里的代表零向量,是read weight,是allocation weight(负责指定write的位置)。是“写门”,是“读门”,是“分配门”,是通过LSTM计算得到的:

上式满足

allocation weight通过下式计算:

其中,用于表示动态记忆库中不同位置的访问频次,是衰减因子。

将write weight和擦除因子(erase factor)结合,进行动态记忆库的写入:

其中是LSTM得到的衰减率,

  • 实验

OTB-2015

OTB-2013

VOT-2016

速度

ECCV 2018 MemTrack:《Learning Dynamic Memory Networks for Object Tracking》论文笔记相关推荐

  1. Learning Dynamic Memory Networks for Object Tracking全文翻译

    摘要   视觉跟踪的模板匹配方法由于其性能相当和速度快而受到欢迎.但是,它们缺乏有效的方法来适应目标对象外观的变化,使得它们的跟踪精度还远未达到-艺术.在本文中,我们提出了一种动态记忆网络,以使模板在 ...

  2. Communication-Efficient Learning of Deep Networks from Decentralized Data 论文笔记

      本文出自论文Communication-Efficient Learning of Deep Networks from Decentralized Data,本文提出了一种基于迭代模型平均的深层网 ...

  3. Feature Pyramid Networks for Object Detection 论文笔记

    版权声明:本文为博主原创文章,未经博主允许不得转载. https://blog.csdn.net/Jesse_Mx/article/details/54588085 论文地址:Feature Pyra ...

  4. Learning Dynamic Memory Networks for ObjectTracking(论文翻译)

    用于目标跟踪的学习动态记忆网络 摘要 用于视觉跟踪的模板匹配方法由于其相当的性能和快速的速度而得到了广泛的应用.然而,它们缺乏有效的方法来适应目标对象外观的变化,使得它们的跟踪精度仍然远远达不到最先进 ...

  5. Dynamic Memory Networks DMN+

    DMN出自论文Ask Me Anything: Dynamic Memory Networks for Natural Language Processing(2015-06),这个模型用于Quest ...

  6. Distractor-aware Siamese Networks for Visual Object Tracking 论文学习

    Distractor aware of Siamese Networks for visual object tracking 论文学习 论文阅读总结 Translation Abstract 1 I ...

  7. Fully-Convolutional Siamese Networks for Object Tracking全文翻译

    Fully-Convolutional Siamese Networks for Object Tracking 摘要   任意对象跟踪的问题传统上通过仅在线学习对象外观的模型来解决,使用视频本身作为 ...

  8. Fully-Convolutional Siamese Networks for Object Tracking(SiamFC 算法学习)

    Fully-Convolutional Siamese Networks for Object Tracking(SiamFC 算法学习) 1.摘要 传统方法存在的问题:仅在线方法固有地限制了他们可以 ...

  9. Fully-Convolutional Siamese Networks for Object Tracking基于全卷积孪生网络的目标跟踪算法SiameseFC

    1.论文相关 Bertinetto, Luca, et al. "Fully-convolutional siamese networks for object tracking." ...

最新文章

  1. ASP.NET控件Repeater遍历
  2. Stack Overflow上188万浏览量的提问:Java 到底是值传递还是引用传递?
  3. AngularJs Cookie 的使用
  4. 区块链BaaS云服务(17)纸贵科技Z-BaaS“数据治理”
  5. 应用maven的感想
  6. adb实时获取屏幕_实时数仓 | 你需要的是一款合适且强大的OLAP数据库(上)
  7. python统计文件大小_python工具--01.统计当前目录下的文件的大小
  8. linux限制单个用户使用,linux下限制用户使用系统资源
  9. 帮你躲坑:pip install tensorflow 报错怎么办,import tensorflow 报错怎么办?
  10. 智能优化算法:野马优化算法-附代码
  11. lockdir_59103.exe 怎样解密?
  12. 深度学习——(4)VGG16 图像分类
  13. 超全 泛微 E8 E-cology 8 开发资料大全 开源下载资料
  14. C语言将raw转为bmp,Raw格式转换为Bmp格式
  15. Android UID相关知识
  16. Flutter开发之——序列化失败-have not been migrated to null-safety
  17. PYQT5|一键自动生成并应用QRC资源文件
  18. 命令与征服:绝命时刻
  19. uni-app中兴趣标签选择
  20. 车牌识别系统四:Pyqt5编写简易车牌识别界面

热门文章

  1. USTC English Club Note20171019(2)
  2. java switch 值_Java switch多值匹配操作详解
  3. RDD 与 DataFrame原理-区别-操作详解
  4. *.bmp序列保存为*.raw文件[matlb实现]
  5. 串口通信模块1:串口基础知识
  6. 图像中的灰度共生矩阵
  7. BugkuCTF-reverse:入门逆向
  8. BUUCTF-Reverse:reverse2
  9. 30分钟掌握ES6/ES2015核心内容(上)
  10. 关于jquerymobile的预加载