RATM: RECURRENT ATTENTIVE TRACKING MODEL

  ICLR 2016

  本文主要内容是 结合 RNN 和 attention model 用来做目标跟踪。

  其中模型的组成主要是:

  1. an attention model 主要用来从输入图像中提取 patch;

  2. RNN 用来预测 attention 参数,即:下一帧应该 look 的问题。

  Paper: http://xueshu.baidu.com/s?wd=RATM%3A+RECURRENT+ATTENTIVE+TRACKING+MODEL&rsv_bp=0&tn=SE_baiduxueshu_c1gjeupa&rsv_spt=3&ie=utf-8&f=8&rsv_sug2=1&sc_f_para=sc_tasktype%3D%7BfirstSimpleSearch%7D&rsv_n=2

  Code: https://github.com/wangxiao5791509/RATM

  本文所使用的框架流程图如下所示:

  


  1. Attention

  本文提到, attention model 非常适合跟踪问题,因为他可以通过目标的历史轨迹来缩小 region-of-interst 的区域。

  原本的 attention model 从输入图像中产生 glimpse(一瞥),是通过一个叫做 a grid of 2D Gaussian filters,顺序的执行一系列的 row filter 和 column filter。该 grid 拥有 4个参数,即:

  the grid center $g_X, g_Y$,the isotropic standard deviation, and the stride between grid points.

  对于在 attention patch中的行 i,列 j,平均距离 $\mu_X^i, \mu_Y^j$ 通过下式进行计算:

  动态产生的参数 作为一个向量 h 的线性转换:

  然后对参数进行归一化:

  其中 A 和 B 分别是输入图像的宽和高。

  滤波器通过下面的公式计算得到提取的 patch,即:

  在上式中, a 和 b 代表输入图像的列和行的索引。通过这两个公式就可以得到一个 N*N 的 patch p:

  

  


  2. RNN

  一个最简单的 RNN 包括一个输入,一个 hidden,一个 输出层。在时间步骤 t,该网络,基于输入帧 $x_t$ 和 之前的 hidden state $h_{t-1}$,计算新的 hidden state:

  本文对 RNN 并未做过多介绍,因为创新点也不在于此,只是说是基于 Theano 框架做的实验。


  3. Recurrent Attentive Tracking Model:

  跟踪问题主要是将一系列的输入视频帧 $X = (x_1, x_2, ... , x_T)$ 映射成 一系列的位置 $Y = (y_1, y_2, ... , y_T)$。那么在一个时刻 t 的位置预测 $y_t$,那么其轨迹通常具有非常高的相关内容信息,并且非常适合用 一个隐层状态模型(a hidden state model)来对这个轨迹进行表示。所提出的 RNN 就是结合了 attention model 和 RNN 的优势,并且区别于普通的神经网络。

  每一个时间步骤,RNN的 hidden state vector $h_t$ 通过公式2,3 映射成 window parameters。然后在下一个时刻,由 attention model 输出的image patch 作为 RNN 的输入。并非直接将 原始图像输入给 RNN,而是用预先训练的 CNN model 提出其feature 传给 RNN。具体结构见下图:

  

  


  实验:

  

  

论文笔记之:RATM: RECURRENT ATTENTIVE TRACKING MODEL相关推荐

  1. 论文笔记 SiamMask : Fast Online Object Tracking and Segmentation: A Unifying Approach

    论文连接:[1812.05050] Fast Online Object Tracking and Segmentation: A Unifying Approach 论文连接:[1812.05050 ...

  2. 【论文笔记8】Tree-Structured Neural Topic Model (分层神经主题模型 / TSNTM)

    Tree-Structured Neural Topic Model 树结构的神经主题模型 论文概述 题目:Tree-Structured Neural Topic Model 作者:Masaru I ...

  3. 论文笔记Understanding and Diagnosing Visual Tracking Systems

    最近在看目标跟踪方面的论文,看到王乃岩博士发的一篇分析跟踪系统的文章,将目标跟踪系统拆分为多个独立的部分进行分析,比较各个部分的效果.本文主要对该论文的重点的一个大致翻译,刚入门,水平有限,如有理解错 ...

  4. 论文笔记-DynaSLAM II: Tightly-Coupled Multi-Object Tracking and SLAM

    I.Introduction 关于动态SLAM,在这个部分,论文总结了现有三种方案思路: 检测动态的区域,然后把他们从SLAM环节中去除 在定位的环节外,把包含动态内容的现实图片中翻译成只有静态内容的 ...

  5. 论文笔记 - RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching

    这篇博客是对论文RAFT-Stereo: Multilevel Recurrent Field Transforms for Stereo Matching的阅读笔记. 论文地址位于paper,代码已 ...

  6. 【论文笔记】K-plet Recurrent Neural Networks for Sequential Recommendation

    原文:K-plet Recurrent Neural Networks for Sequential Recommendation (本文只是略读,所以笔记只记录了主要的思想,更多的细节还需看原文) ...

  7. 【论文笔记】DOA-GAN: Dual-Order Attentive Generative Adversarial Network for Image Copy-move Forgery Detec

    DOA-GAN: Dual-Order Attentive Generative Adversarial Network for Image Copy-move Forgery Detection a ...

  8. 论文笔记(A Neural Influence Diffusion Model for Social Recommendation)

    神经影响传播模型为了社交推荐 原文链接:A Neural Influence Diffusion Model for Social Recommendation, SIGIR'19 原理:社交网络上应 ...

  9. 论文笔记:SESF-Fuse: an unsupervised deep model for multi-focus image fusion (2021)

    SESF-Fuse: an unsupervised deep model for multi-focus image fusion [引用格式]:Boyuan Ma et al. "SES ...

最新文章

  1. Android 多线程及线程通信
  2. C#--检索线程状态
  3. php面试基础项目,PHP面试经典题
  4. redis入门demo
  5. 国外学python的软件_全球开发者调查报告:IT人最想学习 Go 和 Python、美国开发者收入最高...
  6. 黑客攻防:从入门到入狱_每日新闻摘要:游戏服务黑客被判入狱27个月
  7. 快速入门Matplotlib
  8. pycharm 调试_把xlwings盘顺溜:xlwings连接到Pycharm进行调试,以及xlwings转换器等的使用...
  9. elman神经网络 python实现_Rust 能取代 Python,更好的实现神经网络?
  10. c# 关于继承类中构造函数的实现
  11. java 协议开发_用Java的NIO开发网络协议
  12. EvnetTimeWindow API
  13. Interpreting Attributions and Interactions of Adversarial Attacks论文解读
  14. 思科CCNP认证和华为 HCIP认证网络工程师必须了解的NETCONF四个层面的基本框架
  15. win10 插入鼠标自动禁用触摸板的方法
  16. 我收藏的thinkphp扩展插件
  17. leetcode-t51 N皇后(回溯)
  18. 坚定、信心和进取是成功的基石
  19. linux遇到nul字符,linux TXT文件操作 '^@ ' 'NUL' 符号乱码问题
  20. ROS2使用OpenCV基础

热门文章

  1. python 正则search 所有_python之路----正则re(search,match,findall……)
  2. 去除a链接+java正则_JavaScript实现正则去除a标签并保留内容的方法【测试可用】...
  3. 【视频课】深度学习必备基础,如何使用好数据?
  4. 【杂谈】GAN对人脸图像算法产生了哪些影响?
  5. 中国CMOS图像传感器行业运行状况与应用前景调研报告2022版
  6. 全球及中国生物技术产业创新发展模式及十四五应用方向研究报告2021-2027年
  7. 中国致密气行业十四五前景分析及发展规划远景报告2022年版
  8. 谋定5G+工业互联网-陈肇雄:经信研究体系化应用部署规划
  9. Go 函数,包(二)
  10. postgres安装02--postgis