理解出错之处望不吝指正。

本文模型叫做ADNet。该模型通过强化学习产生动作序列(对bbox进行移动or尺度变换)来进行tracking。原理如下图(第一列代表初始帧,第二列和第三列代表通过RL产生的动作序列对object进行tracking):

  • 模型的整体结构如下:

  • 强化学习部分:

(1)状态:

状态分为两部分。其中代表正在tracking的bbox(当前图片信息,可在上图中看到),则是一个维的向量,存储的是pervious 10个action,其中11代表的是11种不同的action,使用独热码表示。

(2)动作:

动作分为3类共11种。第一类是move,包括上下左右和快速上下左右;第二类是scale,包括放大和缩小;第三类是stop,即终止操作。

(3)状态转移:

我们定义一个差值():

对于上下左右action(以此类推):

对于快速上下左右action(以此类推):

对于尺度变换action:

(4)奖励函数:

假设action sequence的长度为T,则reward定义如下(即:中间的那些action都不产生reward,只有动作终止了才有reward):

动作的终止有两种触发情况:①.选择了stop action;②.action sequence产生了波动(eg: {left, right, left})。

  • 训练部分:

训练部分包括三部分:

(1)训练监督学习部分

这部分训练,训练部分的action lable通过以下方法获得:

class lable的判断如下:

损失函数如下:

(2)训练强化学习部分(这部分有点没懂)

这部分训练,我们通过上一步骤的训练得到了当前训练的初始参数,这部分就是使用SGD最大化:

其中当在labeled frame中success时,,否则

作者提到这部分训练可以采用半监督训练,如下图所示:

(3)在线自适应

在线更新的时候,只对进行更新。每过帧使用前面帧中置信分数大于0.5的样本进行微调。

如果当前的置信分数小于-0.5,说明“跟丢了”,需要进行re-detection。

CVPR 2017 ADNet:《 Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning》论文笔记相关推荐

  1. 论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning

    论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning  2017-06-06  21: ...

  2. 目标跟踪算法五:MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking

    目标跟踪算法五:MDNet: Learning Multi-Domain Convolutional Neural Networks for Visual Tracking 原文:https://zh ...

  3. earning Multi-Domain Convolutional Neural Networks for Visual Tracking

    论文笔记<Learning Multi-Domain Convolutional Neural Networks for Visual Tracking> 0. 摘要 基于CNN的一个跟踪 ...

  4. 论文记载: Deep Reinforcement Learning for Traffic LightControl in Vehicular Networks

    强化学习论文记载 论文名: Deep Reinforcement Learning for Traffic LightControl in Vehicular Networks ( 车辆网络交通信号灯 ...

  5. 强化学习论文分析1---多小区功率控制问题----《Power Allocation in Multi-cell Networks Using Deep Reinforcement Learning》

    目录 一.研究内容概述 二.系统目标与约束 1.系统目标 2.约束条件 三.映射到Q-learning 1.Q表的确定 2.环境的确定 四.设计DQN网络 1.输入层 2.输出层 3.损失值 五.方法 ...

  6. Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记

    Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...

  7. ActionSpotter Deep Reinforcement Learning Framework for Temporal Action Spotting in Videos

    ActionSpotter: Deep Reinforcement Learning Framework for Temporal Action Spotting in Videos 论文阅读笔记 1 ...

  8. STCT: Sequentially Training Convolutional Networks for visual tracking

    1.怎么将CNN用在特定的任务中 图1. 将CNN用在特定的任务中 众所周知CNN的使用往往需要大量的训练样本,但是我们在很多特定任务中是没法获得像imageNet那样庞大的样本库,因此如何在小样本中 ...

  9. FeUdal Networks for Hierarchical Reinforcement Learning 阅读笔记

    FeUdal Networks for Hierarchical Reinforcement Learning 标签(空格分隔): 论文笔记 增强学习算法 FeUdal Networks for Hi ...

最新文章

  1. uscao Spinning Wheels
  2. 米兔点读笔点读包_小米米兔点读笔评测:养成教育只要轻松一点
  3. QT的QScriptContext类的使用
  4. 高德软件测试工资,【高德工资】软件测试工程师待遇-看准网
  5. php与nginx整合
  6. 烂泥:智能DNS使用与配置
  7. 从零开始学python人工智能课程_从零开始如何学习人工智能?
  8. 开源虎墩同名电影《小虎墩大英雄》定档大年初一
  9. 工业交换机出现故障问题排查步骤详解
  10. python enumeration_python枚举防止无效的属性分配
  11. 接口规范 6. 查看在线用户
  12. 网安学习-应急响应1
  13. 数学建模竞赛经验分享(从本科生到研究生,获奖成功率100%,我从数模所学)
  14. 设置samba密码时提示failed to find entry for user
  15. android好用的NFC软件,5个有用的NFC应用程序为Android,以利于NFC | MOS86
  16. 人工智能作业 八数码启发式搜索与bfs比较
  17. Fedora 常用软件推荐
  18. 前端如何调用微信授权登录
  19. 网络基本概念之TCP, UDP, 单播(Unicast), 组播(Multicast)
  20. 生死狙击2等待服务器响应,《生死狙击2》劫掠测试结束:热爱不止 来日再战!...

热门文章

  1. USTC English Club Note20171021
  2. 云炬Android开发笔记 7登陆注册功能开发
  3. python有趣的工具_python好玩的小工具(正在create中)
  4. VTK修炼之道4_Win32控制台项目
  5. 从用户接触到完成需求说明书
  6. 在整个数据库中查找包含某关键字的所有存储过程
  7. 23种设计模式C++源码与UML实现--单例模式中的饿汉模式和懒汉模式
  8. C++笔记函数重载函数模板
  9. 两数之和——双指针法
  10. 逆元~(乘法逆元及其应用)