目标跟踪分为单目标跟踪和多目标跟踪,单目标跟踪较为简单,这里我们只讨论多目标跟踪。

多目标跟踪的遮挡问题

多目标跟踪时特别容易发生目标间的相互遮挡,从而导致严重的预测偏移问题,如下图所示:

红色框的行人在和蓝色框行人交错而过时,由于外观模型的持续更新,红色框就学到了另一个人的外观特征,从而导致跟踪错误。这种情况在多目标跟踪中并不少见,所以如何解决遮挡问题就成了重中之重。

这里介绍一种采用时空注意力机制(Spatial-Temporal Attention Mechanism)来尽可能解决目标间遮挡的深度模型。

Online Multi-Object Tracking Using CNN-based Single Object Tracker with Spatial-Temporal Attention Mechanism​arxiv.org

模型总体架构

这种时空注意力深度模型的总体架构如下所示:

空间注意力对特征进行加权,从而对每个候选框进行分类,而时间注意力通过调节第t帧样本和历史样本的权重,从而辅助损失函数进行参数更新。

空间注意力

我们接下来具体看一看空间注意力机制如何发挥作用。

输入图片先通过一个共享卷积层,提取高维特征CNN Feature Map,接着各个目标均在此CNN Feature Map上进行预测即可,每个特定目标CNN分支都对应跟踪一个目标,即有多少行人,就有多少CNN分支。

值得一提的是,对于每个目标来说,其候选框BBox由两部分组成,运动模型的预测框和检测模型的检测框组成;接着对此目标的所有候选框进行评分,得分最高的且大于一定阈值的候选框,即为此帧此目标的预测跟踪框。

得到ROI-Pooling特征时注意一个细节:因为BBox框的大小不一样,所以引入ROI池化,统一ROI Features的尺寸,从而保证后序全连接层正常运行。

特定目标分支中,分为空间注意力提取阶段和二分类阶段:

(1)空间注意力使用可视图来得到,ROI-Pooling特征经过卷积层和全连阶层后reshape成可视图,越接近于1即为目标像素,越接近0则为非目标像素,可视化如下:

红色区域为目标,蓝色区域为被遮挡部分。

这里的可视图既辅助产生空间注意力,也在时间注意力中发挥作用,在更新参数时决定使用当前帧的程度;

(2)二分类阶段较为简单明了,每个ROI-Pooling都对应这一个得分,对于一个分支来说,得分最高的且大于一定阈值的ROI-Pooling,即为此帧此目标的预测跟踪框。

时间注意力

时间注意力其实反映的是我们更新参数时,考虑此帧预测跟踪框占总损失的权重。

参数就是我们需要学习的权重。

其中,

即可视图Visibility Map的均值,
是此目标与其他目标的最大IOU值,其它参数均需要学习。

总损失也就是由第t帧负样本,第t帧正样本,历史正样本三部分构成,均采用交叉熵损失。

实验结果

消融实验可以得出每个部分都是有效的。

时空注意力机制STAM和其他多目标跟踪方法比,效果确实得到了一定的提升。IDS评价指标最优,也体现出此模型能较好地处理遮挡问题,减少了ID错误切换的频率。

总结归纳:

1.前半部分网络使用共享卷积层,减少了参数量;并且参数固定住,减少反向传播的计算量;

2.引入运动模型,相比起其他只使用Detector的MOT算法,增加了稳定性;

3.使用时空注意力机制,更准确地跟踪遮挡情况。

问题讨论:

一般空间注意力都是全连接层进行全局Softmax实现,大家知道空间注意力的局部连接形式是什么样的吗?

注意力机制可视化_目标跟踪中的(STAM)时空注意力机制相关推荐

  1. 一文详解目标跟踪中的相关滤波

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文来源:AI干货知识库 / 导读 / 目标跟踪是计算机视觉领域的一个重要问题,目前广泛应用在体育赛事 ...

  2. 无迹卡尔曼滤波UKF—目标跟踪中的应用(算法部分)

    无迹卡尔曼滤波UKF-目标跟踪中的应用(算法部分) 原创不易,路过的各位大佬请点个赞 机动目标跟踪/非线性滤波/传感器融合/导航等探讨代码联系WX: ZB823618313 仿真部分见博客: [无迹卡 ...

  3. 无迹卡尔曼滤波UKF—目标跟踪中的应用(仿真部分)

    无迹卡尔曼滤波UKF-目标跟踪中的应用(仿真部分) 原创不易,路过的各位大佬请点个赞 机动目标跟踪/非线性滤波/传感器融合/导航等探讨联系WX: ZB823618313 算法部分见博客: [无迹卡尔曼 ...

  4. 交互式多模型算法IMM——机动目标跟踪中的应用

    机动目标跟踪--交互式多模型算法IMM 原创不易,路过的各位大佬请点个赞 WX: ZB823618313 机动目标跟踪--交互式多模型算法IMM 机动目标跟踪--交互式多模型算法IMM 1. 对机动目 ...

  5. 交互式多模型-粒子滤波IMM-PF—在机动目标跟踪中的应用/matlab实现

    交互式多模型-粒子滤波IMM-PF-在机动目标跟踪中的应用/matlab实现 原创不易,路过的各位大佬请点个赞 WX: ZB823618313 交互式多模型-粒子滤波IMM-PF-在机动目标跟踪中的应 ...

  6. 交互式多模型-扩展卡尔曼滤波IMM-EKF——机动目标跟踪中的应用

    交互式多模型-扩展卡尔曼滤波IMM-EKF--机动目标跟踪中的应用 原创不易,路过的各位大佬请点个赞 针对机动目标跟踪的探讨.技术支持欢迎联系,也可以站内私信 WX: ZB823618313 机动目标 ...

  7. 容积卡尔曼滤波CKF—目标跟踪中的应用(算法部分—I)

    容积卡尔曼滤波CKF-目标跟踪中的应用(算法部分) 原创不易,路过的各位大佬请点个赞 机动目标跟踪/非线性滤波/传感器融合/导航等探讨代码联系WX: ZB823618313 作者:823618313@ ...

  8. 智慧交通day04-特定目标车辆追踪03:siamese在目标跟踪中的应用-汇总

    总结: Siamese网络衡量两个输入的相似程度,输出是一个[0,1]的浮点数,表示二者的相似程度.孪生神经网络有两个输入(Input1 and Input2),将两个输入feed进入两个神经网络(N ...

  9. (转) 深度学习在目标跟踪中的应用

    深度学习在目标跟踪中的应用 原创 2016-09-05 徐霞清 深度学习大讲堂 点击上方"深度学习大讲堂"可订阅哦!深度学习大讲堂是高质量原创内容的平台,邀请学术界.工业界一线专家 ...

最新文章

  1. 聚焦OA品牌:OA产品影响力是选型关键
  2. Katalon Studio自动化测试框架使用【1】--- 环境安装以及基础配置(MacOS)
  3. XPath语法 在C#中使用XPath例子与用法
  4. 贪心算法之取手套问题(牛客)
  5. 分享我的学习方法——还是坚持+努力
  6. (转)Python3异常-AttributeError: module 'sys' has no attribute 'setdefaultencoding
  7. linux进程fd数量,linux – 文件描述符的数量:/ proc / sys / fs / file-nr和/ proc / $pid / fd之间有什么不同?...
  8. 阶段3 2.Spring_10.Spring中事务控制_10spring编程式事务控制2-了解
  9. 机房运维服务器,机房服务器维护指导
  10. 系统中 用户操作日志管理
  11. Unity UnityWebRequest使用方法
  12. ACM比赛代码文件读写调试方案
  13. 怎么更改网络选项为家庭计算机,我的现在是公用网络我想更改为家庭网络应该如何更改...
  14. PTA 7-28猴子选大王(约瑟夫问题)
  15. 设置用户计算机的ip地址,电脑动态IP地址怎么设置
  16. 语音识别之Fbank特征提取工具的比较(kaldi、python_speech_features、torchaudio)
  17. Hyperledger Besu环境搭建(Linux)
  18. nginx安装三大的命令的解释./configure make make install
  19. 46招健脑秘笈,让你变得更聪明
  20. 【WebDriver】WebDriverWait 用法代码

热门文章

  1. IntelliJ IDEA for Mac 如何创建Java Web项目_创建Java EE项目_创建项目_新建项目
  2. Java中,为什么子类的构造方法中必须调父类的构造方法?
  3. QPW 用户签署协议日志表(tf_user_agreement_log)
  4. 服务器$java_top路径_ERP实施项目-MD120_FIN000_即时打印_V1.0
  5. Spring半注解半Xml
  6. c语言命名规则_C语言的基本数据类型及变量
  7. 将py文件打包成exe可执行文件
  8. java spring eventbus_spring集成guava的event bus
  9. yili邮箱服务器配置,手把手教 个人SMTP服务器的配置 -电脑资料
  10. Java创新型模式_java设计模式--创建型模式(一)