注意力机制可视化_目标跟踪中的(STAM)时空注意力机制
目标跟踪分为单目标跟踪和多目标跟踪,单目标跟踪较为简单,这里我们只讨论多目标跟踪。
多目标跟踪的遮挡问题
多目标跟踪时特别容易发生目标间的相互遮挡,从而导致严重的预测偏移问题,如下图所示:
红色框的行人在和蓝色框行人交错而过时,由于外观模型的持续更新,红色框就学到了另一个人的外观特征,从而导致跟踪错误。这种情况在多目标跟踪中并不少见,所以如何解决遮挡问题就成了重中之重。
这里介绍一种采用时空注意力机制(Spatial-Temporal Attention Mechanism)来尽可能解决目标间遮挡的深度模型。
Online Multi-Object Tracking Using CNN-based Single Object Tracker with Spatial-Temporal Attention Mechanismarxiv.org
模型总体架构
这种时空注意力深度模型的总体架构如下所示:
空间注意力对特征进行加权,从而对每个候选框进行分类,而时间注意力通过调节第t帧样本和历史样本的权重,从而辅助损失函数进行参数更新。
空间注意力
我们接下来具体看一看空间注意力机制如何发挥作用。
输入图片先通过一个共享卷积层,提取高维特征CNN Feature Map,接着各个目标均在此CNN Feature Map上进行预测即可,每个特定目标CNN分支都对应跟踪一个目标,即有多少行人,就有多少CNN分支。
值得一提的是,对于每个目标来说,其候选框BBox由两部分组成,运动模型的预测框和检测模型的检测框组成;接着对此目标的所有候选框进行评分,得分最高的且大于一定阈值的候选框,即为此帧此目标的预测跟踪框。
得到ROI-Pooling特征时注意一个细节:因为BBox框的大小不一样,所以引入ROI池化,统一ROI Features的尺寸,从而保证后序全连接层正常运行。
特定目标分支中,分为空间注意力提取阶段和二分类阶段:
(1)空间注意力使用可视图来得到,ROI-Pooling特征经过卷积层和全连阶层后reshape成可视图,越接近于1即为目标像素,越接近0则为非目标像素,可视化如下:
红色区域为目标,蓝色区域为被遮挡部分。
这里的可视图既辅助产生空间注意力,也在时间注意力中发挥作用,在更新参数时决定使用当前帧的程度;
(2)二分类阶段较为简单明了,每个ROI-Pooling都对应这一个得分,对于一个分支来说,得分最高的且大于一定阈值的ROI-Pooling,即为此帧此目标的预测跟踪框。
时间注意力
时间注意力其实反映的是我们更新参数时,考虑此帧预测跟踪框占总损失的权重。
其中,
总损失也就是由第t帧负样本,第t帧正样本,历史正样本三部分构成,均采用交叉熵损失。
实验结果
消融实验可以得出每个部分都是有效的。
时空注意力机制STAM和其他多目标跟踪方法比,效果确实得到了一定的提升。IDS评价指标最优,也体现出此模型能较好地处理遮挡问题,减少了ID错误切换的频率。
总结归纳:
1.前半部分网络使用共享卷积层,减少了参数量;并且参数固定住,减少反向传播的计算量;
2.引入运动模型,相比起其他只使用Detector的MOT算法,增加了稳定性;
3.使用时空注意力机制,更准确地跟踪遮挡情况。
问题讨论:
一般空间注意力都是全连接层进行全局Softmax实现,大家知道空间注意力的局部连接形式是什么样的吗?
注意力机制可视化_目标跟踪中的(STAM)时空注意力机制相关推荐
- 一文详解目标跟踪中的相关滤波
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文来源:AI干货知识库 / 导读 / 目标跟踪是计算机视觉领域的一个重要问题,目前广泛应用在体育赛事 ...
- 无迹卡尔曼滤波UKF—目标跟踪中的应用(算法部分)
无迹卡尔曼滤波UKF-目标跟踪中的应用(算法部分) 原创不易,路过的各位大佬请点个赞 机动目标跟踪/非线性滤波/传感器融合/导航等探讨代码联系WX: ZB823618313 仿真部分见博客: [无迹卡 ...
- 无迹卡尔曼滤波UKF—目标跟踪中的应用(仿真部分)
无迹卡尔曼滤波UKF-目标跟踪中的应用(仿真部分) 原创不易,路过的各位大佬请点个赞 机动目标跟踪/非线性滤波/传感器融合/导航等探讨联系WX: ZB823618313 算法部分见博客: [无迹卡尔曼 ...
- 交互式多模型算法IMM——机动目标跟踪中的应用
机动目标跟踪--交互式多模型算法IMM 原创不易,路过的各位大佬请点个赞 WX: ZB823618313 机动目标跟踪--交互式多模型算法IMM 机动目标跟踪--交互式多模型算法IMM 1. 对机动目 ...
- 交互式多模型-粒子滤波IMM-PF—在机动目标跟踪中的应用/matlab实现
交互式多模型-粒子滤波IMM-PF-在机动目标跟踪中的应用/matlab实现 原创不易,路过的各位大佬请点个赞 WX: ZB823618313 交互式多模型-粒子滤波IMM-PF-在机动目标跟踪中的应 ...
- 交互式多模型-扩展卡尔曼滤波IMM-EKF——机动目标跟踪中的应用
交互式多模型-扩展卡尔曼滤波IMM-EKF--机动目标跟踪中的应用 原创不易,路过的各位大佬请点个赞 针对机动目标跟踪的探讨.技术支持欢迎联系,也可以站内私信 WX: ZB823618313 机动目标 ...
- 容积卡尔曼滤波CKF—目标跟踪中的应用(算法部分—I)
容积卡尔曼滤波CKF-目标跟踪中的应用(算法部分) 原创不易,路过的各位大佬请点个赞 机动目标跟踪/非线性滤波/传感器融合/导航等探讨代码联系WX: ZB823618313 作者:823618313@ ...
- 智慧交通day04-特定目标车辆追踪03:siamese在目标跟踪中的应用-汇总
总结: Siamese网络衡量两个输入的相似程度,输出是一个[0,1]的浮点数,表示二者的相似程度.孪生神经网络有两个输入(Input1 and Input2),将两个输入feed进入两个神经网络(N ...
- (转) 深度学习在目标跟踪中的应用
深度学习在目标跟踪中的应用 原创 2016-09-05 徐霞清 深度学习大讲堂 点击上方"深度学习大讲堂"可订阅哦!深度学习大讲堂是高质量原创内容的平台,邀请学术界.工业界一线专家 ...
最新文章
- 聚焦OA品牌:OA产品影响力是选型关键
- Katalon Studio自动化测试框架使用【1】--- 环境安装以及基础配置(MacOS)
- XPath语法 在C#中使用XPath例子与用法
- 贪心算法之取手套问题(牛客)
- 分享我的学习方法——还是坚持+努力
- (转)Python3异常-AttributeError: module 'sys' has no attribute 'setdefaultencoding
- linux进程fd数量,linux – 文件描述符的数量:/ proc / sys / fs / file-nr和/ proc / $pid / fd之间有什么不同?...
- 阶段3 2.Spring_10.Spring中事务控制_10spring编程式事务控制2-了解
- 机房运维服务器,机房服务器维护指导
- 系统中 用户操作日志管理
- Unity UnityWebRequest使用方法
- ACM比赛代码文件读写调试方案
- 怎么更改网络选项为家庭计算机,我的现在是公用网络我想更改为家庭网络应该如何更改...
- PTA 7-28猴子选大王(约瑟夫问题)
- 设置用户计算机的ip地址,电脑动态IP地址怎么设置
- 语音识别之Fbank特征提取工具的比较(kaldi、python_speech_features、torchaudio)
- Hyperledger Besu环境搭建(Linux)
- nginx安装三大的命令的解释./configure make make install
- 46招健脑秘笈,让你变得更聪明
- 【WebDriver】WebDriverWait 用法代码
热门文章
- IntelliJ IDEA for Mac 如何创建Java Web项目_创建Java EE项目_创建项目_新建项目
- Java中,为什么子类的构造方法中必须调父类的构造方法?
- QPW 用户签署协议日志表(tf_user_agreement_log)
- 服务器$java_top路径_ERP实施项目-MD120_FIN000_即时打印_V1.0
- Spring半注解半Xml
- c语言命名规则_C语言的基本数据类型及变量
- 将py文件打包成exe可执行文件
- java spring eventbus_spring集成guava的event bus
- yili邮箱服务器配置,手把手教 个人SMTP服务器的配置 -电脑资料
- Java创新型模式_java设计模式--创建型模式(一)