BoT-SORT: Robust Associations Multi-Pedestrian Tracking 论文详细解读

文章目录

  • BoT-SORT: Robust Associations Multi-Pedestrian Tracking 论文详细解读
    • BoT-SORT:
    • BoT-SORT简述
    • 修改卡尔曼滤波状态向量和其他矩阵参数
    • 相机的运动补偿
    • IOU与Re-ID的融合
    • 实验效果
      • MOT17:
      • MOT20:
    • 借鉴来源

BoT-SORT:

论文标题:BoT-SORT: Robust Associations Multi-Pedestrian Tracking
论文地址:https://arxiv.org/pdf/2206.14651.pdf
论文代码:https://github.com/NirAharon/BOT-SORT

BoT-SORT简述

  本文是以ByteTack为基线,通过分析近期较为流程的track-by-detection范式的“SORT-LIKE”类算法(SORT,DeepSORT,JDE)的局限性,设计较为妥当的解决方式,以此来提升MOT的性能指标。

  • 通过使用卡尔曼滤波器获得轨迹的预测框,但是得到的预测框与检测器得到的结果相比是次优的,目前大多数方法是采用DeepSORT中的状态参数,估计的是bounding box的宽高比,而不是宽高,这就导致预测框的宽高尺寸不准确。
  • 基于“ SORT-like ”类的 IOU 的方法主要依赖于轨迹的预测bounding box的质量,而在复杂的场景或者现实场景下,由于摄像机的运动,导致预测bounding box的正确位置可能会失败,这就导致了预测bounding box和检测得到的bounding box两者之间的低重叠,最终导致跟踪器性能低下。
  • 在数据关联阶段,使用 IOU 往往可以得到更好的 MOTA,而 Re-ID 获得更高的IDF1。所以在本论文中,将IOU和Re-id融合使用。

修改卡尔曼滤波状态向量和其他矩阵参数

  起初,在SORT中的卡尔曼滤波的状态参数有7位 x = [ x c , y c , s , a , x c ˙ , y c ˙ , s ˙ ] x=[x_c,y_c,s,a,\dot{x_c},\dot{y_c},\dot{s}] x=[xc​,yc​,s,a,xc​˙​,yc​˙​,s˙],其中s表示边界框的比例(面积),a表示边界框的宽高比。在DeepSORT中卡尔曼滤波的状态参数有8位 x = [ x c , y c , a , h , x c ˙ , y c ˙ , a ˙ , h ˙ ] x=[x_c,y_c,a,h,\dot{x_c},\dot{y_c},\dot{a},\dot{h}] x=[xc​,yc​,a,h,xc​˙​,yc​˙​,a˙,h˙],将边界框比例s换成了边界框的高。但是作者通过实验发现,即使使用DeepSORT中的状态参数,但是预测出来的边界框,任然有些问题。如下图:

  通过上图可以发现,在DeepSORT使用的状态参数下预测出来的bounding box框不能完整的将目标框住(蓝色虚线框),如此一来,在使用 IOU 进行数据关联的时候,可能就会出现问题。因此作者将卡尔曼滤波器的状态参数设置为 x k = [ x c ( k ) , y c ( k ) , w ( k ) , h ( k ) , x c ( k ) ˙ , y c ( k ) ˙ , w ( k ) ˙ , h ( k ) ˙ ] x_k=[x_c(k),y_c(k),w(k),h(k),\dot{x_c(k)},\dot{y_c(k)},\dot{w(k)},\dot{h(k)}] xk​=[xc​(k),yc​(k),w(k),h(k),xc​(k)˙​,yc​(k)˙​,w(k)˙​,h(k)˙​]。
  既然卡尔曼滤波器的状态参数修改了,那么对应的也需要修改初始化的参数矩阵(过程噪声、测量噪声)以满足整体的修改预测。

相机的运动补偿

  track-by-detection范式的跟踪器严重依赖于预测轨迹的边界框和检测到的边界框之间的重叠。在动态相机情况下,图像平面中的边界框位置可能会发生显著变化,这可能会导致 ID 切换或假阴性增加,如下图所示。

  静态相机场景中的跟踪器也可能因振动或漂移引起的运动而受到影响,就像在 MOT20 中一样,在非常拥挤的场景中,ID 切换可能是一个真正的问题。视频中的运动模式可以概括为刚体运动,来自相机姿态的变化,以及物体的非刚体运动。由于缺乏关于相机运动的额外数据(例如导航、IMU 等)或相机内参,2个相邻帧之间的图像配准是相机刚性运动在图像平面上投影的良好近似。
  作者提出使用传统的方式 Global motion compensation (GMC) ,用OpenCV中的提取图像关键点技术对背景提取特征描述子(类似ORG、SIFT、SURF),并且通过特征点进行稀疏光流跟踪来使用RANSAC计算并获取背景运动的仿射变换矩阵,以此通过前后帧的运动信息生成仿射变换矩阵来预测行人边界框,称为运动补偿,仿射变换矩阵平移部分只会影响中心点位置,而其它的影响状态向量和噪声矩阵。由此作者给出了运动校正的等式方程:

IOU与Re-ID的融合

个人认为与其说是融合,不如说是如何选择,也就是说在什么样的情况下选择使用IOU来进行数据关联,什么情况下使用Re-ID来进行数据的关联。作者的思想其实很简单,就从IOU距离和余弦相似度距离二者中选择最小的那个,只不过余弦相似度值要先进行一步处理。公式如下:

实验效果

MOT17:

MOT20:

借鉴来源

BoT-SORT 论文笔记及思考
屠榜多目标跟踪!BoT-SORT:稳健的关联多行人跟踪

本人能力有效,对文章理解可能不够透彻,有问题欢迎指正!

BoT-SORT: Robust Associations Multi-Pedestrian Tracking 论文详细解读相关推荐

  1. PSGAN——姿态稳健型可感知空间式生成对抗网络论文详细解读与整理

    PSGAN--姿态稳健型可感知空间式生成对抗网络论文详细解读与整理 1.摘要 2.什么是PSGAN? 3.主要贡献 4.整体模块 5.目标函数 6.实验结果--部分化妆和插值化妆 7.定量比较 8.参 ...

  2. 元学习之《On First-Order Meta-Learning Algorithms》论文详细解读

    元学习系列文章 optimization based meta-learning <Model-Agnostic Meta-Learning for Fast Adaptation of Dee ...

  3. SORT:SIMPLE ONLINE AND REALTIME TRACKING论文翻译

    概述: 多目标跟踪中SORT算法的理解 在跟踪之前,对所有目标已经完成检测,实现了特征建模过程. 1. 第一帧进来时,以检测到的目标初始化并创建新的跟踪器,标注id. 2. 后面帧进来时,先到卡尔曼滤 ...

  4. DSO(1)——DSO论文详细解读

    Direct Sparse Odometry Abstract 本文提出了一个较为新颖的直接稀疏里程计(DSO).整个系统包含了完整的直接法(最小光度误差)模型,状态包含相机的位姿,逆深度.为了达到实 ...

  5. 博通语法纠错技术方案入选ACL2022,论文详细解读

    语法纠错团队成功入选ACL 2022的中文纠错模型CRASpell和CNEG | 导语 语法纠错是一项基础的NLP任务,在机器翻译.语音识别.自动问答等任务中具有重要的作用.我们针对中文语法纠错进行了 ...

  6. 4.Product-based Neural Networks for User Response Prediction论文详细解读和代码实现

    一.前言 现在推荐系统,网络搜索和在线广告的数据大多是分类的,并包含多个字段,有一个典型的方法将他们转化成高维稀疏二进制特征表示就是通过one-hot编码.对于这些高维稀疏的特征,传统模型可能会限制它 ...

  7. yolov4论文_YOLOv4论文详细解读

    大家好,本次分享的是YOLOv4的那篇论文我将主要从这几个部分对该论文进行详细的解读首先来看论文的主要内容YOLOv4这篇论文主要是介绍如何使用一些通用的新方法达到了最先进的实验结果,他们在COCO数 ...

  8. 收藏 | Transformer 论文详细解读

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:来源:知乎-北方一瓶川 地址:https://zhuanlan.zhihu.com/p/366014410 A ...

  9. 5.Wide Deep Learning for Recommender Systems论文详细解读和代码实现

    一.总述 Wide & Deep作为一篇推荐领域的经典论文,不仅具有很高的研读价值,而且在推荐和广告领域得到了极大的推广和应用.该论文的思想归结起来就是两个词:Wide & Deep. ...

最新文章

  1. java 枚举使用简书_Java枚举
  2. 5G NGC — AMF 接入和移动性管理功能
  3. flask蓝图的使用
  4. Spring5 jar包下载
  5. [UE4.4.x] 虚幻4 安卓打包
  6. 对C语言实验报告的建议,c语言实验报告.docx
  7. c#ftp操作全解:创建删除目录,上传下载文件,删除移动文件,文件改名,文件目录查询
  8. Android ADB命令?这一次我再也不死记了!【简单说】
  9. 通向从容之道——Getting things done读书笔记
  10. dsoframer java_dsoframer控件动态加载
  11. sap se06和scc4
  12. 如何创建GOOGLE ADS的MCC经理账户,有什么好处?
  13. Ubuntu/Jetson Nano问题解决“Illegal instruction(core dumped)”
  14. recyclerview滚动到指定条目
  15. Win11玩游戏延迟高的解决办法
  16. 小程序AP配网和AK配网教程(开源)
  17. EXT3文件系统修复
  18. 第十一章:MATLAB:符号运算(符号与数值,符号矩阵)
  19. Java中对中国标准时间进行格式化(yyyy-MM-dd HH:mm:ss)两种方法
  20. 格林深瞳一面、二面、hr

热门文章

  1. 佳肴 (Standard IO)
  2. 2021编程语言top10,C蝉联第一,Python超越Java成为第二
  3. QQ空间小秘书 V1.13 beta3~~ 天空原创软件
  4. 三天卖光千亩顶级玫瑰,聚划算如何将品质性价比做到极致?
  5. 常见的化学测试有哪些?--CPSIA、ROHS、REACH、FDA检测、加州65
  6. 说说谢霆锋的音乐创作[转]
  7. postma公共变量的设置及使用
  8. MATLAB-基于灰色神经网络的预测算法研究(订单需求预测)
  9. 2023年浙江大学报考点硕士研究生报名网上确认公告
  10. 【强化学习论文合集】二十三.2020AAAI人工智能大会论文(AAAI2020)