这篇文章是今年6月底发布的一篇多目标跟踪(MOT)的屠榜方法,命名为BoT-SORT。作者来自以色列的特拉维夫大学(Tel-Aviv University)。本文简单谈谈我对这个算法的理解,因为也是MOT领域的初学者,如有错误希望各位读者修正,也欢迎大家一起探讨。
PS:文章内部分图片是原创,如需转载请注明出处。

paper: https://arxiv.org/abs/2206.14651
code: https://github.com/NirAharon/BOT-SORT

算法在IDF1和MOTA两个指标上都做到了SOTA:

在MOT的诸多算法中,可以将其分成两类——即TBD(Tracking by Detection)范式和JDE范式。TBD范式是two-shot的算法,即在保证检测结果准确的基础上实现跟踪算法(比较经典的算法有SORT/DeepSORT/ByteTrack/OC-SORT等等)。JDE范式则是one-shot的算法,旨在一步到位,使用检测的方法同步实现跟踪。这篇文章提出的算法应属于TBD范式,下面是TBD范式的一般流程:
文章首先简单阐述了“SORT-LIKE”系列方法的缺陷,其贡献点也是旨在解决这些问题:
现存主要问题有两个:

  • 由于卡尔曼滤波相机运动两个因素,导致的Bounding box预测不准确;
  • Re-ID任务和检测任务的平衡问题(在跟踪任务中加入Re-ID)

解决方式主要有三个:

  1. 改进KF的状态向量
  2. 使用相机运动补偿方式改进bounding box的预测;
  3. 加入Re-ID的度量,提高跟踪的准确度。

下面分别简单介绍这三个贡献:

1.卡尔曼滤波的改进

改进后的效果:

这部分的有效性文章通过后面的消融实验来证实,具体KF的推导比较繁琐,我的理解就是把之前使用的宽高比变成了使用宽和高

2. 相机运动补偿

作者认为相机的运动会导致检测框的漂移,即便是静止的相机,目标中人物也可能会因为不规则运动导致目标的振动。
这部分使用opencv中的全局运动估计(GMC)技术来表示背景运动。首先提取图像关键点,再利用稀疏光流进行基于平移的局部异常点抑制的特征跟踪。然后使用RANSAC计算放射变换矩阵,在将预测的边界框从k-1帧坐标变换到其下一阵第k帧的坐标。

效果:

题外话:这部分相机运动补偿的工作其实StrongSORT(DeepSORT的改进)也有做过,在StrongSORT中使用的是ECC方法

3. IoU&ReID Fusion

为了提取Re-ID特征,采用了FastReID库中BoT 之上的更强的baseline——SBS(2020年提出)+ ResNeSt50作为骨干网络。这部分在StrongSORT中也用了相同的backbone。

在外观分支,具体实现:
余弦相似度和用于匈牙利算法的代价矩阵计算:

最后我们回顾下这个方法的pipeline,上面描述的三部分就对应pipeline中的以下三部分:

熟悉MOT算法的朋友肯定一眼就看得出来,整体的流程和ByteTrack是一样的:

  • 第一次联合高分置信度的目标,并作Re-ID和IOU的匹配;
  • 第二次联合低分置信度的目标。

这里借用 ByteTrack的图,看得更明显一些:
第一次关联(关联1)中,ByteTrack的作者也表示过,使用过Re-ID分支作匹配,但效果一般。其中使用的是DeepSort的策略,使用简单的CNN提取RE-ID特征:

其实在看过文章和一些源码以后,发现BoT-SORT貌似是把ByteTrack中认为无效的工作捡起来重做了。具体一些,是把之前的DeepSORT更换为其更强大的变体——StrongSORT:

无论是提取re-id特征的backbone部分还是后续使用的相机运动补偿和EMA策略,基本流程都和StrongSORT一致。

最后是实验部分:


加入相机运动补偿(CMC)的效果:



总体来说,在我看来其实这篇文章的创新点,或者说能够work的亮点主要在RE-ID上。但在limitation部分作者也说了,加入RE-ID之后速度非常慢,这个我也有进行一些测试,fps只能达到5以内,没办法实时。但是在短时遮挡的情况下,算法可以很好地跟住目标,这点要比ByteTrack/oc-sort这些方法要好。

很多地方语焉不详,文章的翻译和一些解析也可以参考 https://blog.csdn.net/jacke121/article/details/125568958…

[论文阅读] BoT-SORT: Robust Associations Multi-Pedestrian Tracking相关推荐

  1. 【论文阅读】Realtime Robust Malicious Traffic Detection via Frequency DomainAnalysis

    [论文阅读]Realtime Robust Malicious Traffic Detection via Frequency DomainAnalysis 原文标题:Realtime Robust ...

  2. 【论文阅读】RAPTOR: Robust and Perception-Aware Trajectory Replanning for Quadrotor Fast Flight

    [论文阅读]<RAPTOR: Robust and Perception-Aware Trajectory Replanning for Quadrotor Fast Flight> 发表 ...

  3. 论文阅读笔记《Robust Point Matching via Vector Field Consensus》

    核心思想   本文提出一种基于向量场一致性的(Vector Field Consensus)非刚性(non-rigid)匹配方法(VFC).所谓刚性(rigid)的匹配方法通常是使用参数化模型(如单应 ...

  4. 【论文阅读】Realtime Robust Malicious Traffic Detection via Frequency Domain Analysis

    原文标题:Realtime Robust Malicious Traffic Detection via Frequency DomainAnalysis 原文作者:Chuanpu Fu, Qi Li ...

  5. 论文阅读 (80):Robust Bag Classification Approach for Multi-instance Learning Via Subspace Fuzzy Clusteri

    文章目录 1 概述 1.1 题目 1.2 摘要 1.3 引用 2 算法 2.1 问题制定 2.2 模糊子空间实例选择 2.3 包编码 2.4 集成设计 1 概述 1.1 题目 2022:子空间模糊距离 ...

  6. 【论文阅读】Graph Networks for Multiple Object Tracking

    1.引言 受文献[3]的启发,我们提出了一种基于两个端到端图网络的近在线MOT方法,该方法提供了一种新的基本图网络框架.我们根据MOT问题的特点,精心设计了自己的图网络.对于两个分别处理外观和运动的端 ...

  7. BoT-SORT: Robust Associations Multi-Pedestrian Tracking 论文详细解读

    BoT-SORT: Robust Associations Multi-Pedestrian Tracking 论文详细解读 文章目录 BoT-SORT: Robust Associations Mu ...

  8. 对抗训练-smart 论文阅读笔记

    对抗训练-smart 论文阅读笔记 SMART: Robust and Efficient Fine-Tuning for Pre-trained NaturalLanguage Models thr ...

  9. 【论文阅读+】SCRDet 论文翻译学习

    SCRDet:Towards More Robust Detection for Small, Cluttered and Rotated Objects_babywang0的博客-CSDN博客_sc ...

  10. 【论文阅读5】BoT-SORT:Robust Associations Multi-Pedestrian Tracking

    [论文阅读5]BoT-SORT:Robust Associations Multi-Pedestrian Tracking 和OC-SORT类似,BoT-SORT也是对Kalman滤波进行改进.OCS ...

最新文章

  1. tiav15安装重启_西门子博途TIA Portal V15.1安装无限重启和.net3.5SP1错误处理
  2. oracle外部表使用详解,详解Oracle外部表的一次维护(图文)
  3. 无法访问D盘,执行页内操作时的错误
  4. 成为计算机视觉工程师的第一个月,我都学会了什么?
  5. Virtura box 构建一个简单局域网并联入外网
  6. myeclipse 8.5 注册码
  7. 【WPF】WPF DataGrid List数据源 双向绑定通知机制之ObservableCollection使用以及MultiBinding 的应用...
  8. 文档主题分类项目Python代码
  9. SAP License:大陆SAP用户清单
  10. spring 主从表_听听京东架构师浅谈,MySQL binlog 主从同步
  11. java arraystoreexception_java基础面试
  12. iOS中内存管理的问题——堆和栈
  13. 从非结构化数据到特色数据指标,AI如何更懂金融?
  14. SpringCloud项目接入Nacos服务治理
  15. 链家二手房销售数据分析
  16. 怎么用手机连接电脑上网听语音
  17. excel转word_excel怎么转换成word格式手机?骨灰级方法确定不收藏吗?
  18. excel填充序列_猴哥讲述:excel的自动填充功能——自动填充单元格
  19. 2020年—岁月静好,温暖如初
  20. python爬虫实训第六天

热门文章

  1. HTTPS、SSL、TLS三者之间的联系和区别
  2. java中poi导出Excel表格(前台流文件接收)
  3. 百度编辑器对H5代码修改
  4. 计算机u盘能直接拨出吗,u盘可以直接从电脑上拔下来吗
  5. 如何用ArcScene进行洪水淹没分析
  6. golang:模拟枚举
  7. 制作CentOS 6.4 U盘启动安装盘
  8. AlarmManager用法的注意事项
  9. java ffmpeg视频截图_Java实现对视频进行截图的方法【附ffmpeg下载】
  10. 贾跃亭微博发新车V9图片 计划明年量产预售