1. 多目标跟踪的目的就是将每个目标和其他目标进行区分开来,具体方法是给每个目标分配一个ID,并记录他们的轨迹
  2. 和目标检测的最大区别:仅仅使用目标检测无法给对象分配ID,并且多目标跟踪算法能够优化轨迹,能让目标框更加稳定。
  3. 多目标跟踪中一个比较经典的和深度学习结合比较好的方法就是Detection Based Tracking,对前后两帧进行目标检测,然后根据得到的前后两帧的所有目标进行匹配,从而维持ID。初学者接触比较多的就是SORT和Deep SORT算法了。

Tracking by detection:

  • We will focus on algorithms where a set of detections is provided(rememnber detections are not perfect)
  • Find detections that match and form a trajectory.

Online vs. offline tracking

  • Online tracking:
  • processes two frames at a time
  • for real-time applications
  • prone to drifting ➡️ hard to recover from errors or occlusions
  • Offline tracking:
  • processes a batch of frames
  • good to recover fro occlusions(short ones as well as well see)
  • not suitable for video analysis

Online tracking

  1. Track initialization(e.g. using a detector)
    deep learning has provided us with better detectors

  2. prediction of the next position(motion model)
    trajectory prediction
    classic: Kalman filter

  3. matching predictions with detections(apearance model)
    improving appearance models ➡️ re-identification(in a few slides)
    matching still happens separately from learning.➡️ mot as a graph problem
    bipartite matching
    — solve the unique assignments that minimize the total cost

making detectors as tracktors
cons: there is no notion of “identity” in the model - confusion in crowded spaces
cons: as any online tracker, the track is killed if the target becomes occluded - need to close small gaps and occulsions
solution: Re-ID

cons: the regressor only shifts the box by a small quantity - large camera motions - large displacements due to low framerate
solution: Motion model

modeling appearance. ------->. re-id
modeling motion ------- motion model


Re-ID


similarity learning
triplet loss alows us to learn a ranking

行人重识别系统

  1. feature extraction:学习能够应对在不同摄像头下行人变化的特征
  2. metric learning:将学习到的特征映射到新的空间使相同的人更近不同的人更远
  3. matching:根据图片特征之间的距离排序,返回检索结果

数据集

  • 通过人工标注或者检测算法得到的行人图片
  • 数据集分为训练集,验证集,query以及gallery
  • 在训练集上进行模型的训练,得到模型后对query与gallery中的图片特征提取特征计算相似度,对于每个query在gallery中找出前N个与其相似的图片
  • 训练,测试中人物身份不重复

基于深度学习的行人重识别

  • 表征学习:没有直接在训练网络的时候考虑图片间的相似度,而是把行人重识别任务当作分类问题或者验证问题来看待
  • 度量学习:在通过网络学习出两张图片的相似度,表现为同一行人的不同图片间的相似度大于不同行人的不同图片

全局特征

局部特征:

  • part:是指通过一定规则(例如姿态点信息)手工设置的一些矩形框区域
  • attention:是指(在一定的约束条件下)网络自动学习出的比较重要任意形状区域


MOT中的评价指标

评价出发点

  • 所有出现的目标需要及时能够找到
  • 目标位置要尽可能与真实目标一致
  • 每个目标都给分配一个unique ID,并且这个ID在整个序列中保持不变

评价指标数学模型:
参考:多摄像头多目标追踪指标

  1. 建立 目标与假设最优间的最优一一对应关系,称为correspondence
  2. 对所有的correspondence,计算位置偏移误差
  3. 累积结构误差 a. 计算漏检数 b. 计算虚警数(不存在目标却判断为目标) c. 跟踪目标发生跳变的次数

  1. MOTA(Multiple object tracking accuracy)

    FN,FP,IDSW,GT分别为false negtive, false positive, id switch以及gound truth的物体数量
    MOTA主要考虑的是tracking中所有对象匹配错误,主要是FP,FN,IDs. MOTA给出的是非常直观的衡量跟踪其在检测物体和保持轨迹时的性能(仅仅考虑跟踪器出错的次数),与目标检测精度无关。

  2. MOTP(Multiple Object Tracking Precision)

d为检测目标和i给它分配的ground truth之间在所有帧中的平均度量距离

使用bonding box的overlap rate来进行度量(在这里MOTP是越大越好,但对于使用欧氏距离进行度量的就是MOTP越小越好,这主要取决于度量距离d的定义方式);而c为在当前帧匹配成功的数目。MOTP主要量化检测器定位精度,几乎不包含与跟踪器实际性能相关的信息。

  1. MT(Mostly Tracked)
    满足Ground Truth至少在80%的时间内都匹配成功的track,在所有追踪目标中所占的比例。注意这里的MT和ML与当前track的ID是否发生变化无关,只要Ground Truth与目标匹配上即可。

  2. ML(Mostly Lost)
    满足Ground Truth在小于20%的时间内匹配成功的track,在所有追踪目标中所占的比例

  3. ID Switch
    Ground Truth所分配的ID发生变化的次数

  4. FP (False Positive)
    当前帧预测的track和detection没有匹配上,将错误预测的track点称为FP,如图1所示。是否匹配成功与匹配时所设置的阈值有关。

  5. FN (False Negative)
    当前帧预测的track和detection没有匹配上,将未被匹配的ground truth点称为FN(也可以称为Miss

  6. ID scores
    MOTA的主要问题是仅仅考虑跟踪器出错的次数,但是有一些场景(比如航空场景)更加关注一个跟踪器是否尽可能长的跟踪一个目标。这个问题通过构建二分图来解决,主要计算对象是IDTP、IDFP、IDFN。

多目标追踪相关 + reid相关推荐

  1. VOT 2017挑战赛——目标追踪相关分享

    视觉跟踪领域国际顶级赛事 Visual-Object-Tracking Challenge (VOT) 2017年结果出炉,结合传统滤波及深度学习的方案取得最佳成绩.本文是第二名北京邮电大学代表团队的 ...

  2. 基于yolov5框架实现人流统计(目标检测算法、目标追踪算法以及越界识别功能)+手机获取统计人数

    主要实现的AI算法有:目标检测.目标追踪 主要实现AI算法功能:越界识别功能(主要是获取统计人流量) 平台:基于Aidlux平台 基础库安装: (1)lap安装: 先sudo apt-get upda ...

  3. 单目标追踪——【相关滤波】C-COT原理与ECO基于C-COT的改进

    目录 C-COT:Continuous Convolution Operator Tracker 文章侧重点 连续卷积算子 目标追踪框架 初始化过滤器: 追踪流程 ECO 文章侧重点 因式卷积因子 生 ...

  4. 据我所知,这是第一个完整实现运动分割、动态目标追踪等的「开源」动态SLAM系统!...

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 今天给大家分享一篇最新文章,VDO-SLAM :一种动态目标感知的视觉SLAM系统,原文名称 VDO- ...

  5. ByteTrack多目标追踪论文阅读

    paper:ByteTrack: Multi-Object Tracking by Associating Every Detection Box code:ByteTrack 一.摘要 多目标追踪的 ...

  6. PTAV:实时高精度目标追踪框架 | ICCV 2017论文解读

    在碎片化阅读充斥眼球的时代,越来越少的人会去关注每篇论文背后的探索和思考. 在这个栏目里,你会快速 get 每篇精选论文的亮点和痛点,时刻紧跟 AI 前沿成果. 点击本文底部的「阅读原文」即刻加入社区 ...

  7. 智慧交通day02-车流量检测实现02:多目标追踪

    1.多目标跟踪分类 多目标跟踪,即MOT(Multi-Object Tracking),也就是在一段视频中同时跟踪多个目标.MOT主要应用在安防监控和自动驾驶等领域中. 1.1 初始化方法 多目标跟踪 ...

  8. ECCV 2020 GigaVision挑战赛“行人和车辆检测”和“多目标追踪”冠军方案解读

    本文转载自DeepBlue深兰科技. 日前,全球计算机视觉顶会ECCV 2020落下帷幕,各项挑战赛的结果也尘埃落定.深兰科技DeepBlueAI 团队包揽了首届GigaVision挑战赛" ...

  9. 首次!阿里达摩院将Pure Transformer 应用于目标重识别ReID!

    点上方计算机视觉联盟获取更多干货 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:Sophia 知乎 https://zhuanlan.zhihu.com/p/401450756 AI博士笔记 ...

最新文章

  1. latex 公式不居中_LaTex小技巧,祝你论文一臂之力!
  2. 在内网中使用maven_maven构建docker镜像三部曲之三:推送到远程仓库(内网和阿里云)-Go语言中文社区...
  3. linux rpm找不到命令_Linux安装软件
  4. python中json dumps_python中json.loads,dumps,jsonify使用
  5. jsp实现日历(二)
  6. 笔记68 Redis数据库
  7. java定时任务,每天定时执行任务
  8. matlab 0-100随机数,添加到100的随机数:matlab
  9. 工业控制系统ICS网络安全简析
  10. git更新上一次提交代码的备注信息
  11. 员工的12个需求及实现
  12. 【翻译】什么是最重要的机器学习技术?
  13. 虚拟化管理软件比较(Eucalyptus, OpenNebula, OpenStack, OpenQRM, XenServer, Oracle VM, CloudStack, ConVirt)
  14. 基于张正友标定法的工业机器人视觉标定
  15. ubuntu清理vscode缓存
  16. 当代大学生结课后的一周
  17. Building Maintainable Software-java篇之Separate Concerns in Modules
  18. 计算机可以计算出十的一百次方吗,世界上最大的数字单位 古戈尔(1古戈尔等于10的100次方)...
  19. 贪心算法-活动安排问题
  20. 一个小程序员年薪五万的悲哀生活和他的理财梦

热门文章

  1. 基于51单片机的智能蓝牙路灯街灯控制系统proteus仿真原理图PCB
  2. matlab输出曲线颜色设置,matlab曲线颜色样式设置
  3. 蓝桥杯2013-2016真题
  4. python毕设代做_怎么用python做毕设?
  5. spi通信问题-有波形但无法获取正确数据:MOSI和SCK
  6. HBase的java代码开发(完整源码)
  7. 8305天距离梦想还有8,352 千米 2012-03-31 23:18:53 柏林勃兰登堡门 再过两天就是我22周岁生日了,我在生命网站上摁下自己的出生年月,上面显示我已经度过了8305天,走
  8. unbutu服务器误删文件,Ubuntu误删系统文件修复办法
  9. 计算机基础-数据存储
  10. 《Adobe Illustrator CS6中文版经典教程(彩色版)》目录—导读