作者:Deval Shah  编译:ronghuaiyang

导读

对监控领域的目标跟踪方法以及面临的挑战进行了一个介绍,是一个很好的了解目标跟踪领域的“是什么”和“为什么”问题的文章。

在我们深入到目标跟踪的世界之前,我们必须理解监控世界的“为什么”和“是什么”。全球各国都安装了数百万个摄像头,但几乎没有人监控它们。人与摄像机的比例很小。

由于深度学习技术在监控领域的广泛应用,智能软件在过去十年中接管了监控领域。复杂的问题,如人员跟踪,交通密度估计,盗窃保护等,已经被世界各地的杰出研究人员解决了,并显示了巨大的前景。

本文将向你介绍智能监控中最重要的主题之一 —— 目标跟踪。

介绍

目标跟踪是指根据之前的信息估计场景中目标物体的状态。

在high level的抽象中,主要有两个层次的物体跟踪。

  • 单目标跟踪(SOT)

  • 多目标跟踪(MOT)

目标跟踪不局限于二维序列数据,可以应用于三维领域。

在本文中,我们将深入研究目标跟踪范式的一个子领域,即使用深度学习的二维视频序列中的多目标跟踪(MOT)。

深度神经网络(DNN)的强大之处在于它们能够学习丰富的表示,并从输入中提取复杂和抽象的特征。

多目标跟踪(MOT),也称为多目标跟踪(MTT),是一种计算机视觉任务,旨在分析视频,以识别和跟踪属于一个或多个类别的对象,如行人,汽车,动物和无生命的物体,没有任何先验的目标外观和目标数量。

在单目标跟踪中,目标的出现是预先知道的,而在多目标跟踪中,需要一个检测步骤来识别出进入或离开场景的目标。同时跟踪多个目标的主要困难来自于各种各样的遮挡以及物体之间的相互重叠,有时物体间也会有相似的外观。因此,仅仅使用SOT模型直接解决MOT问题,往往会导致较差的结果,往往会导致目标漂移和大量的ID切换错误,因为此类模型往往难以区分外观相似的类内物体。

近年来,由于深度学习方法的研究呈指数级增长,检测和跟踪方法在准确性和性能方面取得了巨大的进步。

大多数先进的跟踪方法遵循“检测跟踪”的方案,他们首先在场景中找到对象,然后找到对象对应的tracklets(它在下一帧的位置)。

如今,这种探测器的性能异常出色,能够适应不同的场景。因此,它定义了跟踪算法的标准输入。

还有其他的方法,比如Lucas Kanade的光流,基于排序的跟踪等,它们在传统的计算机视觉方法的基础上表现也都很出色。

挑战

在解决目标跟踪问题时,会出现一些问题,这些问题会导致糟糕的结果。多年来,算法试图解决这些问题,但到目前为止,我们还没有找到一个被充分证明的解决办法,这仍然是一个开放的研究领域。

  • 由于几何变化导致的多样性,如:姿态,关节,物体的尺度

  • 由于光学因素的差异。例如:照明、外观

  • 非线性运动

  • 有限的分辨率,如从低端手机采集的视频

  • 场景中有相似的物体,例如:相同颜色的衣服,配饰等

  • 高度拥挤的场景,如街道,音乐会,体育馆,市场。

  • 跟踪起始和终止。在开始任何跟踪算法之前,你需要想要跟踪的物体的先验信息。但是并不是一定可以使用目标对象初始化算法。

  • 跟踪轨迹可能由于运动的突然变化导致合并和切换,比如相机成像质量的急剧变化等。

  • 由于相似的特征,如相似的衣服,面部结构,眼镜,肤色,身高等,目标物体的ID可能被切换。

  • 目标模型更新错误导致漂移。一次错误的更新可能会导致在错误的方向上持续的更新,从而在整个视频中遗忘掉正确的目标。

综述文章

现在你已经了解了这个问题的广泛性,让我们深入研究对象跟踪领域中一些最令人兴奋的研究工作。

在目标跟踪领域领先的研究方法的筛选标准是基于5 关键指标

  • 主要会议(如:CVPR, NeurIPS, ICCV, ICML, ECCV等)

  • 基准测试结果(例如,MOT, Kitti, VOT, CVPR19挑战)

  • 支持论文结果的公开代码(由作者/第三方提供)。

  • 引用

  • 新的想法

有太多令人兴奋的研究工作。但是,如果作者不能提供代码(可能是由于一些原因)来重现论文中的结果,那么我们不得不对文档中提到的结果持保留态度。

我们已经提到了与2D MOT相关的论文,但有些想法也可以外推到3D版本。

一些有意思的研究文章分享

这些只是精心挑选出来的一些非常好的跟踪领域的研究论文:

1、Tracking without bells and whistles.

论文:https://arxiv.org/pdf/1903.05625.pdf

代码:https://github.com/phil-bergmann/tracking_wo_bnw

2、Extending IOU Based Multi-Object Tracking by Visual Information.

论文:http://elvera.nue.tu-berlin.de/files/1547Bochinski2018.pdf

代码:https://github.com/bochinski/iou-tracker

3、Tracking Objects as Points.

论文:https://arxiv.org/pdf/2004.01177.pdf

代码:https://github.com/xingyizhou/CenterTrack

4、Fast Visual Object Tracking with Rotated Bounding Boxes

论文:https://arxiv.org/pdf/1907.03892v5.pdf

代码:https://github.com/baoxinchen/siammask_e

5、ODESA: Object Descriptor that is Smooth Appearance-wise for object tracking tasks

还没release,CVPR MOT 2019冠军。

6、Online Multiple Pedestrian Tracking using Deep Temporal Appearance Matching Association.

论文:https://arxiv.org/pdf/1907.00831.pdf

代码:暂无

—END—

英文原文:https://medium.com/visionwizard/object-tracking-675d7a33e687

往期精彩回顾适合初学者入门人工智能的路线及资料下载机器学习及深度学习笔记等资料打印机器学习在线手册深度学习笔记专辑《统计学习方法》的代码复现专辑
AI基础下载机器学习的数学基础专辑

获取一折本站知识星球优惠券,复制链接直接打开:

https://t.zsxq.com/y7uvZF6

本站qq群704220115。

加入微信群请扫码:

【CV】多目标跟踪:监控领域你必须要了解的算法相关推荐

  1. 多目标跟踪:监控领域你必须要了解的算法

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者:Deval Shah 编译:ronghuaiyang 导读 对监控领域的目标跟踪方法以及面临的挑 ...

  2. 计算机视觉(ComputerVision, CV)相关领域的网站链接

    http://blog.sina.com.cn/s/blog_6bfa03cf0101hqy2.html  转载于 以下链接是转载的关于计算机视觉(ComputerVision, CV)相关领域的网站 ...

  3. 全领域涨点 | Evolving Attention在CV与NLP领域全面涨点

    本文提出了一种新型通用的注意力机制Evolving Attention来提高Transformer的性能.针对多种任务,其中包括图像分类.自然语言理解和机器翻译,本文所提出的Evolving Atte ...

  4. TDengine 在IT运维监控领域的应用

    目录 前言 一.TD 特点 二.安装部署 2.1 部署 2.2 验证 三.应用领域 3.1 运维监控 3.2 远端扩展 总结 前言 TDengine 由北京涛思数据科技有限公司(TAOS Data)自 ...

  5. CV:阿里在CV数据增强领域带来SOTA新范式(已被NeurIPS2022接收)—基于离散化对抗训练的鲁棒视觉新基准!

    CV:阿里在CV数据增强领域带来SOTA新范式(已被NeurIPS2022接收)-基于离散化对抗训练的鲁棒视觉新基准! 导读:本文中,来自阿里巴巴AAIG的研究团队在模型鲁棒性问题上进行了研究,包括对 ...

  6. FP-Growth关联分析算法在网络监控领域的应用

    关联分析算法在网络监控领域的应用: 在现今网络规模大,涉及专业多,告警总数大的现在,迫切需要提高对海量告警的分析能力,实现对告警数据的挖掘,提高对有价值告警的提取,简化监控人员的工作,提高排障效率.常 ...

  7. Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)

    Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新) 目录 CV常用数据集平台集合 Mendeley Data ...

  8. SVAC编解码标准对传统视频监控领域的革新应用

    从模拟监控转化到数字监控之后,视音频编码技术网络实时不间断的24小时传输.对录像的真实性还原成为行业绕不开的话题.但以之前的技术来讲,并没有针对视频监控做独特的视音频标准,直到在2010年,公安部牵头 ...

  9. Interview之CV:人工智能领域求职岗位—计算机视觉算法工程师的职位简介、薪资介绍、知识结构之详细攻略

    Interview之CV:人工智能领域求职岗位-计算机视觉算法工程师的职位简介.薪资介绍.知识结构之详细攻略 目录 计算机视觉算法工程师的职位简介 资讯指数 1.各大互联网巨头的薪资介绍 2.各大公司 ...

最新文章

  1. Linux jdk配置/下载/安装简单说明
  2. VS.Net 的一些小技巧
  3. JAVA语言中的反射机制
  4. COBOL 学习笔记 之 入門篇(续集)
  5. 怎么break java8 stream的foreach
  6. fold函数_Java中使用Map and Fold进行函数式编程
  7. 每天工作16个小时,如果辞职,会不会显得自己没责任心呢?
  8. 《网管员必读》系列丛书试读连载
  9. hdu 4619 Warm up 2(并查集)
  10. html4与html5的区别
  11. python实现两个任意字符串乘积
  12. 图形学笔记1.直线扫描转换与devC的图形库ege扩展
  13. 按键精灵打怪学习-多窗口多线程后台技能
  14. 7-11 秋天的第一杯奶茶 (20 分)
  15. ecshop模板支持html,免费ecshop响应式设计手机wap自适应dossy整站模板
  16. 仪器计量校准机构的CNAS和CMA有哪些区别?分别具有什么作用?
  17. 干草堆(寒假每日一题 2)
  18. Android:音乐播放器(3)—从播放列表到播放歌曲
  19. 6.26CF模拟赛D:黑白条题题解
  20. arduino智能跟随小车

热门文章

  1. VS2008文件操作出现问题
  2. 面试lua笔试题各种坑
  3. pycharm pull到github
  4. Mac下Ruby升级与Rails的安装
  5. js方法的声明与调用
  6. CSDN总结的面试中的十大算法
  7. poj 2948 Martian Mining (dp)
  8. 服务器事件刷新消息,Windows Server 2003 中的 DNS 事件消息 1616 到 6702
  9. C语言程序的基本结构
  10. 机器人学习--定位、建图、SLAM(声呐、激光等扫描束方案)的发展史