点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者:Deval Shah

编译:ronghuaiyang

导读

对监控领域的目标跟踪方法以及面临的挑战进行了一个介绍,是一个很好的了解目标跟踪领域的“是什么”和“为什么”问题的文章。

在我们深入到目标跟踪的世界之前,我们必须理解监控世界的“为什么”和“是什么”。全球各国都安装了数百万个摄像头,但几乎没有人监控它们。人与摄像机的比例很小。

由于深度学习技术在监控领域的广泛应用,智能软件在过去十年中接管了监控领域。复杂的问题,如人员跟踪,交通密度估计,盗窃保护等,已经被世界各地的杰出研究人员解决了,并显示了巨大的前景。

本文将向你介绍智能监控中最重要的主题之一 —— 目标跟踪。

介绍

目标跟踪是指根据之前的信息估计场景中目标物体的状态。

在high level的抽象中,主要有两个层次的物体跟踪。

  • 单目标跟踪(SOT)

  • 多目标跟踪(MOT)

目标跟踪不局限于二维序列数据,可以应用于三维领域。

在本文中,我们将深入研究目标跟踪范式的一个子领域,即使用深度学习的二维视频序列中的多目标跟踪(MOT)。

深度神经网络(DNN)的强大之处在于它们能够学习丰富的表示,并从输入中提取复杂和抽象的特征。

多目标跟踪(MOT),也称为多目标跟踪(MTT),是一种计算机视觉任务,旨在分析视频,以识别和跟踪属于一个或多个类别的对象,如行人,汽车,动物和无生命的物体,没有任何先验的目标外观和目标数量。

在单目标跟踪中,目标的出现是预先知道的,而在多目标跟踪中,需要一个检测步骤来识别出进入或离开场景的目标。同时跟踪多个目标的主要困难来自于各种各样的遮挡以及物体之间的相互重叠,有时物体间也会有相似的外观。因此,仅仅使用SOT模型直接解决MOT问题,往往会导致较差的结果,往往会导致目标漂移和大量的ID切换错误,因为此类模型往往难以区分外观相似的类内物体。

近年来,由于深度学习方法的研究呈指数级增长,检测和跟踪方法在准确性和性能方面取得了巨大的进步。

大多数先进的跟踪方法遵循“检测跟踪”的方案,他们首先在场景中找到对象,然后找到对象对应的tracklets(它在下一帧的位置)。

如今,这种探测器的性能异常出色,能够适应不同的场景。因此,它定义了跟踪算法的标准输入。

还有其他的方法,比如Lucas Kanade的光流,基于排序的跟踪等,它们在传统的计算机视觉方法的基础上表现也都很出色。

挑战

在解决目标跟踪问题时,会出现一些问题,这些问题会导致糟糕的结果。多年来,算法试图解决这些问题,但到目前为止,我们还没有找到一个被充分证明的解决办法,这仍然是一个开放的研究领域。

  • 由于几何变化导致的多样性,如:姿态,关节,物体的尺度

  • 由于光学因素的差异。例如:照明、外观

  • 非线性运动

  • 有限的分辨率,如从低端手机采集的视频

  • 场景中有相似的物体,例如:相同颜色的衣服,配饰等

  • 高度拥挤的场景,如街道,音乐会,体育馆,市场。

  • 跟踪起始和终止。在开始任何跟踪算法之前,你需要想要跟踪的物体的先验信息。但是并不是一定可以使用目标对象初始化算法。

  • 跟踪轨迹可能由于运动的突然变化导致合并和切换,比如相机成像质量的急剧变化等。

  • 由于相似的特征,如相似的衣服,面部结构,眼镜,肤色,身高等,目标物体的ID可能被切换。

  • 目标模型更新错误导致漂移。一次错误的更新可能会导致在错误的方向上持续的更新,从而在整个视频中遗忘掉正确的目标。

综述文章

现在你已经了解了这个问题的广泛性,让我们深入研究对象跟踪领域中一些最令人兴奋的研究工作。

在目标跟踪领域领先的研究方法的筛选标准是基于5 关键指标

  • 主要会议(如:CVPR, NeurIPS, ICCV, ICML, ECCV等)

  • 基准测试结果(例如,MOT, Kitti, VOT, CVPR19挑战)

  • 支持论文结果的公开代码(由作者/第三方提供)。

  • 引用

  • 新的想法

有太多令人兴奋的研究工作。但是,如果作者不能提供代码(可能是由于一些原因)来重现论文中的结果,那么我们不得不对文档中提到的结果持保留态度。

我们已经提到了与2D MOT相关的论文,但有些想法也可以外推到3D版本。

一些有意思的研究文章分享

这些只是精心挑选出来的一些非常好的跟踪领域的研究论文:

1、Tracking without bells and whistles.

论文:https://arxiv.org/pdf/1903.05625.pdf

代码:https://github.com/phil-bergmann/tracking_wo_bnw

2、Extending IOU Based Multi-Object Tracking by Visual Information.

论文:http://elvera.nue.tu-berlin.de/files/1547Bochinski2018.pdf

代码:https://github.com/bochinski/iou-tracker

3、Tracking Objects as Points.

论文:https://arxiv.org/pdf/2004.01177.pdf

代码:https://github.com/xingyizhou/CenterTrack

4、Fast Visual Object Tracking with Rotated Bounding Boxes

论文:https://arxiv.org/pdf/1907.03892v5.pdf

代码:https://github.com/baoxinchen/siammask_e

5、ODESA: Object Descriptor that is Smooth Appearance-wise for object tracking tasks

还没release,CVPR MOT 2019冠军。

6、Online Multiple Pedestrian Tracking using Deep Temporal Appearance Matching Association.

论文:https://arxiv.org/pdf/1907.00831.pdf

代码:暂无

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

多目标跟踪:监控领域你必须要了解的算法相关推荐

  1. 【CV】多目标跟踪:监控领域你必须要了解的算法

    作者:Deval Shah  编译:ronghuaiyang 导读 对监控领域的目标跟踪方法以及面临的挑战进行了一个介绍,是一个很好的了解目标跟踪领域的"是什么"和"为什 ...

  2. TDengine 在IT运维监控领域的应用

    目录 前言 一.TD 特点 二.安装部署 2.1 部署 2.2 验证 三.应用领域 3.1 运维监控 3.2 远端扩展 总结 前言 TDengine 由北京涛思数据科技有限公司(TAOS Data)自 ...

  3. FP-Growth关联分析算法在网络监控领域的应用

    关联分析算法在网络监控领域的应用: 在现今网络规模大,涉及专业多,告警总数大的现在,迫切需要提高对海量告警的分析能力,实现对告警数据的挖掘,提高对有价值告警的提取,简化监控人员的工作,提高排障效率.常 ...

  4. SVAC编解码标准对传统视频监控领域的革新应用

    从模拟监控转化到数字监控之后,视音频编码技术网络实时不间断的24小时传输.对录像的真实性还原成为行业绕不开的话题.但以之前的技术来讲,并没有针对视频监控做独特的视音频标准,直到在2010年,公安部牵头 ...

  5. 横河电机战略入股芬兰公司Sensire Ltd.以寻求在冷链监控领域的合作

    东京--(美国商业资讯)--横河电机株式会社(Yokogawa Electric Corporation, TOKYO:6841)和总部位于芬兰的Sensire 公司宣布,双方已达成协议,由横河电机投 ...

  6. 视频监控领域 挑战与机遇并存

      全球数字化大潮袭来,计算机网络技术迅猛发展并广泛渗透,传统视频监控系统已经清晰的表现出以DVR数字硬盘录像机为代表的数字视频监控系统向以NVS网络视频服务器.IPCamera网络摄像机以及在07年 ...

  7. 我的监控世界观(3)--监控领域的模型

    根据我对这个领域的理解,监控系统中最重要的三个实体只有: 1) 应用 2) 主机 3) 监控项 ``` 版权声明 本站原创文章 由 萌叔 发表 转载请注明 萌叔 | http://vearne.cc ...

  8. Interview之NLP:人工智能领域求职岗位—自然语言处理NLP算法工程师职位的简介、薪资介绍、知识结构之详细攻略

    Interview之NLP:人工智能领域求职岗位-自然语言处理NLP算法工程师职位的简介.薪资介绍.知识结构之详细攻略 目录 自然语言处理NLP算法工程师的职位简介 1.资讯指数 2.各大公司的具体职 ...

  9. 《Towards Viewpoint Invariant 3D Human Pose Estimation》--深度图领域人体姿态估计的CNN算法

    <Towards Viewpoint Invariant 3D Human Pose Estimation>–深度图领域人体姿态估计的CNN算法 这篇文章是ECCV 2016的一篇3D人体 ...

最新文章

  1. RedHat8 配置本地yum源
  2. 移动硬盘插入提示格式化
  3. 计算机操作系统32跟64区别是什么,32位和64位计算机操作系统之间的区别32位和64位win7系统之间的区别...
  4. AI商业产品经理:我眼中的AI简史
  5. python一键清屏_python添加清屏功能
  6. JFinalOA导出Excel
  7. python比java慢_对于这种算法,Python与Java相比非常慢
  8. C# WPF ListView Bindding 图片
  9. rar压缩文件密码破解
  10. 信托公司消金小额贷款项目的现金流预测
  11. typedef和define
  12. 【PS填充背景色和前景色】
  13. Java-KoTime:接口耗时监测与邮件通知接口耗时情况
  14. 工资高的互联网工作者都在干什么
  15. 读《洞穴奇案》——从虐猫到禁食狗肉,自然法真的存在吗?
  16. 如何为firefox安装视频播放器
  17. 使用lua配置neovim所需的一切
  18. 光敏电阻5506主要参数_常用光敏电阻的规格参数
  19. 桌面计算机里没有桌面显示不出来怎么办,电脑桌面图标不显示怎么设置|恢复电脑桌面图标的方法...
  20. IOS中通过快捷捷径打开场所码或者健康码

热门文章

  1. 如何区别一幅图像是否是黑白图像
  2. 界面代码ios不响应presentModalViewController界面的处理
  3. 彻底解决SQL SERVER 2008无法远程连接的问题
  4. ASA防火墙透明模式ACL总结
  5. 思科三层交换配置清单与案例
  6. 社会内卷的真正原因?华为内部论坛的这篇雄文火了
  7. 某程序员遭遇奇葩事:辞退自己的leader竟然命令自己回前公司,给前同事讲代码!...
  8. 面试现场:小伙伴美团一面的分享和分析「含解答」
  9. 应对618,京东到家订单系统高可用架构的迭代实战
  10. BAT都在悄悄“拆”中台,“碎片化中台” 时代已来!