目标检测和跟踪的区别在于对于运动中变化目标的跟踪能力。设想这样一个场景:孙悟空在飞行过程中完成了一次变化(这里假设他变成了一只鸟),但这个变化并不是像西游记拍摄中有烟雾特效完成的,而就是通过身体结构发生渐变来完成的,这种情况下,检测器应该会在后续的检测任务中失败,因为设计好的检测器只是为了检测目标孙悟空的存在,孙悟空变身之后已经不存在这个目标,检测器是不会有火眼金睛继续检测到变化后的孙悟空的。

但是,对于跟踪器就不一样了,跟踪目标,哪怕目标在跟踪过程中发生了巨大变化,这些都是跟踪器的本质能力。理想的跟踪器应该可以很好的跟上孙悟空渐变的整个过程,并且可以继续后面变身之后对鸟的跟踪。

现在所谓的目标跟踪方法都是基于检测的(tracking by detection)
在很多人们设计的跟踪器的跟踪过程中,当目标出现遮挡或者运动出视野等情况时,直接使用检测器来对目标的位置进行重新检测。
试想,如果目标在很长一段时间内一直出现被遮挡的状况,那么这一段时间内将会一直都是检测器在工作。
理想的跟踪器应该不需要每一帧都暴力检测目标所在的位置,而是可以充分利用帧间信息,目标周围的环境信息,甚至根据周边环境推测得到的三维信息等,更加高效的确定目标所在的位置。
理想的跟踪器应该可以对视频中的目标运动,周边环境有着更好的理解,这个理解不一定是和我们理解一致的语义理解,而是有助于跟踪任务的相关理解。

目标检测和跟踪的区别还应在于对于相同目标不同实例的跟踪能力。设想一个目标检测器,其被设计用来检测行人,如果将其应用到马路场景上,检测器将会检测到马路上的大量行人,但如何让他只检测一个人呢?这好像是不可能的,因为其任务已经被设计为检测行人,其检测结果并不违背其设计初衷,而结果却并不是人们想要的。但这时跟踪器就完全不一样了,跟踪器可以初始化为跟踪行人,但在给跟踪器指定初始跟踪行人后,它将可以在后续的过程中只跟踪指定的行人,做到“弱水三千,而我只取一瓢饮”。

比如在球场上我只想关注某一个球员、某几个球员的表现或是篮球的位置。

目标跟踪更多考虑的是对目标的表达,跟踪过程中对目标表示的更新,跟踪中对周围环境变化信息、对时空信息的利用等等。正因如此,跟踪任务才即可被看作是生成式任务,也可以被看作为判别式任务,既可以通过深度学习的方法来暴力解决,也可以通过传统统计学、机器学习的方法来解决优化。但无论哪种解决方案,现在都没有在跟踪任务上取得突破性的成功。但这也恰恰使得跟踪这一视觉任务成为测试众多技术的理想平台。

目标检测偏向于单帧下的物体定位识别,目标跟踪多帧之间的物体会有关联,重在跟踪和重识别,现在的跟踪算法有很大一部分是基于检测和滤波,目标检测会应用到目标跟踪中。

假设视频中有两辆车,实时目标检测可以检测到有两辆车,而目标跟踪需要区分出这辆车是这辆车,另一辆车是另一辆车(re-ID的目的也是完成类似的工作)。

简单来说:跟踪会比检测复杂一些.
检测:目的是找到(或者静态或者动态);
跟踪:目的是定位(动态)
二者的联系是:
(1) 跟踪是基于检测的,必须先定位目标,才能后续跟踪.
(2) 如果将动态的检测(例如视频序列检测)分割成一定时间段内的静态检测(每一帧),那么用检测是可以实现类似跟踪的效果(伪跟踪,因为其实还是每一帧做检测).

1.目标检测就是检测出一个图片或者一个视频中目标的位置(静态或者动态)如yolo检测目标

2.目标追踪是给视频中第一帧目标以及它的位置,然后跟踪这个目标,以及预测它的轨迹,(如果出现一些遮挡,也可以根据轨迹来跟踪这个目标,假如是yolo检测出的目标,有时候还会出现丢帧的情况,如果用了跟踪算法,那么即使丢帧了,也可以跟住目标而不丢失,而且如果使用yolo,虽然给定了目标的位置,但是如果同一类的目标的话,你知道很多的目标的坐标,但是很难求出它们的轨迹。

检测一般用到单帧的信息,主要是依据先验知识、或者显著等特性找到某些感兴趣的区域;
而跟踪是已有目标的位置,在后续帧中找到最佳匹配位置,更侧重目标的匹配上;
其实现在很多的跟踪算法是基于检测的,使得他们间联系更密切。

此外,当前目标跟踪领域也存在一些问题亟待解决:

部分表述及图示来源于知乎专栏--

文中部分观点及说法有混淆和不清晰之处,欢迎指正~

https://zhuanlan.zhihu.com/p/32826719

https://zhuanlan.zhihu.com/p/104228012?utm_source=wechat_session

目标检测与目标跟踪:区别与联系相关推荐

  1. 安卓目标检测,目标跟踪,人流量计数

    先看效果, 推理时间不到30ms. 大多数目标检测,目标追踪网络模型部署在终端,用的Python,CUDA环境,只能参考流程,案例Python环境下实现的人流量计数,代码跑跑,效果如下 根据这个案例, ...

  2. 计算机视觉六大技术:图像分类、目标检测、目标跟踪、语义分割、实例分割、影像重建..

    计算机视觉是使用计算机及相关设备对生物视觉的一种模拟.它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样. 计算机视觉既是工程领域,也是科学 ...

  3. 计算机视频追踪方向,移动目标检测和视频跟踪系统

    摘要:本文详细地探讨了基于视频的移动目标检测和视频跟踪技术,并给出了一个成功的应用实例.文中详细地论述了视频跟踪系统的系统组成,模块结构和视觉计算流程:给出了实现该系统所涉及的关键技术. 关键词:运动 ...

  4. 利用红外-可见光图像数据集OTCBVS打通图像融合、目标检测和目标跟踪

    文章目录 前言 一.任务概述 二.常见红外-可见光图像数据集 2.1 OTCBVS 2.2 TNO image fusion dataset 2.3 INO image fusion dataset ...

  5. DL之MaskR-CNN:基于类MaskR-CNN算法(RetinaNet+mask head)利用数据集(resnet50_coco_v0.2.0.h5)实现目标检测和目标图像分割(语义分割)

    DL之MaskR-CNN:基于类MaskR-CNN算法(RetinaNet+mask head)利用数据集(resnet50_coco_v0.2.0.h5)实现目标检测和目标图像分割(语义分割) 目录 ...

  6. [初窥目标检测]——《目标检测学习笔记(2):浅析Selective Search论文——“Selective Search for object recognition”》

    [初窥目标检测]--<目标检测学习笔记(2):浅析Selective Search论文--Selective Search for object recognition> 本文介绍 前文我 ...

  7. 图像识别中——目标分割、目标识别、目标检测和目标跟踪的区别

    计算机视觉旨在识别和理解图像/视频中的内容,包含四大基本任务:分类(图a).定位.检测(图b).语义分割(图c).和实例分割(图d). 这四个任务需要对图像的理解逐步深入.给定一张输入图像, 图像分类 ...

  8. OpenCV笔记11:利用HSV颜色空间进行目标检测和目标跟踪

    HSV(hue saturation value) 色调(hue):对应于颜色成分(基础色素),因此,只需选择一个色调范围,就可以选择任何颜色.(0-360) 饱和度(saturation):颜色的数 ...

  9. 目标检测到目标跟踪 -- Faster R-CNN 观测器

    https://blog.paperspace.com/ 目标跟踪在在某些程度上可以说是目标检测的一个维度拓展.目标检测类似于贝叶斯 Filtering 和 Smoothing 中的观测器,整个目标跟 ...

最新文章

  1. DocumentsContract cannot be resolved
  2. 云计算里的安全:警惕云服务被恶意利用
  3. Xilinx 在文档中所用的 LC(logic cells) 与 LUT之间的换算关系
  4. pip卸载模块/宏包(python)
  5. 安装zookeeper
  6. crontab 运行pyhon脚本
  7. 前端学习(3223):总结props
  8. 华为荣耀6 H60-L02/L12(联通版)救砖包【适用于无限重启】
  9. gui编程实践(2)--qq聊天界面 JTextArea多行文本框组件
  10. webbrowser 访问iframe拒绝访问_电脑无法删除文件访问被拒绝【解决方案】
  11. API3 创始人更新 3 月开发进展:Airnode 的 pre-alpha 版已通过审计
  12. 安装python、pycharm 和anaconda
  13. lintcode:Add Binary 二进制求和
  14. python解释器安装步骤_怎么安装python解释器
  15. Vue基础知识总结 13:从零开始搭建Vue项目
  16. Visual Studio2019安装vsix扩展文件
  17. U盘不能复制超过4G的文件解决方法
  18. mysql数据库有dbo吗_拒绝了对对象 '表名' (数据库 '数据库名',架构 'dbo')的 SELECT 权限...
  19. 网页制作全套视频教程下载(包括html,ASP,Flash,Photoshop)
  20. java判断是否微信浏览器_Java判断浏览器是微信还是支付宝

热门文章

  1. 树莓派c语言按键开关,树莓派 GPIO按钮开关 原理与实现
  2. python3-网络数据下载
  3. read函数阻塞还是非阻塞
  4. 橘子很甜,月亮很圆 --- 记一次同仁医院半飞秒+角膜交联手术
  5. NILM所用数据的准备
  6. 转转二手手机便捷的交易方式
  7. 语音识别基础(二):语音识别方法
  8. 医疗器械标准修订历史
  9. 搭建IPFS网络私网教程
  10. 大公司工资低,小公司工资高,该咋选择?