Jarry的目标跟踪学习笔记一

目标跟踪是计算机视觉中的一个重要方向,已经由来已久,并且有着广泛的应用,如:视频监控,人机交互, 无人驾驶等。在我的想象中,自己研究的内容就是,将来钢铁侠头盔里追踪敌人的那个程序。不过随着查阅资料,了解到再多一些之后,越发感觉这个领域其实很大很宽,举步维艰,勉励自己一点点地从基础的算法,一步一步地了解,打实基础之后,希望能对现在性能比较优秀的深度学习算法有所领悟。

刚开始看的是一篇综述,来自一篇发表在ICCV上的

Y.
Wu, J. Lim, and M.-H. Yang. Online object tracking: A benchmark. In CVPR, 2013.
(AUC)

这篇论文介绍了目标跟踪的历史面临的问题和发展前景等,当时看得不大懂,所以决定从很久之前的经典算法开始入手,这时就有人推荐了吴毅老师的论文,于是我也去阅读了一下:

Wu Y, Lim J, Yang M H. Online object tracking: A benchmark
[C]// CVPR, 2013.

文章涉及的2012年之前的跟踪方法有很多,提炼了一些比较经典常用于做比较地方法,首先2012年以前的算法没有通用公认的数据集,在这论文里按照目标跟踪常出现的难点进行了分类(比如光照变化,尺度变化,运动模糊等),并且收集了2012年之前的开源的代码进行了实验,对比得出了几个比较优秀的算法,并且给出了将来发展的趋势。

我希望对比较优秀的跟踪算法从原理和代码上进行了解,这样肯定对以后深入学习有辅助。Struck跟踪算法:Structed
Output Tracking with Kernels   (ICCV /2011年)

SCM跟踪算法:W. Zhong, H. Lu, and M.-H. Yang. Robust Object Tracking via
Sparsity-based Collaborative Model. In CVPR, 2012. )

TLD:TLD目标跟踪算法是Tracking learning Detection算法的简称。这个视频跟踪算法框架由英国萨里大学的一个捷克籍博士生Zdenek
Kalal提出。TLD将传统的视频跟踪算法的跟踪模块(Tracker)与检测模块(Detector)结合起来,同时加入了学习(Learning)的过程,使得跟踪的效果更佳稳定、可靠。

LSK:B. Liu, J. Huang, L. Yang, and C. Kulikowsk. Robust Tracking
using Local Sparse Appearance Model and K-Selection. In CVPR, 2011.

ASLA:X. Jia, H. Lu, and M.-H. Yang. Visual
Tracking via Adaptive Structural Local Sparse Appearance Model. In CVPR, 2012.

突然发现了有大佬总结的算法论文整合:

https://blog.csdn.net/qq_29540745/article/details/79120004

不过我真是对用大写字母组合简称作为算法代表的方式有些不适,而且目标跟踪的算法也太多了,就很手忙脚乱。

由这篇文章引出的就是常用数据库:

经常说的两个数据库分别是OTB和VOT,OTB50和OTB100来自吴毅老师建立的数据库(50和100分别代表包含的视频数量);VOT(visual object tracking)是一个每年举办的比赛。http://cvlab.hanyang.ac.kr/tracker_benchmark/index.html

和http://www.votchallenge.net/

现在使用的基本上是OTB100和VOT2016,数据库已经下载好了。

OTB的数据库里格式都是一系列的照片,人工标注的点,比较容易使用。

VOT里数据格式也是一样的,感觉VOT的数据集比较全并且代表性比较好,自己感觉。

接下来从2012年之后的算法,相关滤波,深度学习。目前了解到的是,一些算法都是基于相关滤波算法(Correlation
Filters)的改进,比较优秀的算法有:

KCF:Kernelized Correlation Filters 核相关滤波

SAMF:基于KCF,特征是HOG+CN,多尺度方法是平移滤波器在多尺度缩放的图像块上进行目标检测,取响应最大的那个平移位置及所在尺度:

Li Y, Zhu J. A scale adaptive kernel
correlation filter tracker with feature integration [C]// ECCV, 2014.

DSST:KCF算法改进效果比较好的一个算法,尺度自适应。

Danelljan M, Häger G, Khan F, et al. Accurate scale estimation
for robust visual tracking [C]// BMVC, 2014.

假期前研究的就是这篇论文,评价很高,因为到2014年,目标跟踪领域还没有大量使用深度学习的时候,DSST这个相关滤波算法的变化版取得了非常不错的成绩。

我的解析附在另一页:

https://blog.csdn.net/qq_40972038/article/details/88090006

Danelljan M大佬的主页:

http://www.cvl.isy.liu.se/research/objrec/visualtracking/

最近几天,看的是mean shift算法,从一篇老论文里找到了可运行出的代码,正在学习。

到此,目前了解过的目标跟踪的算法,接下来一个阶段会学习那些经典算法:均值漂移,粒子滤波和kalman滤波,把他们实现并且完全理解。鉴于matlab和C++对于目标跟踪算法地重要性,这学期也要复习和强化两门语言地使用。第二学期,心态悄然地发生着改变,感觉这个领域真的是很大了,想学地很多,每天地时间有限,虽然这学期来了因为紧迫感,效率是高了一些,不过还是有种,老师说让我移山,我一看,哇喜马拉雅山,再一看手里的工具,10快包邮的儿童铲,无力感,希望自己多努力吧。

Jarry的目标跟踪学习笔记一相关推荐

  1. 相关滤波目标跟踪学习笔记(三)——KCF算法公式理解

    KCF算法特点: 1.通过循环移位产生了大量的虚拟样本: 2.利用循环矩阵可以在傅里叶域对角化的性质,大大减少了运算量,提高了运算速度: 3.核函数的运用,提高了分类器的性能: 4.采用HOG特征,相 ...

  2. OpenCV 3 Tracking API目标跟踪学习笔记——定义、物体跟踪常用算法、demo

    今天开始接触目标跟踪 本文翻译自https://www.learnopencv.com/object-tracking-using-opencv-cpp-python/#opencv-tracking ...

  3. 目标跟踪学习笔记_2(particle filter初探1)

    首先提供几篇关于粒子滤波算法的博客: http://www.cnblogs.com/yangyangcv/archive/2010/05/23/1742263.html 这篇博客比较通俗易懂,简单的介 ...

  4. 目标跟踪学习笔记_1(opencv中meanshift和camshift例子的应用)

    在这一节中,主要讲目标跟踪的一个重要的算法Camshift,因为它是连续自使用的meanShift,所以这2个函数opencv中都有,且都很重要.为了让大家先达到一个感性认识.这节主要是看懂和运行op ...

  5. vot 单目标跟踪学习笔记

    目录 MixFormer TCTrack 视频测试代码: 图片测试代码: 摄像头测试代码: MixFormer

  6. opencv动态目标跟踪学习总结

    用opencv实现对视频中动态目标的追踪 第一步,是要建立一个编程环境,然后加载opencv的库路径等等.具体步骤在 http://www.opencv.org.cn/ 的"安装" ...

  7. 单目标跟踪——个人笔记

    单目标跟踪--个人笔记 以<Handcrafted and Deep Trackers: A Review of Recent ObjectTracking Approaches>为主线看 ...

  8. 《南溪的目标检测学习笔记》——模型预处理的学习笔记

    1 介绍 在目标检测任务中,模型预处理分为两个步骤: 图像预处理:基于图像处理算法 数值预处理:基于机器学习理论 关于图像预处理,请参考<南溪的目标检测学习笔记>--图像预处理的学习笔记 ...

  9. 《南溪的目标检测学习笔记》——COCO数据集的学习笔记

    1 COCO数据集 COCO数据集下载链接:COCO_download 1.1 数据概览 数据集大小 train: 118287张 train+val: 123287张 val: 5000张 目标数量 ...

最新文章

  1. 苹果史上最强芯片竟然是个“组装货”!iPhone SE涨价,13系列是真绿了
  2. Gitlab 生成 swagger 文档
  3. VTK:模型之MarchingSquares
  4. CSS3笔记之基础篇(一)边框
  5. iOS APP 安全测试
  6. Android Glide图片加载框架(三)缓存机制
  7. asp 不能读取mysql 长文本文件,从文本文件中读取信息并存储入数据库_asp技巧
  8. NASM汇编语言与计算机系统09-8086实模式的内存分配图
  9. linux切换英文界面,linux英文界面下使用中文输入法
  10. c语言printf()输出格式大全(转载)
  11. win7怎么把计算机放到桌面6,手机投屏到电脑win7最简单具体操作步骤
  12. AI Studio 精品项目 | 基于Few-shot Learning实现中文科学文献学科分类
  13. STM32CubeMX安装问题【尤其是Java环境没安装好的情况】
  14. GIF动图拆分为多个静态图片
  15. mars3d学习-方量分析
  16. 看这些MySQL的重要知识点,吃透它
  17. PE工具制作/装机U盘制作
  18. 动态下载苹果提供的多种中文字体
  19. 2018-7-27银行卡bin大全-根据银行卡开头查银行
  20. 2022-2027年中国互联网+长租公寓市场规模预测及投资战略咨询报告

热门文章

  1. IPDK — Overview
  2. 围棋人机大战:为什么AlphaGo不首先挑战中国棋手?(无责任猜测,不幸猜中不胜荣幸)
  3. 谷歌AdMob广告接入(横幅广告)
  4. 安卓dj专业打碟机软件_用手机打碟的DJ趴是什么水平?
  5. 【PDF文档压缩】文档压缩,保留文字信息,压缩页码与文件大小
  6. 虫虫英文资源抓取规则分享
  7. Ceph分布式集群安装配置
  8. 显式预测控制(Explicit MPC)
  9. 【电脑主板维修培训】
  10. vue js数字转换成汉字展示