Jarry的目标跟踪学习笔记一
Jarry的目标跟踪学习笔记一
目标跟踪是计算机视觉中的一个重要方向,已经由来已久,并且有着广泛的应用,如:视频监控,人机交互, 无人驾驶等。在我的想象中,自己研究的内容就是,将来钢铁侠头盔里追踪敌人的那个程序。不过随着查阅资料,了解到再多一些之后,越发感觉这个领域其实很大很宽,举步维艰,勉励自己一点点地从基础的算法,一步一步地了解,打实基础之后,希望能对现在性能比较优秀的深度学习算法有所领悟。
刚开始看的是一篇综述,来自一篇发表在ICCV上的
Y.
Wu, J. Lim, and M.-H. Yang. Online object tracking: A benchmark. In CVPR, 2013.
(AUC)
这篇论文介绍了目标跟踪的历史面临的问题和发展前景等,当时看得不大懂,所以决定从很久之前的经典算法开始入手,这时就有人推荐了吴毅老师的论文,于是我也去阅读了一下:
Wu Y, Lim J, Yang M H. Online object tracking: A benchmark
[C]// CVPR, 2013.
文章涉及的2012年之前的跟踪方法有很多,提炼了一些比较经典常用于做比较地方法,首先2012年以前的算法没有通用公认的数据集,在这论文里按照目标跟踪常出现的难点进行了分类(比如光照变化,尺度变化,运动模糊等),并且收集了2012年之前的开源的代码进行了实验,对比得出了几个比较优秀的算法,并且给出了将来发展的趋势。
我希望对比较优秀的跟踪算法从原理和代码上进行了解,这样肯定对以后深入学习有辅助。Struck跟踪算法:Structed
Output Tracking with Kernels (ICCV /2011年)
SCM跟踪算法:W. Zhong, H. Lu, and M.-H. Yang. Robust Object Tracking via
Sparsity-based Collaborative Model. In CVPR, 2012. )
TLD:TLD目标跟踪算法是Tracking learning Detection算法的简称。这个视频跟踪算法框架由英国萨里大学的一个捷克籍博士生Zdenek
Kalal提出。TLD将传统的视频跟踪算法的跟踪模块(Tracker)与检测模块(Detector)结合起来,同时加入了学习(Learning)的过程,使得跟踪的效果更佳稳定、可靠。
LSK:B. Liu, J. Huang, L. Yang, and C. Kulikowsk. Robust Tracking
using Local Sparse Appearance Model and K-Selection. In CVPR, 2011.
ASLA:X. Jia, H. Lu, and M.-H. Yang. Visual
Tracking via Adaptive Structural Local Sparse Appearance Model. In CVPR, 2012.
突然发现了有大佬总结的算法论文整合:
https://blog.csdn.net/qq_29540745/article/details/79120004
不过我真是对用大写字母组合简称作为算法代表的方式有些不适,而且目标跟踪的算法也太多了,就很手忙脚乱。
由这篇文章引出的就是常用数据库:
经常说的两个数据库分别是OTB和VOT,OTB50和OTB100来自吴毅老师建立的数据库(50和100分别代表包含的视频数量);VOT(visual object tracking)是一个每年举办的比赛。http://cvlab.hanyang.ac.kr/tracker_benchmark/index.html
和http://www.votchallenge.net/
现在使用的基本上是OTB100和VOT2016,数据库已经下载好了。
OTB的数据库里格式都是一系列的照片,人工标注的点,比较容易使用。
VOT里数据格式也是一样的,感觉VOT的数据集比较全并且代表性比较好,自己感觉。
接下来从2012年之后的算法,相关滤波,深度学习。目前了解到的是,一些算法都是基于相关滤波算法(Correlation
Filters)的改进,比较优秀的算法有:
KCF:Kernelized Correlation Filters 核相关滤波
SAMF:基于KCF,特征是HOG+CN,多尺度方法是平移滤波器在多尺度缩放的图像块上进行目标检测,取响应最大的那个平移位置及所在尺度:
Li Y, Zhu J. A scale adaptive kernel
correlation filter tracker with feature integration [C]// ECCV, 2014.
DSST:KCF算法改进效果比较好的一个算法,尺度自适应。
Danelljan M, Häger G, Khan F, et al. Accurate scale estimation
for robust visual tracking [C]// BMVC, 2014.
假期前研究的就是这篇论文,评价很高,因为到2014年,目标跟踪领域还没有大量使用深度学习的时候,DSST这个相关滤波算法的变化版取得了非常不错的成绩。
我的解析附在另一页:
https://blog.csdn.net/qq_40972038/article/details/88090006
Danelljan M大佬的主页:
http://www.cvl.isy.liu.se/research/objrec/visualtracking/
最近几天,看的是mean shift算法,从一篇老论文里找到了可运行出的代码,正在学习。
到此,目前了解过的目标跟踪的算法,接下来一个阶段会学习那些经典算法:均值漂移,粒子滤波和kalman滤波,把他们实现并且完全理解。鉴于matlab和C++对于目标跟踪算法地重要性,这学期也要复习和强化两门语言地使用。第二学期,心态悄然地发生着改变,感觉这个领域真的是很大了,想学地很多,每天地时间有限,虽然这学期来了因为紧迫感,效率是高了一些,不过还是有种,老师说让我移山,我一看,哇喜马拉雅山,再一看手里的工具,10快包邮的儿童铲,无力感,希望自己多努力吧。
Jarry的目标跟踪学习笔记一相关推荐
- 相关滤波目标跟踪学习笔记(三)——KCF算法公式理解
KCF算法特点: 1.通过循环移位产生了大量的虚拟样本: 2.利用循环矩阵可以在傅里叶域对角化的性质,大大减少了运算量,提高了运算速度: 3.核函数的运用,提高了分类器的性能: 4.采用HOG特征,相 ...
- OpenCV 3 Tracking API目标跟踪学习笔记——定义、物体跟踪常用算法、demo
今天开始接触目标跟踪 本文翻译自https://www.learnopencv.com/object-tracking-using-opencv-cpp-python/#opencv-tracking ...
- 目标跟踪学习笔记_2(particle filter初探1)
首先提供几篇关于粒子滤波算法的博客: http://www.cnblogs.com/yangyangcv/archive/2010/05/23/1742263.html 这篇博客比较通俗易懂,简单的介 ...
- 目标跟踪学习笔记_1(opencv中meanshift和camshift例子的应用)
在这一节中,主要讲目标跟踪的一个重要的算法Camshift,因为它是连续自使用的meanShift,所以这2个函数opencv中都有,且都很重要.为了让大家先达到一个感性认识.这节主要是看懂和运行op ...
- vot 单目标跟踪学习笔记
目录 MixFormer TCTrack 视频测试代码: 图片测试代码: 摄像头测试代码: MixFormer
- opencv动态目标跟踪学习总结
用opencv实现对视频中动态目标的追踪 第一步,是要建立一个编程环境,然后加载opencv的库路径等等.具体步骤在 http://www.opencv.org.cn/ 的"安装" ...
- 单目标跟踪——个人笔记
单目标跟踪--个人笔记 以<Handcrafted and Deep Trackers: A Review of Recent ObjectTracking Approaches>为主线看 ...
- 《南溪的目标检测学习笔记》——模型预处理的学习笔记
1 介绍 在目标检测任务中,模型预处理分为两个步骤: 图像预处理:基于图像处理算法 数值预处理:基于机器学习理论 关于图像预处理,请参考<南溪的目标检测学习笔记>--图像预处理的学习笔记 ...
- 《南溪的目标检测学习笔记》——COCO数据集的学习笔记
1 COCO数据集 COCO数据集下载链接:COCO_download 1.1 数据概览 数据集大小 train: 118287张 train+val: 123287张 val: 5000张 目标数量 ...
最新文章
- 苹果史上最强芯片竟然是个“组装货”!iPhone SE涨价,13系列是真绿了
- Gitlab 生成 swagger 文档
- VTK:模型之MarchingSquares
- CSS3笔记之基础篇(一)边框
- iOS APP 安全测试
- Android Glide图片加载框架(三)缓存机制
- asp 不能读取mysql 长文本文件,从文本文件中读取信息并存储入数据库_asp技巧
- NASM汇编语言与计算机系统09-8086实模式的内存分配图
- linux切换英文界面,linux英文界面下使用中文输入法
- c语言printf()输出格式大全(转载)
- win7怎么把计算机放到桌面6,手机投屏到电脑win7最简单具体操作步骤
- AI Studio 精品项目 | 基于Few-shot Learning实现中文科学文献学科分类
- STM32CubeMX安装问题【尤其是Java环境没安装好的情况】
- GIF动图拆分为多个静态图片
- mars3d学习-方量分析
- 看这些MySQL的重要知识点,吃透它
- PE工具制作/装机U盘制作
- 动态下载苹果提供的多种中文字体
- 2018-7-27银行卡bin大全-根据银行卡开头查银行
- 2022-2027年中国互联网+长租公寓市场规模预测及投资战略咨询报告