点击我爱计算机视觉标星,更快获取CVML新技术


本文源自知乎,经作者授权转载。

https://zhuanlan.zhihu.com/p/93888180

AAAI 2020的审稿刚刚出炉,本文讨论一篇入选AAAI的Poster,来自浙江大学的一篇单目标追踪文章。从名字可以看出是一篇基于SiamFC的改进文章,主要亮点是清晰地阐明了之前的孪生网络追踪器存在的不合理性问题,以及自己定义了一套基于anchor-free的目标估计的回归线路,论文未开源。

本文指出,当前的一些tracking方法,虽然利用各种trick挖掘到了目标状态的潜在可能性,但是很少考虑到视觉跟踪问题本身存在的特性。本文的改进主要存在于4个方面:1、分类分类与状态估计的分支,并且融合形成SIamFC++,2、使得分类分支取消歧义性,3、使得追踪不再依赖于类似于长宽比等先验知识,4、增加了估计质量分数分支。本文在实验方面做得非常充分,几乎涉及到了当前所有可以对比的数据集,其对比实验、消融实验都做得的科学合理,在效果方面,以90FPS实现了当前的SOTA水平,因此非常值得借鉴。

追踪任务可以分解为分类任务与状态估计任务的结合。分类任务的目的是精确定位目标的位置,而状态估计是要以bounding box的形式找到目标的姿态。对于状态估计来说,当前的追踪器主要存在三个方法:

1、以DCF、SIamFC为主的追踪器,在原图上以多尺度为划分,将搜索区域缩放多个比例进行组装,并选择最高分类得分对应的量表;

2、以ATOM为主的追踪器,受到IOU-NET的启发,以迭代训练的方式多重随机初始化帧与背面边框的数量,带来了较多的超参数以及时间上的消耗;

3、以SiamRPN为主的追踪器,以RPN回归的思想,预先定义锚点之间的位移偏移与大小的差异,此类方法基于目标检测,虽然能够找到优秀的精确的状态值,但是对于较大的尺度变化等困难样例来说,锚点与框的先验因素限制了追踪器的鲁棒性,容易产生lost。

因此,作者在结合上述工作的优缺点,对追踪器有了如下的改进:

G1:分解分类与状态估计:分类器专攻将目标物体与背景分离,而状态估计则是为了产生更准确的BB,那些多尺度的方法忽略了后项,因此精度低下;

G2:明确分类得分:分类得到应该直接表示为目标在视野中存在的置信度分数,而不是像预定义的anchor一样设置,对于RPN的思想极其容易产生假阳性样本。

G3:去除先验知识:追踪应该符合通用的精神,即比例等因素不该成为搜索或者检测的因素,RPN的思想阻碍了追踪器的泛化能力;

G4:作者借鉴了2019年另一篇论文,增加了评估质量的分支,边界框进行分类置信度会导致性能的下降。

论文的结果如上图所示,可以看到还是非常规整的Siamese网络结构。绿色的部分是传统的SiamFC分支,后面的红色部分加入了质量评估分支,而蓝色部分则是新加入的回归分支。中间的部分还是用一个cross-correlation的操作,和之前的Siamtracker都是一致的,回归与分类的分支的结合是用了一个argmax。

之前没听过的质量分支,其实就是借鉴了如下的一个PSS评分,代表了在滑动窗中心的像素点具有高评分,远离中心点像素的评分会降低,做了一个像素的级的加权。

最终的LOSS是一个可以端对端训练的集成,质量评分的分支采用的二项交叉熵损失,而回归的部分采用的是一个IOU-LOSS。

这个和SiamFC的消融实验做的很科学。因为本身tracker的训练集就大,因此首先尝试了SiamFC的训练集扩充到同样水平,再逐步调整BackBone和其他的一些策略。可以看到分数提升最明显的还是回归分支。

这个表格总结了最先进的几种tracker和SiamFC++的对比,可以看到SiamFC++无论从速度、评分上,在各个数据集的表现与当前SOTA得追踪器相比都是更加出色的,这也就反向印证了作者当初的分析是正确的。

论文地址:

https://arxiv.org/abs/1911.06188

目前还未发现该文有开源代码。

在我爱计算机视觉公众号后台回复“SiamFC++”(建议复制),即可收到论文下载。


目标跟踪交流群

关注最新最前沿的单目标、多目标跟踪技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:跟踪)

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

SiamFC++,90 fps的单目标跟踪SOTA相关推荐

  1. 单目标跟踪SiamMask:特定目标车辆追踪 part2

    日萌社 人工智能AI:Keras PyTorch MXNet TensorFlow PaddlePaddle 深度学习实战(不定时更新) CNN:RCNN.SPPNet.Fast RCNN.Faste ...

  2. 视觉单目标跟踪任务概述

      视觉目标跟踪的主要目的是:模仿生理视觉系统的运动感知功能,通过对摄像头捕获到的图像序列进行分析,计算出运动目标在每一帧图像中的位置:然后,根据运动目标相关的特征值,将图像序列中连续帧的同一运动目标 ...

  3. 352万帧标注图片,1400个视频,亮风台推最大单目标跟踪数据集

    CVPR 2019期间,专注于AR技术,整合软硬件的人工智能公司亮风台公开大规模单目标跟踪高质量数据集LaSOT,包含超过352万帧手工标注的图片和1400个视频,这也是目前为止最大的拥有密集标注的单 ...

  4. CVPR 2019 | 亮风台发布全球最大单目标跟踪数据集LaSOT

    点击我爱计算机视觉标星,更快获取CVML新技术 CVPR 2019 正在美国加州举行,发布交流来自全球的工业界与学术界最新研究成果. 会上,亮风台公开大规模单目标跟踪高质量数据集LaSOT,包含超过3 ...

  5. 单目标跟踪——个人笔记

    单目标跟踪--个人笔记 以<Handcrafted and Deep Trackers: A Review of Recent ObjectTracking Approaches>为主线看 ...

  6. 单目标跟踪——【数据集基准】RGB数据集OTB / NFS / TrackingNet / LaSOT / GOT-10k / UAV123 / VOT 简介

    入手单目标跟踪的三个方面之数据集简介 目前单目标跟踪领域有哪些公认比较好的数据集? 这可以从一些优秀论文中找,看他们在验证自己的tracker用到哪些数据集.这些数据集的侧重不一,有的会包含快速移动: ...

  7. TrackingNet:最经典大规模、多样化的单目标跟踪数据集

    除了多目标跟踪任务外,研究经典的.通用的单目标跟踪任务对于整个跟踪领域的发展有重要意义. 本期给大家介绍一个包含包含超过3万个视频,共有27个目标类别,视频数量和标注数量比以往的跟踪数据集更大的数据集 ...

  8. python 粒子滤波目标追踪_Python实现基于相关滤波的单目标跟踪算法

    最近在阅读一些单目标跟踪的算法论文,主要看了一系列基于相关滤波的算法,尝试着用python实现了其中一些比较经典的算法,地址在https://github.com/wwdguu/pyCFTracker ...

  9. 基于嵌入式设备的 单目标跟踪算法

    基于嵌入式设备的单目标跟踪实现 最近基于嵌入式设备(Khadas Vim3)做了一套单目标跟踪算法,跟踪效率可以做到每秒25帧左右. 算法运行耗时记录 time is:37.6241 ms time ...

最新文章

  1. 开关设备对于数据中心正常运行时间很重要!
  2. CVE-2012-0158栈溢出漏洞分析
  3. Docker学习笔记 - Docker Compose
  4. 开源无人机_开源无人机,欧洲开源等等
  5. 如何使用SQL Server配置管理器
  6. 快读快写:读入输出优化
  7. 基于python的学生信息管理系统毕业论文_学生信息管理系统毕业论文
  8. TDA2x软件框架分析
  9. Spring Boot实现的开源ERP系统,学习自用均可
  10. 关于“无法加载文件或程序集Interop.ShockwaveFlashObjects,Version = 1.0.0.0,Culture = neutral”的问题
  11. c语言二维数组相关程序设计,c语言二维数组定义及其规则详解
  12. 多个源文件进行编译,即 makefile 的编写
  13. 龙蜥操作系统 Anolis OS 8.6 - 来自阿里云的 CentOS 8 100% 兼容发行版
  14. Python中的数学函数
  15. 如何通过按钮触发事件由一个jsp页面转到另一个jsp页面
  16. 教育培训行业使用CRM管理系统有什么好处
  17. 瘦脸针价格 瘦脸针效果 瘦脸针副作用金霞微整形
  18. 【云原生】学习K8s,读完这篇就够了
  19. 计算机数据传输9600波特率,波特率9600每秒的传输字节 传输一个字节要多久-与非网...
  20. 12.4 jason格式

热门文章

  1. JDBC简单连接MySQL
  2. CV之 HOG特征描述算子-行人检测
  3. KMP算法(待优化)--2015年7月25日14:04:25V1.0版
  4. mysql的root密码的变更-进程的杀掉
  5. LiDAR点云数据处理(TLS/MLS/ALS)
  6. 天锋w2019_天锋W2019叫板三星,三星欲哭无泪,网友称这也太逼真了!
  7. wsl用户帐户没有必要的权限_Windows的Linux子系统(WSL)即将带来图形化应用
  8. 使用keras为什么accuracy一直为0_TensorFlow 2.0+Keras 防坑指南
  9. datagridview列 值提取_Excel学校如何提取教职工员工名单-Leo老师
  10. 元素凸起效果_被誉为作物“生殖元素”的“硼”到底有多重要?看完你就明白了...