参看论文:Tao R, Gavves E, Smeulders A W, et al. Siamese Instance Search for Tracking[J]. computer vision and pattern recognition, 2016: 1420-1429.

会议水平:CVPR2016

投稿单位:https://ivi.fnwi.uva.nl/quva/ 弗吉尼亚理工深度学习组的工作

comment:利用孪生网络的匹配能力进行跟踪,这种思想不难想到。跟踪的很大的一个分支就是基于目标检测(匹配)的跟踪。在以后相当长的一段时间里,基于孪生网络的跟踪方案并解决长时间(long-term)问题一定是跟踪领域的热点。但相比于DCF及其衍生的CNN-DCF优秀的跟踪性能,Siamese还有相当长的路要走。一方面,基于匹配的跟踪何如引入时间场效应(temporal smooth)?如何引入attention机制将是难点。此外,如果想成为一种普适性的方法,很显然网络不能太复杂太深,否则时效性不好,平衡精度与速度始终是跟踪领域两座大山。

1. 摘要 及 目的

作者提出一个和之前顶级跟踪器都不一样的新型跟踪器,没有模型更新,没有遮挡检测,没有跟踪器级联和重检测,也没有几何匹配(就是啥也没有,完全依赖深度卷积强大的特征表达能力)。方法就是用学习到的匹配函数进行最佳块匹配策略。

以DCF为核心的方法征服整个跟踪领域的途中,偶然出现一篇最佳匹配实现跟踪确实让人眼前一亮,但是这也只是停留在最初步阶段,更多的是给研究者更多的选择。本文另外一个亮点应该在重识别上,在一个完整是视频中,如何解决目标确实后的重识别问题一直是研究的热点。

作者原文是这样说的:We focus on learning the matching function suited for application in trackers. Hence, our aim is not to build a fully fledged tracker which might need explicit occlusion detection, model updating, tracker combination, forget mechanisms and other. We rather focus on the matching function alone, similar to the simplicity of the normalized cross-correlation (NCC) tracker .In each frame, the tracker simply finds the candidate patch that matches best to the initial patch of the target in the first frame by the learned matching function.

2. 方法 及 细节

图1:预训练好的匹配函数,用于跟踪实例中的最佳快匹配跟踪

图2 The proposed Siamese invariance network to learn the generic matching function for tracking. ‘conv’, ‘maxpool’, ‘roipool’ and ‘fc’ stand for convolution, max pooling, region-of-interest pooling and fully connected layers respectively. Numbers in square brackets are kernel size, number of outputs and stride. The fully connected layer has 4096 units. All conv layers are followed by rectified linear units (ReLU)。(这里没有翻译,主要在于作者提到的两个点。其一,ROI池化;其二,全连接层采用了大量的神经元)

损失函数用的还是hinge loss:

D是指两个特征表达的欧氏距离。 训练采用的还是老方法,一对图像以及他们的标签。

跟踪过程

We propose a simple tracking strategy. As the only reliable data we have for the target object is its location at the first frame, at each frame we compare the sampled candidate boxes with the target object at the first frame. We pass all the candidate boxes from the search stream of our network and pick the candidate box that matches best to the original target:

HighLight候选样本的采集策略

We employ the radius sampling strategy. More specifically, around the predicted location of the previous frame we sample locations evenly on circles of different radii。
为了避免候选样本的穷尽搜索问题,作者提议采用半径采样策略。更确切地说,以前一帧预测中心为基准利用不同半径进行候选样本采样。We use 10 radial and 10 angular divisions

和文献中不同的是,作者将候选样本进行多尺度/多分辨率处理

Box Refinement 策略:作者训练四个岭回归分类器,针对矩形框的圆心坐标、高度、宽度进行优化。这主要参考了前人的工作,通过回归进行矩形窗精修可以大大提高目标定位的准确度。

很奇怪.....作者采用权重衰减为0.001;然而作为对别人孪生网络的精修,作者竟然采用了0.001的初始学习率。

3. 结论 及 反思

comment:这篇文章有毒...作者竟然直接剔除了遮挡的视频,而且文章中大量的小tricks 和 处理只是给了别人的效果,却没有解释自己实验中的效益!

通过后续作者补充提交的失败案例来看,果不其然,跟踪性能是真的差啊...

图4. 两例跟踪失败的情况。左边:基于最佳匹配原理很难处理空间相似性目标的干扰。因为搜索空间的等权重的,这里应该利用余弦窗函数加以约束,施加位移惩罚。 右边:最佳匹配跟踪无法解决遮挡问题,这主要还是因为模型更新没有做好。在作者的文章中压根没有做模型更新。所以该方法应用非常有限。

4.补充材料

4.1 双流孪生网络鼻祖文章:

J. Bromley, J. W. Bentz, L. Bottou, I. Guyon, Y. LeCun, C. Moore, E. S¨ackinger, and R. Shah. Signature verification using a siamese time delay neural network. International Journal of Pattern Recognition and Artificial Intelligence, 7(04):669–688, 1993

4.2 Instance Searching:可以简单理解为图像检索与目标定位

R. Tao, A. W. M. Smeulders, and S.-F. Chang. Attributes and categories for generic instance search from one example. In CVPR, 2015. 2, 3

4.3 半径取样避免穷尽搜索

S. Hare, A. Saffari, and P. H. Torr. Struck: Structured output tracking with kernels. In ICCV, 2011

4.4 Box Refinement

P. F. Felzenszwalb, R. B. Girshick, D. McAllester, and D. Ramanan. Object detection with discriminatively trained partbased models. TPAMI, 32(9):1627–1645, 2010.
R. Girshick, J. Donahue, T. Darrell, and J. Malik. Rich feature hierarchies for accurate object detection and semantic
segmentation. In CVPR, 2014.

Siamese Network (应用篇5) :孪生网络用于跟踪 CVPR2016相关推荐

  1. 基于孪生网络的跟踪算法汇总

    目录 1 SINT--[论文链接](https://arxiv.org/pdf/1605.05863.pdf)--[项目链接](https://taotaoorange.github.io/proje ...

  2. Siamese Network (应用篇3) :孪生网络用于图像块匹配 ACCV2016

    参看论文:Melekhov I, Kannala J, Rahtu E, et al. Image patch matching using convolutional descriptors wit ...

  3. Siamese Network (应用篇2) :孪生网络用于图像块匹配 CVPR2015

    参考论文:Zagoruyko S, Komodakis N. Learning to compare image patches via convolutional neural networks[J ...

  4. Siamese Network (应用篇1) :孪生网络特征用于图像匹配 ICPR2016

    参考论文:Siamese Network Features for Image Matching 会议水平:2016 23rd International Conference on Pattern ...

  5. SiamNet: 全卷积孪生网络用于视频跟踪

    参考论文:Fully-Convolutional Siamese Networks for Object Tracking 算法主页:http://www.robots.ox.ac.uk/~luca/ ...

  6. Siamese Network (应用篇6) :孪生网络用于图像块匹配 CVPR2017

    参考论文:L2-Net: Deep Learning of Discriminative Patch Descriptor in Euclidean Space 会议水平:CVPR2017 供稿单位: ...

  7. Siamese Network (应用篇4) :块匹配中一致性特征和距离测度学习 CVPR2015

    参考文章:Han X, Leung T, Jia Y, et al. MatchNet: Unifying feature and metric learning for patch-based ma ...

  8. Siamese-fc孪生网络目标跟踪

    全名:Fully-Convolutional Siamese Networks for Object Tracking 论文摘自ECCV Workshop 2016,由Luca Bertinetto. ...

  9. 【深度学习】孪生网络(Siamese Network)的模式和训练过程

    [深度学习]孪生网络(Siamese Network)的模式和训练过程 文章目录 1 概述 2 Siamese network 孪生神经网络 3 孪生神经网络和伪孪生神经网络分别适用于什么场景呢? 4 ...

最新文章

  1. 力扣(LeetCode)刷题,简单题(第11期)
  2. 1.43千米外隔墙透视!这项黑科技已被中科大潘建伟团队实现 | PNAS
  3. combobox的使用
  4. Mac版本的idea非正常关闭后,idea打开项目大面积报红
  5. java class.getmethod_java反射之Class.getMethod与getDeclaredMethods()区别
  6. vue-element-admin后台管理模板脚手架
  7. vc为啥要更新java_Java9被无情抛弃,Java8直接升级到Java10 ! !
  8. Exchange Server2010系列之十一:部署CAS+HT角色高可用性
  9. 会议邀请 | 10月25日北京,首期D2iQ云原生主题论坛正式启动
  10. 剥开浮躁表面,直指金融科技内心
  11. dnf公共频道服务器不稳定已从初始化状态,合区前兆?DNF公共频道开启跨区添加好友服务...
  12. 计算机原理及应用pdf,微型计算机原理及应用技术-20210621195203.pdf-原创力文档
  13. DM368串口通信调试
  14. 贪心 汽车加油 java_汽车加油问题之贪心算法
  15. JAVA 中大于等于小于的写法
  16. 邮箱大佬告诉你电子邮箱格式如何正确书写
  17. SN74LS148优先编码器的级联使用
  18. 【对可转债和期权的初步认识】
  19. 设计模式03 - 装饰者模式
  20. 五面拿下阿里飞猪offer,mongodbmysqlredis

热门文章

  1. 教子要过计算机考试吗,[教子有方]高考家长最容易陷入的十大志愿填报误区
  2. 海康车牌识别一体机控制道闸起落杆(java版)
  3. C# 解决上传附件大小限制
  4. The bean ‘dataTokenMapper‘ could not be injected because it is a JDK dynamic
  5. ccsa安学网小程序_CCSA安学网题库及答案
  6. log4j与log4j2性能对比及log4j升级至log4j2方案
  7. 日活四千万的汤姆猫游戏家族,用AWS云服务打造“无感”用户体验
  8. 在华为工作的优点和缺点
  9. 【宅男福利】百度云下载不限速软件,电脑和看视频无广告软件
  10. 怎么添加扫描仪到计算机快捷键,Win7系统扫描仪添加方法