本文用以记录研究僧生涯课题相关内容,主要是对论文进行翻译,再次对论文作者表示尊敬!
本篇论文在模板匹配方向取得了很不错的成果,可惜的是没有开源`

论文题目:
Pattern recognition 2019 :Large-scale and rotation-invariant template matching using adaptive radial ring code histograms
“基于自适应辐射环编码柱状图大尺度和旋转不变性的模板匹配”

作者: 华中科技大学 机械科学与工程学院 数字制造装备与技术国家重点实验室

摘要:
(1) 在模板内部识别围绕参考点的一组同心环区域
(2) 基于自适应尺度梯度算子(ASGO)检测“稳定”像素,该算子对于大尺度变化不敏感
(3) 为每个“稳定”像素提取旋转不变特征
(4) 对于标度空间中的每个同心环区域,在单独的直方图中离散特征
最后,通过链接每个尺度的所有同心环区域的直方图来获得ARRCH图像描述子。

一、介绍

二、相关工作

1、局部二进制描述子

           局部二进制描述子将图像特征点邻域的局部属性编码为二进制向量,局部二进制描述子具有高存储效率和低计算成本。分为 手工方法(LBP)和 学习方法。

手工方法采用相邻像素之间强度的比较操作来构建局部二进制描述子,其利用了像素强度之间的差异来体现图像的纹理特征。旋转不变性、尺度不变性、光照不变性。

LIO: “局部强度顺序模式”。通过将局部斑块划分为子区域的方式,按照每个像素的顺序信息和在总体上处于的强度,进行编码。

LIOP 对于线性照明变化,旋转以及许多其他几何和光度变换(例如视点变化和图像模糊)是不变的。

BRIEF:“二进制鲁棒独立基本特征”。将随机点对的像素强度与局部块的像素强度进行比较,以实现二进制矢量的快速计算,依赖于少量的强度差来表示图像块。不具有旋转不变性。

ORB:克服了BRIEF的不具有旋转不变性,它通过方向运算符来解决方向不变性。

BRISK:“二进制鲁棒尺度不变关键点”。二进制鲁棒不变可伸缩关键点(BRISK)使用循环采样模式,而不是BRIEF的随机采样模式来计算亮度比较,以形成二进制描述符向量。

FREAK:快速视网膜关键点(FREAK)[46]使用视网膜采样模式来计算二进制串的级联。 它的灵感来自人类视觉系统的视网膜,并且比BRISK具有更好的性能。

sGLOH:移位GLOH(sGLOH)[47]是基于直方图的局部特征描述符,可用于一次计算局部补丁的多个量化旋转。 由于其圆形结构,sGLOH可以通过其元素的循环移位来解决离散旋转。 然而,两个sGLOH离散旋转之间的间隔主要决定了它的性能。

以上的描述子通常因为稀疏、不紧凑而导致不如基于学习描述子的准确,并且由于对于强度的比较较为简单,容易受到图像噪声和图像变换的影响。

LDAHash:对局部描述符采用LDA,然后应用二值化操作符来创建短二进制向量,这对于照明和视点变化都是鲁棒的。

BinBoost:“提升二进制关键点描述符”利用提升方法来学习二进制哈希函数来计算描述符。

BOLD:“二进制在线学习描述”应用LDA标准为每个独立的局部补丁生成二进制描述符,同时增加类间距离并减少类内距离。

CA-LBFL:“上下文感知本地二进制特征学习”以利用相邻图像块的上下文信息来构建具有更强大信息的本地描述符。

与手工方法的本地二进制描述符相比,基于学习的描述符更紧凑,并提供更好的判别表示。然而,与手工方法的局部二进制描述符相比,当前的学习方法对旋转敏感并且效率较低。

2、浮点描述子

将patch编码为浮点向量,在许多情况下都很稳健。

SIFT:它是梯度位置和方向的直方图,对位置和方向区间的贡献由梯度大小加权。 它具有高度的辨别力,能够抵抗尺度变化,旋转变化,光照变化和图像模糊。 然而,SIFT是128个维度的向量,这使得其计算和匹配相对较慢,从而实质上影响实时应用,例如基于视觉的拾取和定位。 已经提出了许多方法来解决SIFT的局限性。

Dense-SIFT:通过指定采样框来提取关键点的特征以加速SIFT,但它不是旋转和尺度不变的。

GLOHL:使用对数极坐标位置网格来替换SIFT使用的Carte- sian位置网格,并应用PCA来减小描述符的大小。

SURF :使用基于Hessian矩阵的检测器和描述器的Haar小波响应。 通过使用积分图像进行图像卷积,其计算时间显着缩短。 该描述符对于比例变化,旋转变化,照明变化和图像模糊也是鲁棒的。

DAISY:密集的SIFT描述符,它受SIFT和GLOH启发,使用循环对称加权内核来计算卷积的总和,而不是SIFT和GLOH使用的加权和。 它在光照变化,遮挡和噪声下实现了良好的性能。

VF-SIFT:将SIFT延伸几个成对的独立角度,这些角度对于旋转,比例和光照变化是不变的。

The scale-less SIFT :在不同尺度上追求SIFT的子空间表示,实现比原始SIFT描述符更好的性能

这些手工方法的描述符可以在许多情况下实现高精度和良好性能,但是不能同时解决大尺度变化和旋转变化,且计算成本很高。

ASR:仿射子空间表示(ASR)描述符在不同视点下学习局部patch的子空间表示,对视点变化具有鲁棒性。 但是,对所有patch执行仿射变形的计算成本极高。
CNN:Zagoruyko和Komodakis [57]提出了DeepCompare方法来学习一对patch的相似度函数。 在这种方法中,提出了一个2通道2流卷积神经网络(CNN)来执行patch的成对比较操作; 因此,它在计算上很昂贵。
FCNs:田等人提出了L2-Net方法, 两个单独的完全卷积网络(FCN)用于提取特征,并且通过渐进式采样策略使用匹配对的相对最小距离来训练整个网络。

三、ARRCH(自适应辐射环编码柱状图)算子

①识别一组同心环

为了解决尺度变化:利用双线性插值生成一组模板的不同尺度的图像。为了保证内圆周区域中的足够信息,将半径为R的内圆区域设置为唯一的环区域。当R大于20时,第一标度模板图像T 1(x,y)被分成一组同心环区域。

②检测基于ASGO的稳定像素

       在这项工作中,采用了图像梯度特征,因为它对非线性光照变化的灵敏度较低。如果比例变化非常大,则像素的一些图像梯度特征将是变体的,而其他图像梯度特征将保持不变。因此,具有“稳定”梯度的像素必须在相同的同心环区域Υj(x,y)中与其他像素分离。





在这里,引入了一个由Sobel算子开发的ASGO来估计图像梯度特征。如果标度si≤2,则ASGO与Sobel运算符相同。否则,在s i> 2的情况下,Sobel算子不适合大规模变化,并且采用ASGO。白点的梯度大小等于或大于30,而黑点的梯度大小小于30。

对选择的稳定像素的两个约束:

(1)梯度幅度大于阈值,30。

(2)定义中心像素与3×3域中围绕它的8个像素之间的平均梯度角差δsij,也小于阈值,Π/18。

③获取旋转不变性特征

梯度向量和位置向量之间的夹角保持旋转不变性。


④柱状图向量
在比例范围内,为每个比例建立ARRCH图像描述符,预测矢量和预测环区域,并用于模板匹配以进行大规模和旋转变化,如图1所示。

四、大尺度和旋转不变性模板匹配

4.1 利用卡方检验来度量模板和滑窗内的ARRCH描述子。

4.2 由粗到精策略来检验目标的尺度。

粗:先从每个尺度中选出Q个最符合的情况,所以最后得到了Q*N个候选窗口。(Q是自己定的)
精:再将模板的ARRCH描述子与候选窗口逐一比较。

五、算法评估

5.1 评估在不同缩放步长下的表现:ds越大,计算量越小,成功率越小。建议0.1~0.3.

5.2 评估在大尺度和旋转下的表现,和以往方法做对比

在微软 COCO的数据集下进行实验,然后按如下方式生成测试图像:
(i) 原始图像从0°旋转到360°,步长为36°。 因为0度与360°的旋转相同,我们选择0到324°的旋转角度范围,产生总共10 0 0 0个测试图像用于旋转测试。
== (ii)== 调整原始图像的大小,比例范围为0.4到1,步长为0.2,步长为1.5到10,步长为1.5,测试图像总共为10,0 0 0。
== (iii)== 使用与(i)中相同的旋转范围和与(ii)中相同的比例范围旋转和调整原始图像的尺寸。
与NCC [21] , MTM [23] , M-GHT [27] , SITM-HDG [8] , SIFT [31] , Dense-SIFT [32] , SURF [34] , BRIEF [43] ,ORB [44] . 相比。其中NCC, MTM and M-GHT 是无参的方法。

5.3算法的应用

在传送带上拾取物体,对于10000个对象,成功率为99.8%。无人驾驶飞行器对物体定位,100个物体,95个成功定位。平均运行时间28.964ms,没有找到的对象是因为被遮挡。

~ 很高兴可以和大家分享 如果转载,请联系QQ:957176024

【论文速递】“基于自适应辐射环编码柱状图大尺度和旋转不变性的模板匹配”相关推荐

  1. 【论文速递】ISPRS2018 :基于增强极线几何约束以及自适应窗最小二乘匹配方法的立体SAR山区DSM

    [论文速递]ISPRS2018 :基于增强极线几何约束以及自适应窗最小二乘匹配方法的立体SAR山区DSM [论文原文]:Radargrammetric DSM generation in mounta ...

  2. 【论文速递】CIE2021 - 多角度卫星雷达图像的立体定位:基于GF-3 SAR降/升角数据的雷达测绘分析

    [论文速递]CIE2021 - 多角度卫星雷达图像的立体定位:基于GF-3 SAR降/升角数据的雷达测绘分析 [论文原文]:Stereo Radargrammetric Location of GF- ...

  3. 【论文速递】IET2020 - 提升SAR定位精度:基于多角度雷达测距法的分析

    [论文速递]IET2020 - 提升SAR定位精度:基于多角度雷达测距法的分析 [论文原文]:Location accuracy analysis of multi-angle SAR based o ...

  4. 【论文速递】IJCV2022 - CRCNet:基于交叉参考和区域-全局条件网络的小样本分割

    [论文速递]IJCV2022 - CRCNet:基于交叉参考和区域-全局条件网络的小样本分割 [论文原文]:CRCNet: Few-shot Segmentation with Cross-Refer ...

  5. 【论文速递】基于改进层次分析法与熵权法的目标选择模型

    [论文原文]:基于改进层次分析法与熵权法的目标选择模型 作者信息: 张指辉,张毅,李健宁 获取地址:https://kns.cnki.net/kcms2/article/abstract?v=3uoq ...

  6. 计算机视觉论文速递(四)Dynamic Sparse R-CNN:Sparse R-CNN升级版,使用ResNet50也能达到47.2AP

    计算机视觉论文速递(三)YOLO-Pose:<Enhancing YOLO for Multi Person Pose .....>实时性高且易部署的姿态估计模型 1. 摘要 2. 引言 ...

  7. 计算机视觉论文速递(七)FAN:提升ViT和CNN的鲁棒性和准确性

    计算机视觉论文速递(七)FAN:提升ViT和CNN的鲁棒性和准确性 1. 摘要 2. 引言 3. Fully Attentional Networks 3.1 Self-Attention的原理 To ...

  8. 【论文速递】ECCV2022 - 密集高斯过程的小样本语义分割

    [论文速递]ECCV2022 - 密集高斯过程的小样本语义分割 [论文原文]:Dense Gaussian Processes for Few-Shot Segmentation 获取地址:https ...

  9. 【论文速递】CVPR2022 - 全局跟踪Transformers

    [论文速递]CVPR2022 - 全局跟踪Transformers [论文原文]:Global Tracking Transformers 论文地址:https://arxiv.org/abs/220 ...

最新文章

  1. Extjs 基础篇—— Function基础
  2. 使用Windows live Writer 2012发布ChinaUnix博客
  3. ERP实施过程中的误区 你知道吗?
  4. stl-优先队列priority_queue
  5. python编码程序_python 编码
  6. 计算机技能鉴定操作试题,计算机操作员中级操作技能考核试卷职业技能鉴定国家题库...
  7. mysql源码分析书籍_从源码分析 MySQL 死锁问题入门
  8. 如何列出引用SQL Server中给定表的所有外键?
  9. Atitit 研发体系建立 数据存储与数据知识点体系知识图谱attilax 总结
  10. node创建项目步骤
  11. SQL数据库修复/数据库置疑修复
  12. 一个真实的用户画像实例。
  13. 利润分配计算机公式,利润与利润分配表计算公式大全
  14. 搜索引擎广告和信息流广告有什么区别?
  15. RxSwift 学习笔记
  16. MySQL——MySQL逻辑架构
  17. 系统安装无法创建新的系统分区的解决方法
  18. 汇编语言(第三版)第十章 CALL 和 RET 指令 笔记
  19. mcreator安装教程
  20. 数据中台系统架构设计

热门文章

  1. 股票通达信软件常用设置(1)
  2. oracle orderby多个字段,Oracle的order by关键字
  3. 2021年八省联考解析几何题目(双曲线上单点焦点弦长纯几何解法)
  4. Supermap GIS二次开发
  5. GIS二次开发实习——鹰眼功能模块的实现(鹰眼锁定不能动,红框与主地图联动)
  6. 米家扫地机器人重置网络_小米扫地机器人重置wifi怎么链接_米家扫地机器人wifi连接不上怎么办...
  7. Shell脚本学习-阶段二十七-命令解释三
  8. apche 反射api的使用心得
  9. 简单网页设计(苍兰诀)html+css
  10. React-后台管理系统项目实战