论文阅读笔记《Matching Images With Multiple Descriptors: An Unsupervised Approach for Locally Adaptive》
核心思想
本文提出一种将多种特征描述算法融合起来实现更好图像匹配的方法。近些年来,图像特征的描述算法层出不穷如SIFT、LIOP 、DAISY等等,每种方法都有各自的优势和侧重点,对于不同图像其效果也各有优劣。那么能不能将多种算法的优势结合起来,提出一种混合的特征描述算法来满足各个情况呢?最简单方法就是将多个特征向量级联或者加权求和得到融合特征向量,但这个方法有很大的问题,因为不同算法得到的特征向量维度不同,数值表达的含义也不同,因此简单的级联或者相加都不能保留原有算法的性能。如果要将多种特征描述算法更好的融合起来,就必须把他们映射到一个统一的空间中,在这个空间中各个算法的优劣有一个统一的度量方法。
作者首先使用三种特征描述算法对两幅图像进行匹配,结果如上图(c)、(d)、(e)所示,黑色连线表示错误匹配,彩色连线表示正确匹配,作者发现无论是哪种特征描述算法,其正确匹配通常都满足几何连续性,他们的几何变换(单应性)都是一致的。这启发了作者将特征向量映射到单应性空间中,如图(f)所示,作者发现对于正确的匹配点,无论用任何特征描述算法,在该空间中的位置都是临近甚至是一致的,而误匹配点不同算法得到的映射坐标是不同的,无规律的散布在空间中。利用这一规律,作者利用一种无监督的单类SVM算法将正确匹配点分类出来。
实现过程
根据上面的思路,作者首先使用Hessian-Affine检测器从两幅图像IPI^PIP和IQI^QIQ中分别提取关键点,构成点集UPU^PUP和UQU^QUQ,特征点的坐标表示为xi\mathbf{x}_ixi,然后用MMM种特征描述算法分别提取特征描述向量{fi,m}m=1M\{f_{i,m}\}^M_{m=1}{fi,m}m=1M。C~=UP×UQ\tilde{C}=U^P\times U^QC~=UP×UQ表示所有特征点之间的对应关系,为了提高计算效率,对于每个IPI^PIP图中的特征点uPu^PuP都只保留相似程度最大的rrr个匹配点作为后续匹配的候选对象,因此对于每个特征点、每种特征描述算法都会得到一个候选匹配点集Ci,m={(uiP,uik,mQ∈IQ)}k=1rC_{i,m}=\{(u_i^P,u_{i_k,m}^Q\in I^Q)\}_{k=1}^rCi,m={(uiP,uik,mQ∈IQ)}k=1r,则每个特征点都有r×Mr\times Mr×M个候选匹配点,而整个点集UPU^PUP中包含NPN^PNP个特征点,则整个匹配点集CCC表示为
对于特征点uiu_iui所在的特征描述区域(特征描述算法通常提取以特征点为中心的一块区域内的特征信息),经过仿射变换可得
其中A(ui)A(u_i)A(ui)是一个2×22\times 22×2的非奇异矩阵,用于记录特征点uiu_iui的尺度、形状和方向,对于UPU^PUP和UDU^DUD中的特征点都进行仿射变换,并得到下式
HijH_{ij}Hij是一个6自由度的仿射变换,他也可以看成是6维的仿射单应性空间H\mathcal{H}H中的一个点。因此对于匹配点集CCC中的任意一对匹配点c=(uiP,ujQ)c=(u^P_i, u_j^Q)c=(uiP,ujQ)都可以映射到上述空间中的一个点。可考虑两对匹配点c=(uiP,ujQ)c=(u^P_i, u_j^Q)c=(uiP,ujQ)和c′=(ui′P,uj′Q)c'=(u^P_{i'}, u_{j'}^Q)c′=(ui′P,uj′Q),其对应的放射单应性矩阵分别为HijH_{ij}Hij和Hi′j′H_{i'j'}Hi′j′,则匹配点c=(uiP,ujQ)c=(u^P_i, u_j^Q)c=(uiP,ujQ)与Hi′j′H_{i'j'}Hi′j′之间的投影误差可表示为
这个误差反映了将匹配点c=(uiP,ujQ)c=(u^P_i, u_j^Q)c=(uiP,ujQ)的单应性矩阵从HijH_{ij}Hij更换成Hi′j′H_{i'j'}Hi′j′时产生的误差,进而两对匹配点之间的重投影误差可表示为
重投影误差用于计算两对匹配点之间的几何差异。
作者构建了一个无向图G=(V,E)\mathcal{G}=(\mathcal{V},\mathcal{E})G=(V,E)来描绘匹配点之间的几何和空间关系。图中的每个节点viv_ivi都对应一对匹配点cic_ici,如果两个节点对应的匹配点cic_ici和cjc_jcj在图像IPI^PIP中的特征点uiu_iui和uju_juj之间的距离足够近(这里距离足够近的概念是特征点uju_juj是uiu_iui的K最近邻),则两个节点viv_ivi和vjv_jvj之间有边eije_{ij}eij连接,且边上的权重如下
其中d(ci,cj)d(c_i,c_j)d(ci,cj)就是上文介绍的重投影误差,这表现了匹配点之间的几何一致性。为了描述匹配点在空间上的连续性,作者计算了CCC中所有匹配点的测地距离dgeo(ci,cj)d_{geo}(c_i,c_j)dgeo(ci,cj),测地距离是指两个节点在图G\mathcal{G}G中的最短路径距离。如前文所说,正确匹配点之间具备更强的几何和空间一致性,也即测地距离更短。
最后作者使用一个单类SVM从匹配点集CCC中选取出正确的匹配点,该方法假设正确的数据之间都是相似的,而错误数据之间各有各的不同。这一思想正好与正确匹配点之间具备更强的几何和空间一致性的思想不谋而合,因此可以用来识别正确的匹配点。SVM方法通过解决下述带约束的最优化问题来预测每个样本的标签,
其中C0C_0C0和vvv是SVM的参数分别取1和0.5,函数ϕ\phiϕ将数据映射到再生核希尔伯特空间(RKHS),利用核技巧能够很容易的计算两个映射后数据之间的内积,即k(ci,cj)=<ϕ(ci),ϕ(cj)>k(c_i,c_j)=<\phi(c_i),\phi(c_j)>k(ci,cj)=<ϕ(ci),ϕ(cj)>,本文选择的核函数为
其中σ\sigmaσ设置为每对匹配点到其最近邻之间的平均测地距离。每对匹配点cic_ici对应的匹配得分f(ci)f(c_i)f(ci)可得
其中αj\alpha_jαj表示支持向量的优化系数,对于每对匹配点对应的匹配点集CiC_iCi(其中包含多种特征描述算法对应的匹配结果),选择匹配得分最高的点作为最终的匹配点。
创新点
- 通过将匹配点映射到放射单应性空间中,使得多种特征描述算法具有统一的比较标准
- 设计重投影误差和测地距离来描述匹配点之间的几何一致性和空间连续性
- 利用单类SVM算法来预测每对匹配点使用不同特征描述算法的匹配得分,并选择得分最高的作为最终匹配点
算法评价
本文是从特征描述算法的角度来提高匹配效果的,融合多种特征描述算法并从其中选择出对于当前匹配点最好的方法。通过仿射变换解决了不同的特征描述算法之间无法直接比较和融合的问题,并且利用正确匹配点具备较高的几何和空间连续性的这一假设,通过构建重投影误差和测地距离来计算匹配得分。这一思想还是很有特色,而且曾经也备受关注,但问题是计算耗时实在太长了,单幅图像匹配时间长达36秒,这对于很多应用而言是无法接受的。
如果大家对于深度学习与计算机视觉领域感兴趣,希望获得更多的知识分享与最新的论文解读,欢迎关注我的个人公众号“深视”。
论文阅读笔记《Matching Images With Multiple Descriptors: An Unsupervised Approach for Locally Adaptive》相关推荐
- 《Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs》论文阅读笔记
<Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs>论文阅读笔记 主要挑战贡献: KG上的推理挑战主要 ...
- 论文阅读 | NIPS‘20 | Beta Embeddings for Multi-Hop Logical Reasoning in Knowledge Graphs
很有意思的一篇paper.在众多Knowledge Graph Embedding (KGE) 的论文中通过问题设计和有意思的解决方式脱颖而出. 首先来看看问题设计. 一般的KGE model都是利用 ...
- Beta Distribution Guided Aspect-aware Graph for Aspect Category Sentiment Analysis论文阅读笔记(EMNLP2021)
目录 标题翻译:基于Beta分布引导方面感知图的方面类别情感分析 原文链接:https://aclanthology.org/2021.emnlp-main.19.pdf 摘要: 1 引言 2 相关工 ...
- Phrase-BERT: Improved Phrase Embeddings from BERT with an Application to Corpus Exploration论文阅读笔记
问题: 因为bert是在长文本(512token长度)预训练的,因此,如果没有特定于任务的微调,BERT在短语和句子上的表现通常比简单基线(如GLoVe的平均池化)更差.且字节2020在EMNLP上的 ...
- DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记
DeepWeak: Reasoning Common Software Weaknesses via Knowledge Graph Embedding 阅读笔记 Article Background ...
- [论文阅读笔记] Are Meta-Paths Necessary, Revisiting Heterogeneous Graph Embeddings
[论文阅读笔记] Are Meta-Paths Necessary? Revisiting Heterogeneous Graph Embeddings 购物返利 www.cpa5.cn 本文结构 解 ...
- 论文阅读笔记—Reasoning on Knowledge Graphs with Debate Dynamics(AAAI,2020)
这是一篇非常有趣的工作,看完会觉得眼前一亮. 论文标题:Reasoning on Knowledge Graphs with Debate Dynamics 发表于AAAI,2020 动机 很多机器 ...
- 论文阅读笔记——《a simple but tough-to-beat baseline for sentence embeddings》
<a simple but tough-to-beat baseline for sentence embeddings>published at ICLR 2017. ICLR会议的论文 ...
- Learning Hierarchy-Aware Knowledge Graph Embeddings for Link Prediction论文阅读笔记
我的博客链接 0. 前言 1. 作者试图解决什么问题? 作者想在KGE中对语义层级(semantic hierarchies)进行建模. 2. 这篇论文的关键元素是什么? semantic hiera ...
- 斯坦福图机器学习CS224W笔记自用: Reasoning in Knowledge Graphs using Embeddings
1. 基于嵌入的知识图推理 目标:如何对知识图进行多跳推理? 知识图推理: 回答多跳查询 路径查询 连接查询 Query2box 示例:生物医学图 知识图谱上的预测查询 我们是否可以进行多跳推理,即在 ...
最新文章
- 2型文法:基于预测分析表的自顶向下语法分析
- 经典排序算法python回顾之一 交换排序
- Android应用程序消息处理机制(Looper、Handler)分析(1)
- python算法与数据结构-二叉树的遍历
- 【网络】浏览器输入URL到展示页面全过程(含互联网协议及HTTPS简介)
- Windows共享Linux打印机,linux – 如何为cups客户端构建windows共享打印机的url
- java算法提高求最大值_藍橋杯 算法提高 求最大值
- 多线程的那点儿事(之原子锁)
- Linux之rmdir命令
- CUDA 8.0 + VS2013 + win10 x64开发环境搭建
- Unity3D基础39:人物角色模型
- jquery楼层效果
- [2019.2.28]BZOJ4033 [HAOI2015]树上染色
- 阮一峰ES6之Generator函数理解
- 如何在Mac电脑中设置安全与隐私?如何加密应用?
- 计算机学院网络安全学院,网络空间安全学院
- 电脑桌面云便签软件怎么显示最小化按钮?
- kill the one(pjone歌词摘录)
- WIN7 64位 安装ANACONDA3 报错:FAILED TO CREATE MENUS
- 时间序列 R 08 指数平滑 Exponential smoothing