全景图像拼接【计算机视觉】
文章目录
- 一、全景图像拼接
- 1.1基本介绍
- 1.2原理解析
- 1.3 RANSAC算法(RANdom SAmple Consensus,RANSAC)
- 1.3 图像配准
- 1.4 APAP算法
- 1.5 图像融合(multi-band bleing)
- 1.6 基本流程
- 二、代码实现
- 1.代码
- 2.结果展示
- 三、实验中遇到的问题
- 报错:ModuleNotFoundError: No module named 'matplotlib.delaunay'
- 解决方法:
一、全景图像拼接
1.1基本介绍
图像拼接技术就是将数张有重叠部分的图像(可能是不同时间、不同视角或者不同传感器获得的)拼成一幅无缝的全景图或高分辨率图像的技术。图像拼接在医学成像、计算机视觉、卫星数据、军事目标自动识别等领域具有重要意义。图像拼接的输出是两个输入图像的并集。
图像配准(image alignment)和图像融合是图像拼接的两个关键技术。图像配准是图像融合的基础,而且图像配准算法的计算量一般非常大,因此图像拼接技术的发展很大程度上取决于图像配准技术的创新。早期的图像配准技术主要采用点匹配法,这类方法速度慢、精度低,而且常常需要人工选取初始匹配点,无法适应大数据量图像的融合。图像拼接的方法很多,不同的算法步骤会有一定差异,但大致的过程是相同的。
1.2原理解析
将SIFT应用到图像拼接上,根据特征点匹配的方式,则利用这些匹配的点来估算单应矩阵使用RANSAC算法,也就是把其中一张通过个关联性和另一张匹配的方法。通过单应矩阵H,可以将原图像中任意像素点坐标转换为新坐标点,转换后的图像即为适合拼接的结果图像。
1.3 RANSAC算法(RANdom SAmple Consensus,RANSAC)
随机抽样一致算法,采用迭代的方式从一组包含离群的被观测数据中估算出数学模型的参数。RANSAC算法假设数据中包含正确数据和异常数据(或称为噪声)。正确数据记为内点(inliers),异常数据记为外点(outliers)。同时RANSAC也假设,给定一组正确的数据,存在可以计算出符合这些数据的模型参数的方法。
该算法核心思想就是随机性和假设性,随机性是根据正确数据出现概率去随机选取抽样数据,根据大数定律,随机性模拟可以近似得到正确结果。假设性是假设选取出的抽样数据都是正确数据,然后用这些正确数据通过问题满足的模型,去计算其他点,然后对这次结果进行一个评分。
算法基本思想:
(1)要得到一个直线模型,需要两个点唯一确定一个直线方程。所以第一步随机选择两个点。
(2)通过这两个点,可以计算出这两个点所表示的模型方程y=ax+b。
(3)将所有的数据点套到这个模型中计算误差。
(4)找到所有满足误差阈值的点。
(5)然后我们再重复(1)~(4)这个过程,直到达到一定迭代次数后,选出那个被支持的最多的模型,作为问题的解。如下图所示:
可以发现,虽然这个数据集中外点和内点的比例几乎相等,但是RANSAC算法还是能找到最合适的解。这个问题如果使用最小二乘法进行优化,由于噪声数据的干扰,我们得到的结果肯定是一个错误的结果,如下图所示。这是由于最小二乘法是一个将外点参与讨论的代价优化问题,而RANSAC是一个使用内点进行优化的问题。经实验验证,对于包含80%误差的数据集,RANSAC的效果远优于直接的最小二乘法。
1.3 图像配准
图像配准是对图像进行变换,使变换后的图像能够在常见的坐标系中对齐。为了能够进行图像对比和更精细的图像分析,图像配准是一步非常重要的操作。图像配准的方法有很多,这里以APAP算法为例:
1.提取两张图片的sift特征点
2.对两张图片的特征点进行匹配
3.匹配后,仍有很多错误点,此时用RANSAC进行特征点对的筛选。筛选后的特征点基本能够一一对应。
4.使用DLT算法,将剩下的特征点对进行透视变换矩阵的估计。
5.因为得到的透视变换矩阵是基于全局特征点对进行的,即一个刚性的单应性矩阵完成配准。为提高配准的精度,Apap将图像切割成无数多个小方块,对每个小方块的变换矩阵逐一估计。
1.4 APAP算法
在图像拼接融合的过程中,受客观因素的影响,拼接融合后的图像可能会存在“鬼影现象”以及图像间过度不连续等问题。下图就是图像拼接的一种“鬼影现象”。解决鬼影现象可以采用APAP算法。
算法流程:
1 提取两张图片的sift特征点
2 对两张图片的特征点进行匹配
3 匹配后,使用RANSAC算法进行特征点对的筛选,排除错误点。筛选后的特征点基本能够一一对应
4 使用DLT算法,将剩下的特征点对进行透视变换矩阵的估计
5 由于得到的透视变换矩阵是基于全局特征点对进行的,即一个刚性的单应性矩阵完成配 准。为提高配准的精度,Apap将图像切割成无数多个小方块,对每个小方块进行单应性矩阵变换,非常依赖于特征点对。若图像高频信息较少,特征点对过少,配准将完全失效,并且对大尺度的图像进行配准,其效果也不是很好,一切都决定于特征点对的数量。
1.5 图像融合(multi-band bleing)
融合目的在于拼缝消除, Multi-Band能够达到比较好的融合效果,但是效率低,采用Laplacian(拉普拉斯)金字塔,通过对相邻两层的高斯金字塔进行差分,将原图分解成不同尺度的子图,对每一个之图进行加权平均,得到每一层的融合结果,最后进行金字塔的反向重建,得到最终融合效果过程。
由下图可知multi-band bleing的效果对于拼接之后的图像进行融合的效果是很好的。
思想:采用的方法是直接对带拼接的两个图片进行拉普拉斯金字塔分解,后一半对前一半进行融合。
步骤:
(1)首先计算当前待拼接图像和已合成图像的重叠部分。
(2)两幅图像的融合:分别构建图像A、B的高斯金字塔和拉普拉斯金字塔,然后进行加权融合。
(3)对加权后的拉普拉斯金字塔进行重构。
1.6 基本流程
1.根据给定图像/集,实现特征匹配。
2.通过匹配特征计算图像之间的变换结构。
3.利用图像变换结构,实现图像映射。
4.针对叠加后的图像,采用APAP之类的算法,对齐特征点。(图像配准)
5.通过图割方法,自动选取拼接缝。
6.根据multi-band blending策略实现融合。
二、代码实现
1.代码
# coding=gbk
#-*- codeing =utf-8 -*-from pylab import *
from numpy import *
from PIL import Image# If you have PCV installed, these imports should workfrom PCV.geometry import homography, warp
from PCV.localdescriptors import sift
np.seterr(invalid='ignore')
"""
This is the panorama example from section 3.3.
"""# 设置数据文件夹的路径
featname = ['D:/SVMCV/data/image/' + str(i + 1) + '.sift' for i in range(5)]
imname = ['D:/SVMCV/data/image/' + str(i + 1) + '.jpg' for i in range(5)]# 提取特征并匹配使用sift算法
l = {}
d = {}
for i in range(5):sift.process_image(imname[i], featname[i])l[i], d[i] = sift.read_features_from_file(featname[i])matches = {}
for i in range(4):matches[i] = sift.match(d[i + 1], d[i])# 可视化匹配
for i in range(4):im1 = array(Image.open(imname[i]))im2 = array(Image.open(imname[i + 1]))figure()sift.plot_matches(im2, im1, l[i + 1], l[i], matches[i], show_below=True)# 将匹配转换成齐次坐标点的函数
def convert_points(j):ndx = matches[j].nonzero()[0]fp = homography.make_homog(l[j + 1][ndx, :2].T)ndx2 = [int(matches[j][i]) for i in ndx]tp = homography.make_homog(l[j][ndx2, :2].T)# switch x and y - TODO this should move elsewherefp = vstack([fp[1], fp[0], fp[2]])tp = vstack([tp[1], tp[0], tp[2]])return fp, tp# 估计单应性矩阵
model = homography.RansacModel()fp, tp = convert_points(1)
H_12 = homography.H_from_ransac(fp, tp, model)[0] # im 1 to 2fp, tp = convert_points(0)
H_01 = homography.H_from_ransac(fp, tp, model)[0] # im 0 to 1tp, fp = convert_points(2) # NB: reverse order
H_32 = homography.H_from_ransac(fp, tp, model)[0] # im 3 to 2tp, fp = convert_points(3) # NB: reverse order
H_43 = homography.H_from_ransac(fp, tp, model)[0] # im 4 to 3# 扭曲图像
delta = 2000 # for padding and translation用于填充和平移im1 = array(Image.open(imname[1]), "uint8")
im2 = array(Image.open(imname[2]), "uint8")
im_12 = warp.panorama(H_12, im1, im2, delta, delta)im1 = array(Image.open(imname[0]), "f")
im_02 = warp.panorama(dot(H_12, H_01), im1, im_12, delta, delta)im1 = array(Image.open(imname[3]), "f")
im_32 = warp.panorama(H_32, im1, im_02, delta, delta)im1 = array(Image.open(imname[4]), "f")
im_42 = warp.panorama(dot(H_32, H_43), im1, im_32, delta, 2 * delta)figure()
imshow(array(im_42, "uint8"))
axis('off')
show()
2.结果展示
固定点位拍摄实现图像拼接:
全景拼接结果:
结果分析:由于本组照片是同一角度拍摄,可以看到拼接图中有很明显的拼接缝以及错位的情况
三、实验中遇到的问题
报错:ModuleNotFoundError: No module named ‘matplotlib.delaunay’
解决方法:
全景图像拼接【计算机视觉】相关推荐
- python计算机视觉--全景图像拼接
目录 一.RANSAC算法 1.1 RANSAC算法简介 1.2 算法基本思想和流程 1.3 RANSAC求解单应性矩阵 二.图像映射与全景拼接 2.1 简介 2.2 计算第二张图像与第一张图像之间的 ...
- 计算机视觉——全景图像拼接
全景图像拼接 1.全景图像拼接 1.1 基本介绍 1.2 基本原理 1.2.1 APAP算法 1.2.2 寻找最佳拼接缝(Seam Finding) 1.2.3 图像融合(multi-band ble ...
- 计算机视觉——全景图像拼接(作业四)
文章目录 1. 基本原理 1.1 图像拼接的几何原理 1.2 2D图像变换原理 1.3 直线拟合 1.4 RANSAC算法 1.5 APAP算法 1.6 寻找最佳拼接缝(*Seam Finding*) ...
- opencv4 图像特征匹配_概述 | 全景图像拼接技术全解析
点击上方蓝字关注我们 微信公众号:OpenCV学堂 关注获取更多计算机视觉与深度学习知识 前言 图像/视频拼接的主要目的是为了解决相机视野(FOV-Field Of View)限制,生成更宽的FOV图 ...
- 概述 | 全景图像拼接技术全解析
点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 前言 图像/视频拼接的主要目的是为了解决相机视野(FOV-Fie ...
- opencv 全景 android,基于OpenCV的Android手机全景图像拼接技术研究
摘要: 21世纪是信息化时代,人们每天被各式各样的信息所包围,这些信息中90%来自于图像.在生活中很多情况下,人们需要记录某些场景,常用的工具就是相机,包括带拍照功能的智能手机.随着科技的发展,软硬件 ...
- 全景图像拼接——相机参数评估
一.项目名称:全景图像拼接 二.语言.库和开发环境:C++.opencv249.VS2013 三.参考 1:博客https://blog.csdn.net/zhaocj/article/details ...
- python 全景图像拼接( python3.6 + opencv3.4.2.16) 融合
全景图像拼接 全景图像拼接的手动实现 环境: python3.6 + opencv3.4.2.16 ## 示例图片 本次实验使用的图像拼接素材为以下三张图像: https://andreame.com ...
- 基于OpenCV全景图像拼接
本文转载基于SIFT特征的全景图像拼接http://blog.csdn.net/masibuaa/article/details/9246493 主要分为以下几个步骤: (1) 读入两张图片并分别提取 ...
最新文章
- DataFrame 拼接,筛选,修改
- 第三章 线性代数回顾-机器学习老师板书-斯坦福吴恩达教授
- asp.net viewstate 数据过大 导致错误
- 一键打造全栈式小程序开发者!
- ALSA之PCM分析
- 计算机组成原理与汇编语言参考答案,计算机组成原理与汇编语言试题及答案
- linux脚本菜鸟教程,菜鸟教程之shell _1
- 人机平台:商业未来行动路线图
- Web排行榜相关排序算法总结
- python在使用pyinstaller打包文件时提示找不到指定模块
- 淮师计算机网络题库,淮阴师范学院(淮师)计算机基础一至六章习题
- 【推荐】文婧@若凡上传的经典视频(陆续更新)
- 数据分析系列:绩效(效率)评价与python实现(层析分析、topsis、DEA)
- 在Docker中使用Oracle 18c(12.2.0.2)
- android第三方开源音频播放器,Android第三方开源SeekBarCompat:音乐类播放器等APP进度条常用...
- 把win7电脑变成无线路由器
- DevC++ 报错[Error] Id returned 1 exit status
- 现代控制理论——李雅普诺夫第一方法
- 富士胶片消毒喷雾及湿巾在日本证实可抑制新冠病毒感染
- 24位AD和16位DA超高精度PID串级控制器在张力控制中的应用