计算机视觉是一门研究使用计算机来模拟人的视觉系统的学科。“一图胜千言”,人类对于图像中的信息感知效率远超文字等其他媒介,人类获取的信息总量中更是有高达80%依靠视觉系统[1]。相对于人类高效的图像信息提取能力,计算机在图像信息的理解上仍然效率低下。

计算机视觉作为一门交叉学科,综合了生物学,心理学,数学,计算机科学等学科,从20世纪60年代至今其在科学研究领域中的大量成果已经应用于工程领域,并影响了我们每个人生活的方方面面。

双目立体视觉是计算机视觉领域的重要分支,它通过模拟人的视觉系统来处理现实世界。以机器人,无人汽车导航为例,由于双目立体匹配在非接触测量中的优秀性能,视觉测量在探月工程,火星探测工程中起到了重要作用[2],如图所示的我国嫦娥探月工程的巡航车就配备了立体视觉导航系统,来进行行进间的运动控制和路径规划[3]。

1.1 研究背景与意义

立体匹配是一种从平面图像中恢复深度信息的技术。由于双目立体匹配系统通过模拟人眼视觉感知原理,仅需要两台数字摄像机安装在同一水平线上,经过立体矫正就可以投入使用。具有实现简单,成本低廉,并且可以在非接触条件下测量距离等优点。在机器人制导系统中可以用于导航判断、目标拾取,在工业自动化控制系统中可用于零部件安装、质量检测,环境检测,在安防监控系统中可用于人流检测,危害报警。

近年来,随着社会的科技进步,立体匹配技术的发展日新月异,随着匹配算法精度与速度的提高,其应用场景进一步扩大。在此背景下,研究立体匹配变的意义非凡。

立体匹配作为三维重建、立体导航、非接触测距等技术的关键步骤通过匹配两幅或者多幅图像来获取深度信息。并且广泛应用于,工业生产自动化、流水线控制、无人驾驶汽车(测距,导航)、安防监控、遥感图像分析、机器人智能控制等方面。虽然立体匹配应用广泛但是还有很多尚未解决的难题因此该技术成为了近年来计算机视觉领域广泛关注的难点和热点。

立体匹配作为一种工程化问题,在实施过程中有多种因素影响其精度与速度,并没有一种复杂算法可以完整的处理立体匹配的整个流程,本文所述算法主要针对立体匹配中图像像素匹配并计算视差这一核心步骤。

通常根据立体匹配算法所采用的约束,可以将其分为两大类算法[5]:

第一类为基于区域约束的局部匹配算法。如采用匹配窗的代价聚合算法(平方差算法SSD,绝对差算法SAD,归一化算法NCC等);采用特征点的匹配算法;采用相位匹配的的匹配算法。这些算法的优点是运算速度快,能够快速恢复出纹理丰富区域的视差。缺点是在低纹理区域会造成误匹配[6],得到的视差图不致密,需要在后期通过插值算法来进行修正。

第二类为基于全局约束的优化算法,如图割算法(Graph Cuts, GC),人工智能算法(神经网络,遗传算法),置信传播算法(Belief Propagation, BP),动态规划算法(Dynamic Programming, DP)。这些算法虽然运算时间较长并且会产生一些误匹配,但是基本上能够获得所有的视差信息从而生成稠密的视差图。

1.2 国内外研究现状

国外在计算机立体视觉上的研究开展较早,Roy[7]最早将图割算法应用于立体匹配,并通过实验表明,图割算法能有效克服其他全局优化算法的缺点(如动态规划算法等生成视差图产生的横向条纹瑕疵),避免了视差在临近极线处不连续的问题。但该算法生成的视差图轮廓边缘模糊,视差层的区分度低。Geiger等[8],针对高分辨率图像立体匹配运算时间长的问题,创造性的提出了使用强约束点(纹理或特征信息较为丰富)作为支撑点,在强约束点之间通过三角剖分对视差图进行插值计算,结合OpenMP技术在通用CPU上实现了并行计算,操作简单易于搭建环境,在通用微型计算机上实现了实时立体匹配,但是匹配效果和基于全局优化的匹配算法有一定差距。

国内对于立体视觉的研究起步较晚,早期主要采用基于特征点匹配的方法,随着技术的进步,后序对立体匹配的改进工作主要集中在对全局优化算法性能和准确度的提升上。其中大部分方法采用对待匹配图像进行图像分割后,再结合能量最优化的方法进行立体匹配。如尹等[9]采用均值平移算法将参考图像根据颜色信息快速聚类;之后计算初始视差图;将分割结果作为能量视差函数的一个参考项;最后采用图割算法求取使全局能量最小的视差最优分配。此种基于图像分割的立体匹配方法的理论基础认为,分割区域块内的视差变化是平滑的。因此与其他基于图像分割的立体匹配算法相比,此类算法[9]可有效地处理大块低纹理区域,匹配精度高,更有利于估计视差图的边界。并且上述算法通过分割减少了匹配基元,使得运算速度更快,能够很好的解决的边界模糊和低纹理区域的误匹配问题。

立体匹配技术的应用十分广泛,王等[6]改进了勇气号机遇号火星车复杂的定位技术,在嫦娥3号月面巡航器的视觉导航系统中,将SIFT(scale-invariant feature transform) 匹配、相关系数匹配、最小二乘匹配和光束法平差等多项技术融合, 实现了相邻站间月面巡视器的导航定位. 实验表明视觉定位相对精度优于4%。

朱[8]针对工件的自动定位、识别与抓取等问题,使用立体视觉的方法进行工件识别的定位;对图像就行SIFT特征提取,并采用模板匹配方法实现工件的识别。用形态学方法获得工件特征点的二维信息,结合双目立体视觉标定技术得到工件的三维坐标,为机器人抓取工件提供信息。

顾等[9]为实现统计实时人流,提出一种基于立体视觉的人头检测算法。该方法对双目相机采集的图像通过运动目标检测分离出运动人员所在区域,利用视差的连续性只对强纹理点进行绝对误差累积(SAD)匹配,其余点只进视差验证,因此能够得到稠密的视差图,再由三角投影关系计算出深度图。由于双目立体成像得到的深度图中人员与场景的深度分布不同,采用深度分层的方法将存在人头信息的深度层提取出来,并通过几何形态来确定人头,该算法可以很好地适应复杂场景下的人头检测,精度高、速度快。

Yang等[11],提出了采用全局最小生成树的代价聚合方案,像素间的相似性作为边的权值,通过无向连通图构建最小生成树,使得局部像素点获取了全局的信息。解决了低纹理区域的误匹配问题。(实际为对局部窗匹配算法的改进。),针对采集的待匹配图像可能带有噪声或者复杂纹理的问题,该团队进行了系统化流程的设计改进[14]。

顾等[11]为实现统计实时人流,提出一种基于立体视觉的人头检测算法。该方法对双目相机采集的图像通过运动目标检测分离出运动人员所在区域,利用视差的连续性只对强纹理点进行绝对误差累积(SAD)匹配,其余点只进行视差验证,因此能够得到稠密的视差图,再由三角投影关系计算出深度图。由于双目立体成像得到的深度图中人员与场景的深度分布不同,采用深度分层的方法将存在人头信息的深度层提取出来,并通过几何形态来确定人的头部,该算法可以很好地适应复杂场景下的人头检测,并且由于采用了基于局部优化的匹配算法结合插值计算等手段所以其在精度、速度上都有很好的实时特性。

Yang等[12],提出了基于最小生成树的代价聚合方案,采用像素间的相似性作为边的权值,通过无向连通图构建最小生成树,使得局部像素点获取了全局的信息。解决了低纹理区域的误匹配问题。针对采集的待匹配图像可能带有噪声或者复杂纹理的问题,Yang等在上述算法的基础上进行了系统化的流程设计与改进[13],利用左右交叉检验精确更新代价聚合中稳定和不稳定的点的代价,提升了算法精度。

立体匹配算法的改进,近年来主要围绕如何快速获取稠密视差图以及将匹配算法并行化,Yang等[12][13],利用保边滤波器的性质并加以改进,融合并行计算技术,分别用导向滤波器和双边滤波器,针对局部匹配算法和全局匹配算法提出了工程化系统化的立体匹配并行流程方法。

ppt下载:立体匹配基础

参考文献

[1]马颂德,张正友. 计算机视觉—计算理论与算法基础[M].北京:科学出版社,1997.

[2]邸凯昌. 勇气号和机遇号火星车定位方法评述[J]. 航天器工程, 2009, 18(5):1-5.

[3]吴伟仁, 王大轶, 邢琰,等. 月球车巡视探测的双目视觉里程算法与实验研究[J]. 中国科学:信息科学, 2011(12):1415-1422.

[4]王保丰, 周建亮, 唐歌实,等. 嫦娥三号巡视器视觉定位方法[J]. 中国科学:信息科学, 2014, 04期(04):452-460.

[5]白明, 庄严, 王伟. 双目立体匹配算法的研究与进展[J]. 控制与决策, 2008, 23(7):721-729. DOI:doi:10.3321/j.issn:1001-0920.2008.07.001.

[6]张令涛, 曲道奎, 徐方. 一种基于图割的改进立体匹配算法[J]. 机器人, 2010, 32(1):104-108.

[7]Roy S, Cox I J. A maximum-flow formulation of the n-camera stereo correspondence problem[A]// IEEE International Conference on Computer Vision[A], 1998 January 4-7, Bombay India:492-499.

[8]Geiger A, Roser M, Urtasun R. Efficient large-scale stereo matching[M]//Computer Vision–ACCV 2010. Springer Berlin Heidelberg, 2011: 25-38.

[9]尹传历, 刘冬梅, 宋建中. 改进的基于图像分割的立体匹配算法[J]. 计算机辅助设计与图形学学报, 2008, 20(6):808-812.

[10]朱代先. 基于双目视觉的工件定位与抓取研究[J]. 计算机测量与控制, 2015, 19(1):92-94.

[11]顾骋, 钱惟贤, 陈钱,等. 基于双目立体视觉的快速人头检测方法[J]. 中国激光, 2014, 01期(01):150-155.

[12]Yang Q. A non-local cost aggregation method for stereo matching[C]// Proceedings / CVPR, IEEE Computer Society Conference on Computer Vision and Pattern Recognition. IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2012:1402-1409.

[13]Yang Q. Stereo Matching Using Tree Filtering[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015, 37(4):834-846.

[14]Yang Q. Hardware-efficient bilateral filtering for stereo matching[J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2014, 36(5): 1026-1032.

[15]Yang Q, Li D, Wang L, et al. Full-Image Guided Filtering for Fast Stereo Matching[J]. IEEE Signal Processing Letters, 2013, 20(3):237-240.

[16]Yang Q, Ji P, Li D, et al. Fast stereo matching using adaptive guided filtering[J]. Image and Vision Computing, 2014, 32(3): 202-211.

论文资源合集

python研究背景与意义_立体匹配的研究背景以及意义相关推荐

  1. python研究背景和意义_课题设计研究的背景和意义

    资料 一.课题研究的目标 1 .通过研究,促进教师和家长转变教育观念,使教师既会教书, 更会育人:使家长懂得"养"与"育"并重. 2 .拓展课堂德育模式,优化家 ...

  2. python对于会计的好处_学好会计学的作用及意义

    学好会计学的作用及意义 学习会计学已经有三个月了,虽然大致了解了这门课程所涉及的内容及结构框架,但 目前还是处于入门状态. 会计源远流长, 是为了适应社会生产发展和加强经济管理. 提高经 济效益的需要 ...

  3. python背景图颜色_更改特定子图背景颜色(饼图外部)

    默认情况下,饼图的完整轴为"关闭".您可以使用frame参数来设置它.在ax.pie(..., frame=True) 这会在轴上产生记号和记号标签,因此,最好将其设置在外部 ^{ ...

  4. python玫瑰花数量的含义_玫瑰花的数量代表的意义

    1朵:一见钟情     我的心中只有你 ONLY YOU 2朵:你侬我侬     这世界只有我俩 3朵:我爱你 4朵:似曾相识      至死不渝 5朵:无悔           由衷欣赏 6朵:顺利 ...

  5. 点线面的意义_点线面在绘画中的意义

    论绘画中的点线面 龙源期刊网 http://www.qikan.com.cn 论绘画中的点线面 作者:郭俣 来源:<文艺生活· 文海艺苑>2014 年第 08 期 摘 要:艺术工作者应该给 ...

  6. 参与社团活动的意义_大学参加社团活动有意义吗?

    没什么太大的意义! 这种社团活动能让你在你以后的求职简历里添上一个"ⅹⅹ社团积极分子"!?能有啥用. 说是"拓宽人脉,拓展思维".一群人天天开毫无意义的会议,做 ...

  7. 副驾驶的意义_副驾驶对女人的意义

    对于一些乘车的礼仪很多人是有所了解的,但是现实中有时候讲礼貌却有可能出问题,尤其是驾驶员有女朋友或妻子的情况下,女性朋友该出于礼貌坐副驾,还是该避嫌坐后座呢? 副驾驶对女人的意义: 副驾驶对女人来说, ...

  8. 堆密度测定的意义_测定石油产品密度有何意义

    测定石油产品密度有何意义 ( 1 )用于油品的计量 对于容器中的石油产品的计量,都是先测出容积 V 和密度 ρ ,然后根据容积和密度的乘积,计算 出石油产品的质量. ( 2 )用于指导生产 密度的大小 ...

  9. html缩放背景不缩放_如何将缩放背景更改为有趣的照片或视频

    html缩放背景不缩放 People often use Zoom for work and conference calls, but it doesn't have to be all work ...

  10. 副驾驶的意义_副驾驶对女人的意义是什么样的?

    展开全部 副驾驶对女人来说,62616964757a686964616fe59b9ee7ad9431333433616230是一个宣誓对男人拥有主权的位置. 这是个敏感又危险的位置,副驾驶是整辆车座位 ...

最新文章

  1. unity 200.8m yoy_专场分享会|大会最新Unity、中创文旅专场预告来啦!
  2. MIC4680-5.0YM-TR详细资料
  3. WPF xaml中列表依赖属性的定义
  4. python字典 items函数
  5. xiaocms php,XiaoCms PHP企业网站模板, ,后台可备份 WEB(ASP,PHP,...) 238万源代码下载- www.pudn.com...
  6. 注解版poi操作工具
  7. 数据结构 7-0 查找
  8. 微信开发之百度地图API学习(一)
  9. 微信小程序 选择器 picker ;demo大全附效果图
  10. 格(Lattice)基础(一)
  11. 百练 / 2016计算机学科夏令营上机考试: E
  12. 杂项-DB:DW/DWH(数据仓库)
  13. 谈谈百度/GOOGLE联盟和一般联盟的区别
  14. “基于485总线的评分系统”
  15. 2021年3月16刚进新公司做了四天就被劝退
  16. 太阳能手机充电器设计
  17. OrientDB 图状数据库示例
  18. rabbitmq在centos7下安装
  19. oracle怎么exp怎么用,怎样在Oracle中使用EXP进行逻辑备份?
  20. 这款国产良心软件正式开源!

热门文章

  1. linux配置ssh免密码登录
  2. 白盒测试实践作业进度报告——Day 3
  3. bzoj 4556 字符串
  4. mysql 定位字符串的位置
  5. Tip: JSP开发模式
  6. redis安装部署(1)
  7. Win7 开启远程桌面
  8. hudson构建配置
  9. 工作流入门比较经典的文献
  10. h5页面编写注意事项,自己遇到的小问题。