Date:2020-11-25
作者:Shelo
来源:3D视觉工坊

论文题目:Pyramid Multi-view Stereo Net with Self-adaptive View Aggregation

论文链接:https://arxiv.org/pdf/1912.03001.pdf

图1 PVS-MVSNet重建结果

PVA-MVSNet是ECCV2020的一篇文章,该文章在基于深度学习的MVS问题上,针对代价体和深度图优化方式进行了改进,减少了代价体运算所消耗的运算内存,同时大大提升了重建模型的完整度。效果如图1所示。

1. 概述

PVA-MVSNet是继MVSNet之后,基于MVSNet提出的一种新的解决多视角立体匹配问题的方法。该方法优化了代价体的计算方法并且引入了新的深度图聚合结构,从而提高了重建点云的完整度和准确性。该方法在DTU数据集上进行训练,在Tanks&Temples数据集上进行测试,取得了非常可观的结果。

该方法提出了的PVA-MVSNet结构,该结构提出了使用多度量的金字塔深度图聚合方法来解决传统方法中textureless region部分的精度和完整度不高的问题。同时,该方法提出了VA-MVSNet,其中引入了注意力机制,加入自适应的元素的视图聚合模块,来灵活代替不同视角图像,选择出相对更重要的信息。

2.PVA-MVSNet结构

2.1 VA-MVSNet结构

图2. VA-MVSNet结构

如图2所示,VA-Net首先通过若干2D CNN来提取输入图像的特征,然后使用类似于MVSNet中的可微单应性方法来形成多个特征的平面扫描特征体。这些特整体通过本问题出的自适应元素的聚合模块形成不同尺度的代价体,最终,深度图会通过一种从粗到精的方式从不同尺度的代价体中预测和完善。

Loss方程:

使用了类似于MVSNet中的多尺度训练loss结构。采用平均绝对误差的方式来衡量。公式如下,不再赘述。

公式1 Loss方程

2.2 自适应元素的聚合模块

自适应元素聚合模块分为两种,一种是像素的聚合,一种是体素的聚合。

关于像素的聚合,文章中提到引用了一种选择加权注意图。在聚合代价体时,将通过对应的权重图进行加权平均。具体公式如下:

公式2 像素尺度聚合公式

其中w,h,w就是权重图,是通过weightnet学习得到的。weightnet由若干2DCNN和ResNet组成,以挤压的2D特征作为输入,公式如下:

公式3 权重图的计算

关于体素的聚合,则认为不同深度层假设d的每个像素应该被区别对待,其中三维特征体中的每个体素学习自己的重要性。类似的也是通过weightnet-3D来学习权重,然后加权平均。公式如下:

公式4 体素尺度聚合公式

2.3 由粗到细的深度估计

在上一步中,得到了几个不同尺度的代价体,这一步中,使用类似于DeepMVS中plane-sweep的方法,使用不同的代价体对深度图进行不断优化,同时使用一个编码解码的3DCNN和argmin操作得到预测的概率图,如图3所示。

图3 由粗到细的深度图优化

2.4 PVA-MVSNet结构

图4 PVA-MVSNet

除了VA-MVS,本文还使用了PVA-MVSNet结构(如图4所示)来最终优化最终深度图的质量和点云的质量。如图所示,输入图片被下采样后并行送入VA-MVSNet,得到了几组对应的的不同大小的深度图和概率图。这些不同大小的深度图和概率图,经过文章中提出的多度量金字塔深度图聚合方法,得到最终优化的深度图和概率图,通过过滤和融合得到最终的点云。

图5多尺度金字塔深度图优化方式

其中多度量金字塔深度图聚合方式(如图5所示),是指用低分辨率的深度图中可信度高的部分来代替高分辨率深度图中可信度低的部分,来代替重建过程中产生的错误匹配来达到优化深度图的效果。

3. 总结

表1 定量结果统计

从结果上来看,PVA-MVANet再准确率上取得了和MVSNet稍好一点点的成绩,但是在模型完整度上有了很大的提升。

更多干货

欢迎加入【3D视觉工坊】交流群,方向涉及3D视觉、计算机视觉、深度学习、vSLAM、激光SLAM、立体视觉、自动驾驶、点云处理、三维重建、多视图几何、结构光、多传感器融合、VR/AR、学术交流、求职交流等。工坊致力于干货输出,为3D领域贡献自己的力量!欢迎大家一起交流成长~

添加小助手微信:CV_LAB,备注学校/公司+姓名+研究方向即可加入工坊一起学习进步。

计算机视觉中的多视图几何 pdf_多视图立体匹配论文解析:PVA-MVSNet相关推荐

  1. 计算机视觉——多视图几何

    多视图几何 1.前言 1.1 多视图几何概念 2. 基本原理 2.1 对极几何 2.2 基础矩阵 2.2.1 基础矩阵推导 2.2.2 求解基础矩阵 3. 实验过程 3.1 实验数据准备 3.2 基础 ...

  2. 计算机视觉中的多视图几何_基于深度学习的视觉三维重建研究总结

    三维重建意义 三维重建作为环境感知的关键技术之一,可用于自动驾驶.虚拟现实.运动目标监测.行为分析.安防监控和重点人群监护等.现在每个人都在研究识别,但识别只是计算机视觉的一部分.真正意义上的计算机视 ...

  3. 《计算机视觉中的多视图几何》笔记(一)有限射影摄像机

    目录 前言 1.二维射影几何与变换 1.1数学基础 1.2射影变换 2.有限射影摄像机 2.1有限摄像机模型 2.2射影摄像机的几何含义 2.3射影摄像机对点的作用 2.3.1点对射线的反向投影 2. ...

  4. 计算机视觉中的多视图几何<Part0—基础知识:射影几何、变换和估计>(1)

    1. 2D射影几何和变换 射影几何的概念和表示法是多视图几何分析的核心,使用齐次坐标就能用线性矩阵方程来表示非线性映射(例如透视投影):主要目的是为了从透视图像中恢复仿射和度量性质. 1.1 平面几何 ...

  5. 超详细的计算机视觉学习书籍pdf汇总(涉及CV、深度学习、多视图几何、SLAM、点云处理等)

    计算机视觉入门的一些pdf书籍,[计算机视觉工坊]按照不同领域帮大家划分了下,涉及深度学习基础.目标检测.Opencv.SLAM.点云.多视图集合.三维重建等~ 计算机视觉 1. 计算机视觉算法与应用 ...

  6. 计算机视觉编程——多视图几何

    文章目录 多视图几何 1 外极几何 1.1 一个简单的数据集 1.2 用Matplotlib绘制三维数据 1.3 计算F:八点法 1.4 外极点和外极线 2 照相机和三维结构的计算 2.1 三角剖分 ...

  7. 多视图几何中的三维重建

    1. 简介 资料来源为: 1)B站多视图几何三维重建视频讲解:https://www.bilibili.com/video/BV1Sj411f73e 2)武汉大学摄影测量与遥感专业博士李迎松的CSDN ...

  8. 计算机视觉学习7_多视图几何_基础矩阵

    文章目录 对极几何 本质矩阵(Essentical Matrix) 基本矩阵(Fundamental Matrix) 8点算法估算基础矩阵F 实现代码 实现结果 三维重建 对极几何 多视图几何是利用在 ...

  9. 计算机视觉学习第5章——多视图几何

    目录 一. 外极几何 1.1 简单数据集 1.2 用Matplotlib绘制三维数据 1.3 计算F:八点法 1.4 外极点和外极线 二.照相机和三维结构的计算 2.1 三角部分 2.2 由三维点计算 ...

最新文章

  1. pandas使用apply函数和lambda函数、把所有行指定的数据列进行相加(use apply and lambda to add value in dataframe rows)
  2. 2019年度最全IT吃瓜指南
  3. C#开发中关于加密解密字符串的使用方法
  4. 华中科大提出EAT-NAS方法:提升大规模神经模型搜索速度
  5. 进程与线程||线程应用:异步调用||多线程与单线程
  6. linux创建 / 删除用户及用户管理
  7. jquery 上传图片 java_jquery 异步提交表单 上传图片小例子
  8. Python subprocess命令行中文乱码
  9. layui响应式:隐藏与显示(class 类名后缀)
  10. python两个基本的库管理工具_Python多版本共存管理工具之pyenv
  11. SNMP原理及常用配置命令
  12. 线性基——数集压缩自动机
  13. Atitit 泛型的知识点 目录 1. 为什么需要泛型 why 2 2. 定义分类 what 2 2.1. 编辑类型参数 2 2.2. 模板 2 2.3. 简单理解 占位符 代替object、 3
  14. iOS测试包安装途径实践
  15. C语言编程>第十六周 ① 给定程序的功能是求1/4的圆周长。函数通过形参得到圆的直径,函数返回1/4的圆周长(圆周长公式为:L=Πd,在程序中定义的变量名要与公式的变量相同)。
  16. Fisher exact test费雪精确检验
  17. 黑晓军 华中科技大学 博士 副教授
  18. 【X86】---关于Intel芯片架构的发展史
  19. 谷歌打不开了吧,访问谷歌镜像Glgoo.com吧_我是亲民_新浪博客
  20. 2022年csdn最全的Python练手经典趣味编程100例(部分

热门文章

  1. 如何把mkv格式转换成mp4?教你无损转换mkv格式的方法
  2. ArcGIS Runtime SDK for .NET 100.0中如何执行.gpk(一)
  3. 2009年8月手机搜索热门关键词排行榜
  4. win10切换输入法快捷键_win10切换输入法的方法教程
  5. Centos 7配置防火墙
  6. .NET 数据访问架构指南
  7. drools规则引擎可视化_一文看懂开源工作流引擎 Flowable「转」
  8. mysql function 创建临时表_sql如何创建临时表
  9. 最新织梦DEDECMS全站目录化伪静态设置(网址和生成静态地址一样、电脑和手机访问地址也一样)
  10. 计算机组成原理中流水线的极,6计算机组成原理第6章流水线原理.ppt