点击我爱计算机视觉标星,更快获取CVML新技术


机器之心发布

作者:Rui Shen、Songfang Han、Jing Xu、Hao Su

本文介绍了一种基于点云的 MVS 神经网络框架 PointMVSNet。通过对场景的点云进行处理,融合三维深度和二维纹理信息,提高了点云重建的精度。论文作者来自清华、港科大、加州大学圣地亚哥分校等,已被 ICCV 2019 大会接收。

背景

多视角三维重建(MVS)是计算机领域的一项基础任务,目标是通过相机拍摄的图像和相机参数推导出现实环境中物体的三维信息。

不同角度拍摄的图像会存在一些公共部分,合理分析并利用不同图像的关联是三维重建的基础。

近年来,基于深度学习的一系列研究在该任务上取得了卓越的成绩,受到广泛关注。然而,现有的方法需要在相机参考空间或物体空间构建一个三维卷积网络。

这个三维卷积网络会随着场景精细度的增加而显著增加。现有方法的主要瓶颈在于空间复杂度和时间复杂度。

为了解决这一瓶颈,本文介绍了一种全新的基于点云的 MVS 神经网络框架 PointMVSNet。区别于之前的深度学习方法,该网络直接将目标场景作为点云进行处理,而不是整个三维空间,从而降低了网络复杂度。

该方法首先生成粗粒度的深度图,通过相机参数转化成初始点云。在这组初始点云上估计当前深度图与真实深度图之间的残差,从而对点云迭代优化。

该方法将二维纹理信息与三维几何信息进行融合,生成特征增强的点云,并迭代更新点云位置。实验证明,该基于点云的网络结构可以达到更高的精度,计算效率与灵活性。

  • 项目链接:

    http://hansf.me/projects/PMVSNet/

  • 论文链接:

    https://arxiv.org/pdf/1908.04422.pdf

  • 代码链接:

    https://github.com/callmeray/PointMVSNet

方法

本文中,我们创新性地提出了基于三维点云的多视角三维重建神经网络结构 PointMVSNet。首先,我们用现有的方法生成一个初始粗粒度点云。

之后,利用我们所提出的 PointFlow 模块作用于点云以及点云附近的局部区域优化。点云特征包含从图像多尺度二维神经网络中提取的纹理特征和从点云中提取的几何特征。

PointFlow 模块会通过这些特征优化点云位置。这个优化过程会经过几次迭代,每次迭代都会更新点云特征,以获得更准确的位置预测。

图像特征提取

高质量的纹理特征对于 MVS 具有重要意义。因此我们选择采用图像金字塔网络,并融合不同尺度的纹理特征。

之后,我们利用动态特征提取从图像金字塔网络中提取三维点云中每个点在各视角图像中的纹理特征,构建特征增强点云。

值得注意的是,这一步骤与基于 cost volume 的网络结构存在显著区别,其中基于 cost volume 的方法中每个体素所对应的图像特征由其空间划分所确定并无法改变,而这里我们方法会根据更新后的点云位置动态从图像中提取纹理特征,因此可以集中于图像中感兴趣的区域。

PointFlow 

为了使网络更好地更新点云位置,我们提出使用猜想点辅助网络预测。如上图所示,对于点云中的每一个点,我们沿着相机方向采样等步长的若干猜想点。

为预测每个点的三维位移,我们利用 EdgeConv 处理由猜想点所构成的特征增强三维点云,学习猜想点的概率分布,将猜想点的期望位移作为每个点的预测位移。

相比于简单的点云神经网络,EdgeConv 利用图神经网络将邻域的三维结构信息用于点云中各点间的特征传播,可以更有效的传播有效信息。

PointFlow 可以迭代地作用于更新的三维点云,从而逐步优化点云位置,以达到更好的预测效果。

实验结果

首先是 PointMVSNet 在 DTU 数据集上重建结果,这里对比了现有的传统算法和深度学习算法。可以看出,PointMVSNet 取得了更好的重建完整度和整体效果。

下图展示了 MVSNet, PointMVSNet 的重建效果。第一行是点云图,第二行展示了局部区域法向量图。可以看出 PointMVSNet 重建效果更加锐利,细节更好。

接下是 PointMVSNet 和 MVSNet 的计算效率比较,见下表。通过改变 PointFlow 迭代次数,PointMVSNet 可以在高效与高精度之间灵活选择。

此外,PointMVSNet 的显存使用效率高于 MVSNet, 能在同样的显存使用下生成更高分辨率的深度图像。

最后我们展示了基于点云的三维重建网络的灵活性。如下图所示,我们可以选择进行仅优化我们所感兴趣区域的点云,从而节约不必要的计算。


三维重建交流群

关注最新最前沿的三维重建技术,欢迎加入专属交流群,扫码添加CV君拉你入群,(如已为CV君好友请直接私信)

(请务必注明:三维重建

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


长按关注我爱计算机视觉

ICCV 2019 | 清华等联合提出高精度、高效率点云3D重建网络框架PointMVSNet相关推荐

  1. ICCV 2019 | 旷视研究院提出文字检测新方法:像素聚合网络PAN

    本文介绍ICCV 2019 旷视研究院提出任意形状文字检测模型:像素聚合网络 PAN,它考虑了任意文字识别过程中速度与精度的权衡,在大幅提升识别性能的同时也显著降低了计算量,成为当前该领域最佳方法. ...

  2. ICCV 2019 | 爱奇艺提出半监督损失函数,利用无标签数据优化人脸识别模型

    点击我爱计算机视觉标星,更快获取CVML新技术 论文发表于ICCV 2019 作者 | 爱奇艺技术产品团队 编辑 | 唐里 论文标题:Unknown Identity Rejection Loss: ...

  3. ICCV 2019 | 上海交大MVIG团队提出InstaBoost,换个dataloader函数, COCO提升3mAP

    点击我爱计算机视觉标星,更快获取CVML新技术 机器之心发布 机器之心编辑部 近年来最新的一系列实例分割模型,例如 Mask R-CNN 等,其高准确度很大程度上依赖于大量的训练数据(COCO 数据集 ...

  4. ICCV 2019 Oral | 解读北大提出的期望最大化注意力网络EMANet

    点击我爱计算机视觉标星,更快获取CVML新技术 本文经机器之心(微信公众号:almosthuman2014)授权转载,禁止二次转载. 导读:本文作者为52CV分割群里一位技术大佬,论文中将期望最大化机 ...

  5. 重磅!ICCV 2019 COCO + Mapillary 联合识别挑战赛开启!

    点击我爱计算机视觉标星,更快获取CVML新技术 ICCV 2019 最值得期待的挑战赛 -- COCO + Mapillary Joint Recognition Challenge Workshop ...

  6. ICCV 2019 | ActivityNet 挑战赛冠军方案—时序动作提名,边界匹配网络详解

    点击我爱计算机视觉标星,更快获取CVML新技术 本文作者为百度视觉技术部林天威,转载自知乎Video Analysis 论文笔记专栏: https://zhuanlan.zhihu.com/p/754 ...

  7. ICCV 2021 Oral | 无需法向的大场景点云表面重建

    编辑丨CVer 论文链接:https://arxiv.org/abs/2105.03582 代码已开源在github: https://github.com/tangjiapeng/SA-ConvON ...

  8. 点云的密度 曝光时间_200倍的提速!华人博士生提出大场景三维点云语义分割新框架...

    [新智元导读]今天分享一篇被今年CVPR接收的论文.该文提出的算法可以高效处理百万量级的点组成的大场景3D点云,同时计算效率高.内存占用少,能直接处理大规模点云,不需要复杂的预处理/后处理,比基于图的 ...

  9. 14.7倍推理加速、18.9倍存储节省!北航、商汤、UCSD提出首个点云二值网络 | ICLR 2021...

    允中 编辑整理 量子位 报道 | 公众号 QbitAI 编者按: 无论是在自动驾驶场景中,还是在手持移动设备上,基于点云的深度学习模型应用越来越广泛. 但这些离线边缘场景自身的限制,给模型的推理.存储 ...

最新文章

  1. Android笔记(adb命令--reboot loader)
  2. 一个可以实现图片格式相互转化的工具convert_picture.exe
  3. idea springboot配置外置tomcat好处
  4. mybatis之动态SQL操作之查询
  5. python sub 第三次_Python学习的第三次的总结
  6. android gridview滑动监听,Android GridView 滑动条设置一直显示状态(推荐)
  7. 兼容性测试中如何切换和管理多个JDK版本
  8. spring简易学习笔记三(AOP)
  9. linux mysql驱动在哪_MySQL驱动使用方法
  10. 【读书笔记】IOS帝国-Apple Ⅱ/Mac/皮克斯/iPod/iTunes/iPhone/App Store/iPad,苹果教父:史蒂夫·乔布斯传_2020.02.15
  11. MATLAB基础篇——线性代数应用
  12. MXF到MP4转换器:如何轻松地将MXF转换成MP4
  13. 11计算机专业vb试题答案,西华师范大学计算机VB试题及答案11
  14. 小程序场景二维码扫码
  15. 基础算法练习200题07、编框
  16. 浏览器饿了么cookie提取
  17. linux取证——基础取证命令集合
  18. 微信php视频怎么变成mp4,缓存下来的视频如何变成mp4格式?
  19. 怎样用VR看分频视频?
  20. 大数据学习——hive阶段:启动HiveServer2启动报TezConfiguration类NoClassDefFoundError错误

热门文章

  1. Golang笔记——go使用Redis
  2. 设计模式学习笔记——桥接(Bridge)模式
  3. anguarjs 上传图片预览_前端图片上传那些事儿
  4. 计算机教育类会议论文,中国教育和科研网(CERNET)第七届学术会议征集论文通知...
  5. oracle10g自带的公共同义词,Oracle10g实战教程第07讲视图、同义词、序列
  6. linux修改非root用户密码永不过期
  7. python程序发布 ubuntu_发布和运行(ubuntu下python服务器)
  8. 【架构设计】Android:配置式金字塔架构
  9. PowerShell-将CSV导入SQL Server
  10. Struts2源码学习(一)——Struts2中的XWork容器