StereoDRNet:基于stereo的三维重建网络
点击上方“3D视觉工坊”,选择“星标”
干货第一时间送达
作者:红薯好吃
https://zhuanlan.zhihu.com/p/86151544
本文仅做学术分享,如有侵权,请联系删除。
论文题目:StereoDRNet: Dilated Residual Stereo Net
论文摘要:作者提出一种基于CNN的双目深度估计系统,通过双目预测到的深度图进行体积融合,从而得到场景的三维重建。作者提出的深度优化结构,产生视角连续的视差图并预测遮挡部分,这些都将帮助fusion系统进行几何连续的三维重建。在cost filtering部分作者利用3D空洞卷积获得了更好的滤波效果。该模型在KITTI2012,KITTI2015,ETH3D均达到SOTA。最后,作者证明了他们的系统产生了高质量的3D场景重建效果。
方法概括:
特征提取
采用孪生网络提取左右目图片特征,产生的特征图size为原图的1/4,通道数为32.在特征聚合这一块作者发现在这个任务中使用Vortex Pooling的效果优于SPP,故使用Vortex Pooling,如图1所示。
图1 Vortex Pooling architecture
成本项滤波
与PSM-Net的Stacked hourglass有些相似,对比PSM对应结构,作者的创新点在于使用了1,2,4三种系数的空洞卷积平行的结构。
图2 Proposed dilated cost filtering approach with residual connections
视差回归
模型的视差计算如公式(1)所示,加权候选视差。
损失函数采用Huber loss ,如公式(2)所示,
视差回归部分的损失函数,加权了成本项滤波输出的3个视差的结果,如公式(3)所示,
视差优化(划重点!!):
视差优化部分,通过引入重建误差图,几何一致误差图,和原图以及Occlusion损失的信息,来进一步优化视差,流程图如图3所示:
图3
重建误差图计算如公式(4)所示:
几何一致性误差图如公式(5)所示:
遮挡区域损失如公式(6)所示:
refinement后的视差损失公式(7)
最后,总的损失函数如公式(8)所示,其中 为第一步的视差损失, 为视差优化后的视差损失, 遮挡预测的损失。
实验结果:
SceneFlow Dataset结果如图4所示,可以看到作者提出的模型,相比PSM能够更好恢复细节信息,同时在遮挡区域中显示较低的误差。
图4
从下表中可以看到,在KITTI2012和KITTI2015数据集的在线测试中,作者提出的模型,均达到SOTA。
最后,作者利用了StereoDRNet的深度图,进行三维重建实验。从下图可以看到,StereoDRNet三维重建后的精度高于PSMNET,同时在黄色box区域取得了相比ground truth 更好的结果。
推荐阅读:
专辑|相机标定
专辑|3D点云
专辑|SLAM
专辑|深度学习与自动驾驶
专辑|结构光
专辑|事件相机
专辑|OpenCV学习
专辑|学习资源汇总
专辑|招聘与项目对接
专辑|读书笔记
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
StereoDRNet:基于stereo的三维重建网络相关推荐
- ECCV18 Oral | MVSNet: 非结构化多视点三维重建网络(高精度高效率,代码已开源)...
(欢迎关注"我爱计算机视觉"公众号,一个有价值有深度的公众号~) 编者按:本文来自ECCV2018选为Oral的论文,来自香港科技大学和Altizure公司的研究团队提出了一种既高 ...
- 基于MVS的三维重建算法学习笔记(一)— MVS三维重建概述与OpenMVS开源框架配置
基于MVS的三维重建算法学习笔记(一)- MVS三维重建概述与OpenMVS开源框架配置 声明 1. MVS(Multi-view stereo)概述 稀疏重建与稠密重建的区别 稀疏重建--SFM(S ...
- 基于MVS的三维重建算法学习笔记(五)— 立体匹配经典算法PatchMatch论文翻译及要点解读
基于MVS的三维重建算法学习笔记(五)- 立体匹配经典算法PatchMatch论文翻译及要点解读 声明 问题提出 问题建模 通过PatchMatch获取平面参数--Inference via Patc ...
- 基于slam的三维重建_实时三维重建算法的实现 基于Kinect与单目视觉SLAM的三维重建.docx...
实时三维重建算法的实现 基于Kinect与单目视觉SLAM的三维重建 实时三维重建算法的实现--基于Kinect与单目视觉SLAM的三维重建夏文玲1,顾照鹏2,杨唐胜2XIAWenling1,GUZh ...
- 基于MVS的三维重建算法学习笔记(四)— 立体匹配经典算法Semi-Global Matching(SGM)论文翻译及要点解读
基于MVS的三维重建算法学习笔记(四)- 立体匹配经典算法Semi-Global Matching(SGM)论文翻译及要点解读 声明 SGM概述 Cost Calculation(像素代价计算)--M ...
- 深度学习(二十八)基于多尺度深度网络的单幅图像深度估计
基于多尺度深度网络的单幅图像深度估计 原文地址:http://blog.csdn.net/hjimce/article/details/50569474 作者:hjimce 一.相关理论 本篇博文主要 ...
- 用C#实现基于TCP协议的网络通讯
TCP协议是一个基本的网络协议,基本上所有的网络服务都是基于TCP协议的,如HTTP,FTP等等,所以要了解网络编程就必须了解基于TCP协议的编程.然而TCP协议是一个庞杂的体系,要彻底的弄清楚它的实 ...
- 基于交换技术的网络中,全双工主要运行在?( 内有答案与详解)
基于交换技术的网络中,全双工主要运行在?( ) A. 站点与站点之间 B. 交换机与服务器之间 C. 站点与服务器之间 D. 站点与交换机之间 答案: b 网站就是站点的意思,交换机实际是与数据打交道 ...
- 《中国人工智能学会通讯》——第3章 3.1基于深度学习的网络表示研究进展
第3章 3.1基于深度学习的网络表示研究进展 网络结构在现实世界中无处不在(如航线网络.通信网络.论文引用网络.世界万维网和社交网络等),在此基础之上的应用和研究问题受到了学术界和工业界的广泛关注,这 ...
最新文章
- Spark中的内存计算是什么?
- python修改excel数据-python之实现对excel表格数据的修改
- 列宽一字符等于多少厘米_字符串匹配算法总结——BF、KMP、BM
- python内置装饰器property_python之内置装饰器(property/staticmethod/classmethod)
- access统计没有选课的人数_当代大学生发愁求职就业,更发愁“选课”,自主选课变成了负担...
- Docker入门之常用命令
- error: expected constructor, destructor, or typ...
- 华为存储认证怎么样?华为存储认证题库哪里有?
- gauscoor软件怎么用_比对软件STAR的简单使用
- Python的学习笔记案例4--52周存钱挑战3.0
- C语言经典编程100题
- 【FoxMail】无法登录, 一直让创建问题.
- Django(wsgi,middleware,url源码剖析)
- echarts:legend调整
- android gradle lint,Android Lint
- C++ 多线程的创建和使用
- Acwing春季每日一题 混合牛奶(朴素做法和优化做法)
- 徽章系列3: Travis CI 的使用
- Qualcomm 处理器 Krait架构
- C++-顺序栈实现10进制转换为2、8、16进制(详细)