点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

作者:红薯好吃

https://zhuanlan.zhihu.com/p/86151544

本文仅做学术分享,如有侵权,请联系删除。

论文题目:StereoDRNet: Dilated Residual Stereo Net

论文摘要:作者提出一种基于CNN的双目深度估计系统,通过双目预测到的深度图进行体积融合,从而得到场景的三维重建。作者提出的深度优化结构,产生视角连续的视差图并预测遮挡部分,这些都将帮助fusion系统进行几何连续的三维重建。在cost filtering部分作者利用3D空洞卷积获得了更好的滤波效果。该模型在KITTI2012,KITTI2015,ETH3D均达到SOTA。最后,作者证明了他们的系统产生了高质量的3D场景重建效果。

方法概括:

特征提取

采用孪生网络提取左右目图片特征,产生的特征图size为原图的1/4,通道数为32.在特征聚合这一块作者发现在这个任务中使用Vortex Pooling的效果优于SPP,故使用Vortex Pooling,如图1所示。

图1 Vortex Pooling architecture

成本项滤波

与PSM-Net的Stacked hourglass有些相似,对比PSM对应结构,作者的创新点在于使用了1,2,4三种系数的空洞卷积平行的结构。

图2 Proposed dilated cost filtering approach with residual connections

视差回归

模型的视差计算如公式(1)所示,加权候选视差。

损失函数采用Huber loss ,如公式(2)所示,

视差回归部分的损失函数,加权了成本项滤波输出的3个视差的结果,如公式(3)所示,

视差优化(划重点!!):

视差优化部分,通过引入重建误差图,几何一致误差图,和原图以及Occlusion损失的信息,来进一步优化视差,流程图如图3所示:

图3

重建误差图计算如公式(4)所示:

几何一致性误差图如公式(5)所示:

遮挡区域损失如公式(6)所示:

refinement后的视差损失公式(7)

最后,总的损失函数如公式(8)所示,其中 为第一步的视差损失, 为视差优化后的视差损失, 遮挡预测的损失。

实验结果:

SceneFlow Dataset结果如图4所示,可以看到作者提出的模型,相比PSM能够更好恢复细节信息,同时在遮挡区域中显示较低的误差。

图4

从下表中可以看到,在KITTI2012和KITTI2015数据集的在线测试中,作者提出的模型,均达到SOTA。

最后,作者利用了StereoDRNet的深度图,进行三维重建实验。从下图可以看到,StereoDRNet三维重建后的精度高于PSMNET,同时在黄色box区域取得了相比ground truth 更好的结果。

推荐阅读:

  • 专辑|相机标定

  • 专辑|3D点云

  • 专辑|SLAM

  • 专辑|深度学习与自动驾驶

  • 专辑|结构光

  • 专辑|事件相机

  • 专辑|OpenCV学习

  • 专辑|学习资源汇总

  • 专辑|招聘与项目对接

  • 专辑|读书笔记

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

StereoDRNet:基于stereo的三维重建网络相关推荐

  1. ECCV18 Oral | MVSNet: 非结构化多视点三维重建网络(高精度高效率,代码已开源)...

    (欢迎关注"我爱计算机视觉"公众号,一个有价值有深度的公众号~) 编者按:本文来自ECCV2018选为Oral的论文,来自香港科技大学和Altizure公司的研究团队提出了一种既高 ...

  2. 基于MVS的三维重建算法学习笔记(一)— MVS三维重建概述与OpenMVS开源框架配置

    基于MVS的三维重建算法学习笔记(一)- MVS三维重建概述与OpenMVS开源框架配置 声明 1. MVS(Multi-view stereo)概述 稀疏重建与稠密重建的区别 稀疏重建--SFM(S ...

  3. 基于MVS的三维重建算法学习笔记(五)— 立体匹配经典算法PatchMatch论文翻译及要点解读

    基于MVS的三维重建算法学习笔记(五)- 立体匹配经典算法PatchMatch论文翻译及要点解读 声明 问题提出 问题建模 通过PatchMatch获取平面参数--Inference via Patc ...

  4. 基于slam的三维重建_实时三维重建算法的实现 基于Kinect与单目视觉SLAM的三维重建.docx...

    实时三维重建算法的实现 基于Kinect与单目视觉SLAM的三维重建 实时三维重建算法的实现--基于Kinect与单目视觉SLAM的三维重建夏文玲1,顾照鹏2,杨唐胜2XIAWenling1,GUZh ...

  5. 基于MVS的三维重建算法学习笔记(四)— 立体匹配经典算法Semi-Global Matching(SGM)论文翻译及要点解读

    基于MVS的三维重建算法学习笔记(四)- 立体匹配经典算法Semi-Global Matching(SGM)论文翻译及要点解读 声明 SGM概述 Cost Calculation(像素代价计算)--M ...

  6. 深度学习(二十八)基于多尺度深度网络的单幅图像深度估计

    基于多尺度深度网络的单幅图像深度估计 原文地址:http://blog.csdn.net/hjimce/article/details/50569474 作者:hjimce 一.相关理论 本篇博文主要 ...

  7. 用C#实现基于TCP协议的网络通讯

    TCP协议是一个基本的网络协议,基本上所有的网络服务都是基于TCP协议的,如HTTP,FTP等等,所以要了解网络编程就必须了解基于TCP协议的编程.然而TCP协议是一个庞杂的体系,要彻底的弄清楚它的实 ...

  8. 基于交换技术的网络中,全双工主要运行在?( 内有答案与详解)

    基于交换技术的网络中,全双工主要运行在?( ) A. 站点与站点之间 B. 交换机与服务器之间 C. 站点与服务器之间 D. 站点与交换机之间 答案: b 网站就是站点的意思,交换机实际是与数据打交道 ...

  9. 《中国人工智能学会通讯》——第3章 3.1基于深度学习的网络表示研究进展

    第3章 3.1基于深度学习的网络表示研究进展 网络结构在现实世界中无处不在(如航线网络.通信网络.论文引用网络.世界万维网和社交网络等),在此基础之上的应用和研究问题受到了学术界和工业界的广泛关注,这 ...

最新文章

  1. Spark中的内存计算是什么?
  2. python修改excel数据-python之实现对excel表格数据的修改
  3. 列宽一字符等于多少厘米_字符串匹配算法总结——BF、KMP、BM
  4. python内置装饰器property_python之内置装饰器(property/staticmethod/classmethod)
  5. access统计没有选课的人数_当代大学生发愁求职就业,更发愁“选课”,自主选课变成了负担...
  6. Docker入门之常用命令
  7. error: expected constructor, destructor, or typ...
  8. 华为存储认证怎么样?华为存储认证题库哪里有?
  9. gauscoor软件怎么用_比对软件STAR的简单使用
  10. Python的学习笔记案例4--52周存钱挑战3.0
  11. C语言经典编程100题
  12. 【FoxMail】无法登录, 一直让创建问题.
  13. Django(wsgi,middleware,url源码剖析)
  14. echarts:legend调整
  15. android gradle lint,Android Lint
  16. C++ 多线程的创建和使用
  17. Acwing春季每日一题 混合牛奶(朴素做法和优化做法)
  18. 徽章系列3: Travis CI 的使用
  19. Qualcomm 处理器 Krait架构
  20. C++-顺序栈实现10进制转换为2、8、16进制(详细)

热门文章

  1. 更新假设raw file(audio file format) How to convert endianness
  2. 安全专家:恶意软件盯上苹果Mac机用户
  3. March Library 版本更新
  4. ActiveMQ的消息存储和持久化
  5. MySQL基础篇:用户和权限管理
  6. 亿级京东应用架构设计与治理
  7. 深入JDK中的Optional
  8. 一篇文章搞懂Filebeat
  9. 图解:数据结构中的6种「树」,柠檬问你心中有数吗?
  10. 【基础巩固篇】Java 8中对CAS的优化