一、基本信息

二、研究背景

三、创新点

损失函数

Supervised loss.

Unsupervised loss.

Regularization loss.

总损失

网络结构

四、实验结果

五、结论与思考

作者结论

总结

思考

参考

一、基本信息

标题：Semi-Supervised Deep Learning for Monocular Depth Map Prediction
时间：2017
引用格式：Kuznietsov Y, Stuckler J, Leibe B. Semi-supervised deep learning for monocular depth map prediction[C]//Proceedings of the IEEE conference on computer vision and pattern recognition. 2017: 6647-6655.

二、研究背景

监督学习：需要大量标记数据，激光雷达RGBD等获取的数据存在噪声且稀疏，激光与照相机的投影中心不重合
无监督学习：对应没有纹理的地方，预测不了

总结一下深度预测发展：

Saxena et al. 第一个基于监督学习方法，使用MRF，手动提取特征
Eigen et al.使用CNN，由粗到细的多层网络。笔记
Li et al.使用CNN结合CRFs超像素分割
Liu et al.端到端训练一元势和成对势的CNN特征，连续深度和高斯假设？？
Laina et al.使用ResNet构建深度卷积，得到预测密度更大
此后，图像的深度转移的思想[或者将深度图预测与语义分割相结合
Garg et al. FCN FlowNet 使用光测误差。（利用一阶泰勒近似将损失线性化，因此需要从粗到细的训练？？）
Xie et al. 视差方法，最小化像素级重建误差。
Godard et al.也是视差方法，最小重建误差，但是使用左右约束。笔记

三、创新点

本文提出使用监督和非监督结合的方法。一个训练配对图需要2张深度图（LiDAR获得），2张RGB图。

令CNN预测的深度倒数ρ ( x ) \rho(\mathbf{x})ρ(x)和激光雷达得到的深度Z ( x ) Z(\mathbf{x})Z(x)对应关系：
ρ ( x ) − 1 = ! Z ( x ) \rho(\mathbf{x})^{-1} \stackrel{!}{=} Z(\mathbf{x})ρ(x)−1=!Z(x)

图像减去视差f b ρ ( x ) f b \rho(\mathbf{x})fbρ(x)：
ω ( x , ρ ( x ) ) : = x − f b ρ ( x ) \omega(\mathbf{x}, \rho(\mathbf{x})):=\mathbf{x}-f b \rho(\mathbf{x})ω(x,ρ(x)):=x−fbρ(x)

令左图I 1 I_1I1等于右图I 2 I_2I2-视差：
I 1 ( x ) = ! I 2 ( ω ( x , ρ ( x ) ) ) I_{1}(\mathbf{x}) \stackrel{!}{=} I_{2}(\omega(\mathbf{x}, \rho(\mathbf{x})))I1(x)=!I2(ω(x,ρ(x)))

结合左右图像：
I left ( x ) = ! I right ( ω ( x , ρ ( x ) ) ) I right ( x ) = ! I left ( ω ( x , − ρ ( x ) ) )

Ileft(x)=!Iright(ω(x,ρ(x)))Iright(x)=!Ileft(ω(x,−ρ(x)))Ileft(x)=!Iright(ω(x,ρ(x)))Iright(x)=!Ileft(ω(x,−ρ(x)))

Ileft(x)=!Iright(ω(x,ρ(x)))Iright(x)=!Ileft(ω(x,−ρ(x)))

损失函数

网络结构

用的残差网络Flownet

2种残差块：

上投影残差块：

具体网络结构：

四、实验结果

9就是系列2左右约束方法，然后看到本文方法可以结合真实深度预测得到比较精准结果，同时对于真实深度没有扫描的地方，通过CNN进行学习。

五、结论与思考

作者结论

总结

本文在有深度标签数据下是个结合CNN的方法，但是大多数情况是没有深度。要是以后有深度相机集成到手机上，这个方法不失为增强方法。

思考

参考

https://blog.csdn.net/qq_29598161/article/details/106951390

论文笔记_S2D.26_2017-ICCV_半监督深度学习的单目深度图预测相关推荐

深度学习英文训练阶段_半监督深度学习训练和实现小Tricks
临近毕业,忽然想实现一下一些比较经典的半监督深度学习算法.恰逢一周前有个师妹问我有没有关于半监督深度学习训练技巧的文章,我一想,好像没有,便想自己写一篇. Talk is cheap, show yo ...
融合一致性正则与流形正则的半监督深度学习算法
融合一致性正则与流形正则的半监督深度学习算法王杰1,2, 张松岩1,2, 梁吉业1,2 1山西大学计算机与信息技术学院 2计算智能与中文信息处理教育部重点实验室摘要:半监督学习已被广泛应用于大数据 ...
基于深度学习的单目深度估计综述
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达文章:Monocular Depth Estimation Based On Deep Learnin ...
基于深度学习的单目图像深度估计总结
图像深度估计,是目前计算机视觉研究中的经典问题.深度图(Depth Map)表示每个像素在空间中的位置,是一种普遍的三维场景信息表达方式,广泛应用于自动驾驶.三维重建等方面. 基于深度学习的单目图像深 ...
前车碰撞预警——FCW,基于深度学习和单目摄像头测距的前车碰撞预警源码
前车碰撞预警--FCW,基于深度学习和单目摄像头测距的前车碰撞预警源码. 单目测距,多目标跟踪. 车辆检测,智能adas,FCW,价格只包括源码及设计文档讲解. 我使用的版本说明: gpu版本: an ...
基于深度学习和单目摄像头测距的前车碰撞预警源码
前车碰撞预警--FCW,基于深度学习和单目摄像头测距的前车碰撞预警源码单目测距,多目标跟踪. 车辆检测,智能adas,FCW,编号只包括源码及设计文档讲解. 我使用的版本说明: gpu版本: ano ...
深度学习之单目深度估计：无监督学习篇
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达作者:桔子毛 https://zhuanlan.zhihu.com/p/29968267 本文仅做学术 ...
最新综述｜深度学习的单目人体姿态估计
向大家推荐一篇今天新出的人体姿态估计综述文章 Monocular Human Pose Estimation: A Survey of Deep Learning-based Methods ,对20 ...
B.3【智能标注】：基于Labelstudio的UIE半监督深度学习的智能标注方案(云端版)，提效。
NLP专栏简介:数据增强.智能标注.意图识别算法|多分类算法.文本信息抽取.多模态信息抽取.可解释性分析.性能调优.模型压缩算法等专栏详细介绍:NLP专栏简介:数据增强.智能标注.意图识别算法|多分 ...
半监督学习深度学习算法
该文章主体摘自知乎糯米稻谷的文章,对一些细节添加了自己的理解文章链接https 半监督学习啥是半监督学习(Semi-supervised Learning) 1.简单自训练(simple self ...

论文笔记_S2D.26_2017-ICCV_半监督深度学习的单目深度图预测

一、基本信息

二、研究背景

三、创新点

损失函数

Supervised loss.

Unsupervised loss.

Regularization loss.

总损失

网络结构

四、实验结果

五、结论与思考

作者结论

总结

思考

参考

论文笔记_S2D.26_2017-ICCV_半监督深度学习的单目深度图预测相关推荐

最新文章

热门文章