tags: 单目深度估计,论文阅读,DORN


原始论文是:

Deep Ordinal Regression Network for Monocular Depth Estimation
Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1 Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1

在线看论文:

https://arxiv.org/pdf/1806.02446.pdf

在线看代码


过往的DCNN方法的失败之处

过往的工作(特指那些 使用 深度 神经网络的:DCNN)方法的3种失败处:

  • 收敛慢
  • 局部解析度不够,就是你在最后的深度图上,看不清很多边缘
  • 网络里面 有许多 重复的 pooling 操作。计算,内存要求多

我们提出一些方法来针对上述问题

方法1: SID

背后的想法就是: 远处的就分类粒度粗一些

那么,在这个 「SID 远处的就分类粒度粗一些 」的基础上,就能把回归问题 变成 一个 分类问题。

离散化 连续 的 距离 变为 一些 距离间隔。

我们的模型包含什么

分成3个模块

  1. 特征提取的模块
  2. 场景理解的模块
  3. 有序回归的模块

特征提取模块

包含:

全面的图片编码器

full-image encoder

场景理解模块

ASPP

空洞卷积??

有序回归 模块

这里就是 用到 了SID

上图说的 eq1
, 等式 1 ,就是:

如何完成学习和推断

学习阶段

定义我们特有的损失函数:

迭代的优化算法,反向传播 ,我们最后就能得到一个 「有序的 label 分类」,每个类就是一个距离,比如:1m, 1.1m, 1.2m, 1.4m, 2m, 10m, 50m; 这个距离 跟上面 的SID 有关。

推断阶段

有了 : 有序的 label 分类, 就可以进行 距离推断。

用下面的公式:

  • 解释一下:

d 尖就是 推测的 depth/ 距离

l 就是 学习到 的label

DORN 的表现很好

在18 年的原始论文里,有这个数据:

在 21年的 kitti 排行榜,很靠前

其实,按照 absRel , DORN 排名第一

备注: 指标 解释

更多相关可以读的博客:

todo 2021-09-08 16:45:30

论文笔记

论文详细笔记

2019CVPR单目深度估计综述

DORN的论文行文不好,但是看看代码,思路还是挺牛逼的,来自2020年看法

这篇论文在ROB2018的视频

yoiuytube

过往的方法

  • patch
  • eigen; loss function;

regression loss

我们的方法

是 ordinal regression loss

loss functions

MSE

mean square error:

但是 mse 这玩意 的 不好的地方就是: 对于 outliers ,也就是 那些 离开群体 的点,它很敏感,很容易 受离群点 的影响。

更加 robust 的loss function

  • mse_log

  • mae


这些 loss 函数,都是 为了 regression 设计的。

那么我们有一个 发问:

难道不能设计 分类,有序回归 问题的loss 函数吗?

距离的 离散化


在这个 图片 ,地下 的 sid 就是我们 提出的 间隔话 的方式。

就会得到这样的回归结果


收敛速度

多解析 架构;网络部分

多尺度特征提取器

四个评价指标

结果


提问环节的一些记录

如果更换一个全新的场景怎么办?

训练 是 用 kitti 和 cityscape 这两个数据集‘

但是如果其他场景呢?比如 更加 landscape 的场景;

回答是:

你需要自己进行 新的 标注;因为这是一个 有 监督 的 算法;

你用了什么 loss function?

我用了 图中的第一个

后面三个 没用

loss 函数 和 离散化 谁更重要?

它们在我们的工作中都 贡献了许多,但是我觉得 loss 函数 会更加重要一些。

多分类器,以及空间增加的离散化,的对比实验

结论都写在图中的底下两行了。

dorn + sid 就是 会好很多。

更多 可以观看的视频

todo : 2021-09-08 16:37:37

通过视频序列进行深度估计

在Azure上的「有序回归」学习

Deep Ordinal Regression Network for Monocular Depth Estimation 单目深度估计,论文阅读,DORN;视频笔记相关推荐

  1. 面向单目深度估计的基于几何的预训练方式 -- Geometric Pretraining for Monocular Depth Estimation

    一些前提知识 Monocular Depth Estimation:单目深度估计,从单张图片中去预测每个像素点具体的深度,相当于从二维图像推测出三维空间. ImageNet-Pretraining:基 ...

  2. 单目深度估计(Monocular Depth Estimation)论文阅读 2021-01-15

    单目深度估计 问题公式化:求非线性映射函数 一.数据集: NYU Depth:视频序列和dense depth map通过RGB-D采集的,但是不是每一种图像都有深度图,因为映射是离散的. KITTI ...

  3. 无监督单目深度估计 Unsupervised Monocular Depth Estimation with Left-Right Consistency 论文方法分析

    最近在做深度估计相关的毕业设计,一般的基于深度学习单目深度估计算法都是基于监督学习的方法,也就是说我希望输入一张拍摄到的单目照片,将它通过卷积神经网络后生成一张深度图.在这个过程中我们就要求需要有大量 ...

  4. 单目深度估计 | Real-Time Monocular Depth Estimation using Synthetic Data 学习笔记

    文章目录 1. 摘要 2. 创新点和局限性 3 研究 3.1 阶段1-单目深度估计模型. 3.1.1 损失函数 3.1.2 训练细节 3.2 阶段2-通过风格迁移的域自适应 3.2.1 损失函数 3. ...

  5. 基于分段平面性的单目深度估计 P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior

    P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior 面向可解释深度网络的单目深度估计 0 Abstract   单 ...

  6. 单目深度估计综述: Monocular Depth Estimation survey

    深度估计很重要,sfm和mvs都是建立在多个视图的特征匹配的基础上,预测出来的深度图还很他妈稀疏,说实话从单个图像推出深度就是不适定的扯淡问题.但是没办法,话是要用深度学习搞 啊,于是乎不同的网络结构 ...

  7. 单目深度估计 | Learning Depth from Monocular Videos using Direct Methods 学习笔记

    文章目录 摘要 1. 论文主要贡献: 2. 从视频中学习预测深度 2.1 尺度模糊 2.2 建模姿态估计预测器 3. 可微分直接视觉测距法 3.1 直接视觉测距法(DVO) 3.2 可微分的实现 4 ...

  8. 单目深度估计数据集:NYU Depth Dataset V2

    论文:Indoor Segmentation and Support Inference from RGBD Images 数据集:NYU Depth Dataset V2数据集 打不开或者下载慢的可 ...

  9. Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals翻译

    基于拉普拉斯金字塔深度残差的单目深度估计 Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals英文注解: 基于 ...

最新文章

  1. web前端开发培训有哪些学习阶段
  2. Android之加载外部dex
  3. java等号_java等号
  4. NTFS 在linux上挂载,parted分区工具用法
  5. 如何迅速成长成为一名数据分析师(都是干货)?
  6. 为何你叫妹子笑,却拍出无数黑照?
  7. python2:function
  8. python print用法制表空格_python中print函数的输出问题(空格,制表符)
  9. python的rsa公钥解密方法
  10. java怎样调用DLL方法
  11. 关于上上文hashmap的深入-hashmap产生死锁的详解
  12. Actor-ES框架:Actor编写-ESGrain与ESRepGrain
  13. 设计模式之——工厂模式
  14. android时间最大,Android TimePickerDialog设置最大时间
  15. 阿里CEO张勇:建立良好的消费环境是阿里20年来努力工作的方向
  16. 动态网站的技术路线_派康大会官方网站建设项目开通上线啦!
  17. WPF/E CTP Quick Start - 第八部分:媒体(翻译)
  18. 移动端前端开发技术概况
  19. 深度学习之跟学霹雳吧啦Wz笔记
  20. Codeforces Round #829E 1753E. N Machines

热门文章

  1. 王小川新公司开源 70 亿参数量的中英文预训练大模型,可商用;谷歌要求员工慎用 AI,即便是自己家的 Bard|极客头条
  2. 飞书获取user_id
  3. 微信老客户的维护方法
  4. 计算机基础教学改革申报书,计算机应用基础精品课程申报书_图文
  5. 软件库@www.softku.net
  6. Linux学习 -- Shell面试题练习
  7. 统计一个字符串中大写字母字符,小写字母字符,数字字符出现的次数
  8. oracle正整数集,Oracle 整理
  9. 【拼多多API 开发系列】百亿补贴商品详情接口,代码封装
  10. 专题二:无穷小量阶的比较-一刷