Deep Ordinal Regression Network for Monocular Depth Estimation 单目深度估计,论文阅读,DORN;视频笔记
tags: 单目深度估计,论文阅读,DORN
原始论文是:
Deep Ordinal Regression Network for Monocular Depth Estimation
Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1 Huan Fu1 Mingming Gong2,3 Chaohui Wang4 Kayhan Batmanghelich2 Dacheng Tao1
在线看论文:
https://arxiv.org/pdf/1806.02446.pdf
在线看代码
过往的DCNN方法的失败之处
过往的工作(特指那些 使用 深度 神经网络的:DCNN)方法的3种失败处:
- 收敛慢
- 局部解析度不够,就是你在最后的深度图上,看不清很多边缘
- 网络里面 有许多 重复的 pooling 操作。计算,内存要求多
我们提出一些方法来针对上述问题
方法1: SID
背后的想法就是: 远处的就分类粒度粗一些
那么,在这个 「SID 远处的就分类粒度粗一些 」的基础上,就能把回归问题 变成 一个 分类问题。
离散化 连续 的 距离 变为 一些 距离间隔。
我们的模型包含什么
分成3个模块
- 特征提取的模块
- 场景理解的模块
- 有序回归的模块
特征提取模块
包含:
全面的图片编码器
full-image encoder
场景理解模块
ASPP
空洞卷积??
有序回归 模块
这里就是 用到 了SID
上图说的 eq1
, 等式 1 ,就是:
如何完成学习和推断
学习阶段
定义我们特有的损失函数:
迭代的优化算法,反向传播 ,我们最后就能得到一个 「有序的 label 分类」,每个类就是一个距离,比如:1m, 1.1m, 1.2m, 1.4m, 2m, 10m, 50m; 这个距离 跟上面 的SID 有关。
推断阶段
有了 : 有序的 label 分类, 就可以进行 距离推断。
用下面的公式:
- 解释一下:
d 尖就是 推测的 depth/ 距离
l 就是 学习到 的label
DORN 的表现很好
在18 年的原始论文里,有这个数据:
在 21年的 kitti 排行榜,很靠前
其实,按照 absRel , DORN 排名第一
备注: 指标 解释
更多相关可以读的博客:
todo 2021-09-08 16:45:30
论文笔记
论文详细笔记
2019CVPR单目深度估计综述
DORN的论文行文不好,但是看看代码,思路还是挺牛逼的,来自2020年看法
这篇论文在ROB2018的视频
yoiuytube
过往的方法
- patch
- eigen; loss function;
regression loss
我们的方法
是 ordinal regression loss
loss functions
MSE
mean square error:
但是 mse 这玩意 的 不好的地方就是: 对于 outliers ,也就是 那些 离开群体 的点,它很敏感,很容易 受离群点 的影响。
更加 robust 的loss function
- mse_log
- mae
这些 loss 函数,都是 为了 regression 设计的。
那么我们有一个 发问:
难道不能设计 分类,有序回归 问题的loss 函数吗?
距离的 离散化
在这个 图片 ,地下 的 sid 就是我们 提出的 间隔话 的方式。
就会得到这样的回归结果
收敛速度
多解析 架构;网络部分
多尺度特征提取器
四个评价指标
结果
提问环节的一些记录
如果更换一个全新的场景怎么办?
训练 是 用 kitti 和 cityscape 这两个数据集‘
但是如果其他场景呢?比如 更加 landscape 的场景;
回答是:
你需要自己进行 新的 标注;因为这是一个 有 监督 的 算法;
你用了什么 loss function?
我用了 图中的第一个
后面三个 没用
loss 函数 和 离散化 谁更重要?
它们在我们的工作中都 贡献了许多,但是我觉得 loss 函数 会更加重要一些。
多分类器,以及空间增加的离散化,的对比实验
结论都写在图中的底下两行了。
dorn + sid 就是 会好很多。
更多 可以观看的视频
todo : 2021-09-08 16:37:37
通过视频序列进行深度估计
在Azure上的「有序回归」学习
Deep Ordinal Regression Network for Monocular Depth Estimation 单目深度估计,论文阅读,DORN;视频笔记相关推荐
- 面向单目深度估计的基于几何的预训练方式 -- Geometric Pretraining for Monocular Depth Estimation
一些前提知识 Monocular Depth Estimation:单目深度估计,从单张图片中去预测每个像素点具体的深度,相当于从二维图像推测出三维空间. ImageNet-Pretraining:基 ...
- 单目深度估计(Monocular Depth Estimation)论文阅读 2021-01-15
单目深度估计 问题公式化:求非线性映射函数 一.数据集: NYU Depth:视频序列和dense depth map通过RGB-D采集的,但是不是每一种图像都有深度图,因为映射是离散的. KITTI ...
- 无监督单目深度估计 Unsupervised Monocular Depth Estimation with Left-Right Consistency 论文方法分析
最近在做深度估计相关的毕业设计,一般的基于深度学习单目深度估计算法都是基于监督学习的方法,也就是说我希望输入一张拍摄到的单目照片,将它通过卷积神经网络后生成一张深度图.在这个过程中我们就要求需要有大量 ...
- 单目深度估计 | Real-Time Monocular Depth Estimation using Synthetic Data 学习笔记
文章目录 1. 摘要 2. 创新点和局限性 3 研究 3.1 阶段1-单目深度估计模型. 3.1.1 损失函数 3.1.2 训练细节 3.2 阶段2-通过风格迁移的域自适应 3.2.1 损失函数 3. ...
- 基于分段平面性的单目深度估计 P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior
P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior 面向可解释深度网络的单目深度估计 0 Abstract 单 ...
- 单目深度估计综述: Monocular Depth Estimation survey
深度估计很重要,sfm和mvs都是建立在多个视图的特征匹配的基础上,预测出来的深度图还很他妈稀疏,说实话从单个图像推出深度就是不适定的扯淡问题.但是没办法,话是要用深度学习搞 啊,于是乎不同的网络结构 ...
- 单目深度估计 | Learning Depth from Monocular Videos using Direct Methods 学习笔记
文章目录 摘要 1. 论文主要贡献: 2. 从视频中学习预测深度 2.1 尺度模糊 2.2 建模姿态估计预测器 3. 可微分直接视觉测距法 3.1 直接视觉测距法(DVO) 3.2 可微分的实现 4 ...
- 单目深度估计数据集:NYU Depth Dataset V2
论文:Indoor Segmentation and Support Inference from RGBD Images 数据集:NYU Depth Dataset V2数据集 打不开或者下载慢的可 ...
- Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals翻译
基于拉普拉斯金字塔深度残差的单目深度估计 Monocular Depth Estimation UsingLaplacian Pyramid-Based Depth Residuals英文注解: 基于 ...
最新文章
- web前端开发培训有哪些学习阶段
- Android之加载外部dex
- java等号_java等号
- NTFS 在linux上挂载,parted分区工具用法
- 如何迅速成长成为一名数据分析师(都是干货)?
- 为何你叫妹子笑,却拍出无数黑照?
- python2:function
- python print用法制表空格_python中print函数的输出问题(空格,制表符)
- python的rsa公钥解密方法
- java怎样调用DLL方法
- 关于上上文hashmap的深入-hashmap产生死锁的详解
- Actor-ES框架:Actor编写-ESGrain与ESRepGrain
- 设计模式之——工厂模式
- android时间最大,Android TimePickerDialog设置最大时间
- 阿里CEO张勇:建立良好的消费环境是阿里20年来努力工作的方向
- 动态网站的技术路线_派康大会官方网站建设项目开通上线啦!
- WPF/E CTP Quick Start - 第八部分:媒体(翻译)
- 移动端前端开发技术概况
- 深度学习之跟学霹雳吧啦Wz笔记
- Codeforces Round #829E 1753E. N Machines
热门文章
- 王小川新公司开源 70 亿参数量的中英文预训练大模型,可商用;谷歌要求员工慎用 AI,即便是自己家的 Bard|极客头条
- 飞书获取user_id
- 微信老客户的维护方法
- 计算机基础教学改革申报书,计算机应用基础精品课程申报书_图文
- 软件库@www.softku.net
- Linux学习 -- Shell面试题练习
- 统计一个字符串中大写字母字符,小写字母字符,数字字符出现的次数
- oracle正整数集,Oracle 整理
- 【拼多多API 开发系列】百亿补贴商品详情接口,代码封装
- 专题二:无穷小量阶的比较-一刷