代码


1. 研究问题

利用CNN计算匹配成本的方法存在三个问题:

  1. 网络必须进行多次前向传递,导致计算效率低下;
  2. 无法利用遮挡区域像素进行训练,因此难以获得这些区域的可靠视差估计;
  3. 需要几个启发式后处理步骤来细化视差,这些方法凭经验选择参数,视差估计的精度和泛化性能都很有限。

与现有方法在立体匹配的不同步骤中使用多个网络不同,我们将所有步骤合并到一个网络中以实现端到端训练所提出的网络由三部分组成:多尺度共享特征提取、初始视差估计和视差细化 . 提出的网络框架如图1所示,网络架构如表1所示。

2. 研究方法

提出迭代残差网络 iResNet,将立体匹配的所有步骤合并到一个网络来改善视差估计精度和计算效率。该网络分成三步模块:多尺度共享特征提取、初始视差估计和视差细化,其中,最关键的贡献是使用特征恒量用于视差优化的子网络

恒量这个词来自于光学估领域,包含灰度值衡量和梯度衡量。




2.1 Stem Block for Multi-scale Feature Extration

输入图像先提取多尺度的特征,提取的特征用于视差估计和视差细化。

2.2 Initial Disparity Estimation Sub-network(DES-Net)

视差估计网络借鉴了DispNetC,采用了encoder-decoder结构,但不同于DispNetC,这里获得全分辨率的初始视差图。相关层串联左图特征,引入低级语义特征,有助于改进视差估计。

2.3 Disprity Refinement Sub-network(DRS-net)

初始视差在深度不连续区域面临挑战,因此需要进行视差细化进一步提升性能。

我们用特征恒量进行细化,特征恒量包括feature correlation fcf_cfc​和reconstruction error rerere。其中fcf_cfc​是左右特征图之间的相关性,正确的视差会得到较大的相关结果;rerere是初始视差的重建误差,即左图像的多尺度融合特征与右图像的反向扭曲特征之间的绝对差异,误差越大则初始视差的误差越大。

视差细化子网络估计初始视差的残差,残差和初始视差的总和就是细化的视差图。最终residual + initial disparity = retified diparity

2.4 Iterative Refinement

为了从多尺度融合特征中提取更多信息并最终提高视差估计精度,提出了一种迭代细化方法。具体来说,将第二个子网络生成的细化视差图视为新的初始视差图,然后重复特征恒量计算和视差细化过程以获得新的细化视差。重复此过程,直到两次连续迭代之间的改进很小。

请注意,随着迭代次数的增加,改进会降低。

3. 实验结果

数据集:

  • Scene Flow
  • KITTI 2012 和 KITTI 2015

训练:

  • Adam优化器:β1=0.9\beta_1 = 0.9β1​=0.9,β2=0.999\beta_2 = 0.999β2​=0.999。
  • 批处理大小:2
  • 多步学习率:
    • 对于Scene Flow:初始设置为1e-4,然后在第 200k、350k 和 500k 次迭代时减半,训练在第 650k 次停止迭代。重复此训练过程进行额外一轮以进一步优化模型。
    • 对于KITTI:前 20k 次迭代的学习率设置为 2 × 10−5,然后在随后的 120k 次迭代中减少到 10−5。
  • 数据增强:空间变换和色度变换。空间变换包括平移、裁剪和缩放,而色度变换包括颜色、对比度和亮度变换。这种数据增强可以帮助学习针对光照变化和噪声的鲁棒模型。

评估指标:

  • EPE:估计和真实视差之间的平均绝对距离。
  • (> t px):EPE大于 t 像素的视差百分比。

3.1 Ablation experiments

3.2 Benchmark results


4. 结论

提出了一个端到端的网络,使用两个特征恒量(包括特征相关和重建误差)来细化初始视差,有效地提升了初始视差图的质量。

5. 局限性

迭代优化过程只经过两次迭代,视差便不再提升。可以引入更加有效的特征恒量。

6. 启发

(1)multi-scale skip connection 可以将多尺度的特征引入后面的网络,从而提升初始视差估计的精度和视差细化的性能。
(2)视差细化的迭代也值得学习。

《Learning for Disparity Estimation through Feature Constancy》相关推荐

  1. 论文阅读笔记《Learning for Disparity Estimation through Feature Constancy》

    0. 摘要   立体匹配算法通常由四个部分组成,包括:匹配代价计算,代价聚合,视差计算和视差优化.现有的基于CNN 的方法知识采用CNN解决了这四步中的一部分,或者使用不同的网络处理不同的步骤,使得它 ...

  2. 论文阅读《Learning for Disparity Estimation through Feature Constancy》

    网络结构:(主要是对CRL的改进) 主要贡献: 1 将立体匹配的所有步骤合并到一个网络来改善准确性和有效性 2 使用特征恒量的用于视差优化的子网络 三个阶段:特征提取-> 代价计算.聚合和视差估 ...

  3. 【论文简述及翻译】Learning for Disparity Estimation through Feature Constancy(CVPR 2018)

    一.论文简述 1. 第一作者:Zhengfa Liang.Yiliu Feng 2. 发表年份:2018 3. 发表期刊:CVPR 4. 关键词:CNN.端到端训练.视差改进.特征恒量.视差估计 5. ...

  4. 论文笔记《Learning Deep Correspondence through Prior and Posterior Feature Constancy》

    摘要 介绍 相关工作 本论文方法 1 用于多尺度特征提取的茎块 2 初始视差估计子网络 3 视差精细化子网络 4 迭代精细化 实验 1 脱离实验 2 测试基准结果 总结 参考文献 摘要 立体匹配算法通 ...

  5. 模型剪枝经典论文解读:《Learning Efficient Convolutional Networks through Network Slimming》

    Learning Efficient Convolutional Networks through Network Slimming 摘要: CNN在落地中的部署,很大程度上受到其高计算成本的限制.在 ...

  6. P3D——《Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks》概述

    <Learning Spatio-Temporal Representation with Pseudo-3D Residual Networks>概述 引言: 最近阅读了本篇发表在ICC ...

  7. 论文阅读笔记之《Learning Deep Correspondence through Prior and Posterior Feature Constancy》

    本篇博客记录一下最近看的一篇KITTI2015上排名第二的网络结构iResNet-i2e2 一 论文贡献 二 基础知识 a 贝叶斯推导 b 概念解释 三 iResNet-i2e2的网络结构 1 组成 ...

  8. 论文阅读笔记《Learning monocular depth estimation infusing traditional stereo knowledge》

    网络名称:monoResMatch 论文来源:CVPR2019 核心思想   本文提出一种自监督实现单目深度估计的网络,其思路也非常简单,将单目深度估计转化成立体匹配问题,再用立体匹配网络进行视差估计 ...

  9. 论文《Learning Spatial Fusion for Single-Shot Object Detection》解读

    标题:基于学习空间融合的单发目标检测 摘要: 金字塔形特征表示法是解决目标检测尺度变化挑战的常用方法. 但是,对于基于特征金字塔的单次检测器来说,不同特征尺度之间的不一致是主要限制. 在这项工作中,文 ...

  10. 《Building Efficient ConvNets using Redundant Feature Pruning》论文笔记

    1. 概述 一般在做模型的时候开始最关心的是模型的性能,也就是模型的精度,我们可以增加网络的宽度与深度,来不断增加模型的表达能力.在精度达标之后,网络也变地很臃肿了,其实里面很多的参数都是非必须的,也 ...

最新文章

  1. 7a系列mrcc xilinx_【FPGA】Xilinx-7系的时钟资源与DDR3配置
  2. php中new运算符的作用,C++_C++编程中new运算符的使用学习教程,new运算符用作从自由存储为 typ - phpStudy...
  3. 数据可视化01--笔记
  4. mysql create routine 权限的一些说明
  5. 音乐上传网站_国外最受欢迎的15个BT下载网站
  6. jsp:include
  7. html菜鸟ruby,ruby的基础语法
  8. 国内maven镜像,快的飞起
  9. 思科网院Packet Tracer实验(二)IOS基本配置
  10. 软考历程(4)——安全问题之病毒
  11. 在电脑上修改apk、重新签名apk
  12. 新仙剑奇侠传完美攻略
  13. android平板电脑忘记密码怎么解锁,平板密码忘了怎么解锁
  14. python多线程详解 Python 垃圾回收机制
  15. uip的yeelink实现
  16. 使用设计模式出任CEO迎娶白富美(5)--原型模式解决车间管理规范问题
  17. Verdi 改变字体大小额方法
  18. 解决方案 | 亚洲诚信助力互联网行业网络安全建设
  19. argparse.ArgumentError: argument --title: conflicting option string: --title
  20. Android 自定义DatePick 只显示年月,日期选择年月

热门文章

  1. Android仿芝麻信用分雷达分布图
  2. catch小说内容-从gui到爬虫(2)
  3. unity汤姆猫自动检测录音,不说话自动播放
  4. LeetCode | 347. Top K Frequent Elements
  5. 关注虚拟财富“.ME”域名的投资价值
  6. flash AS3常用公式
  7. 别瞎扯,元宇宙就是没有切实发展?
  8. 上海宝付揭穿网络招聘小把戏
  9. php自动生成phpunit,PHP单元测试框架PHPUnit的使用
  10. RGB与CMYK颜色模式调色原理