论文标题:SNE-RoadSeg: Incorporating Surface Normal Information into Semantic Segmentation for Accurate Freespace Detection

论文地址:https://arxiv.org/abs/2008.11351v1

论文代码:https://github.com/hlwang1124/SNE-RoadSeg

数据集:http://sites.google.com/view/sne-roadseg

发表时间:2020年8月

本文使用表面法线估计器(SNE)对 Depth Image 进行处理,再使用 ResNet 进行特征提取,和仅使用 ResNet 进行特征提取的 RGB Image 的特征进行融合,融合使用了 FCN、DenseNet 的思想,具体融合处理仅仅是元素相加求和。

Abstract

自由空间检测是自动驾驶汽车视觉感知的重要组成部分。最近在数据融合卷积神经网络 (CNN) 方面所做的努力显著改善了语义驾驶场景分割。自由空间可以假设为地平面,其上的点具有相似的表面法线。

因此,在本文中,我们首先介绍了一个名为表面法线估计器(SNE)的新模块,它可以从密集的深度/视差图像中以高精度和高效率推断表面法线信息。此外,我们提出了一种数据融合 CNN 架构,称为 RoadSeg,它可以从 RGB 图像和推断的表面法线信息中提取和融合特征,以实现准确的自由空间检测。出于研究目的,我们发布了一个名为 Ready-to-Drive (R2D) 道路数据集的大型合成自由空间检测数据集,该数据集是在不同的光照和天气条件下收集的。实验结果表明,我们提出的 SNE 模块可以使所有最先进的 CNN 用于自由空间检测,并且我们的 SNE-RoadSeg 在不同数据集中实现了最佳的整体性能

Personal understanding

本文两处创新:

1、表面法线估计器(SNE)

本质上就是一种特殊的特征提取方法

2、融合架构 RoadSeg

SNE 从深度/视差图像中提取特征,将此特征和 RGB 图像特征通过 RoadSeg 架构进行融合,本质上也是 CNN 的构成的,核心思想是基于 DenseNet 的改进

Method

1、表面法线估计器(SNE)架构如图

SNE 具体流程是严格的数学推导,并且作者给出了推导过程,数学基础好的同学可以详细看一下,会有收获的,不好的同学代码是开源的,可以直接使用,部分推导原文如下:

2、RoadSeg 的数据融合 CNN 架构

首先 Depth Image 经过 SNE 进行特征提取,经过 Conv、BN、ReLU、Max Pooling、残差块......

同时 RGB Image 也经过 Conv、BN、ReLU、Fusion(此处融合只是简单的元素相加)

不同层进行了多次残差、融合、上采样、特征提取操作,思想来源于 FCN 架构。不理解的同学,可以自学一下 FCN 不算太复杂,也可以自学以下 U-Net,道理相似。

这里要提一下,针对 Depth Image 图像的 SNE 输出的特征、RGB Image 特征,作者是使用的 ResNet 为主干进行特征提取,ResNet 架构,已经不属于 SOTA 了,所以这个位置,是可以进行改进的。

Experiments

作者进行了很多次实验,并且在不同的数据集上都进行了对比实验,因为本文是2020年的文章,这里就不介绍过多实验过程了,放一张有价值的图,发现我们的方法是最优的。

这里解释一下,为什么有多种 RoadSeg 架构,这里是因为,针对 Depth Image 经过 SNE 后的特征和 RGB Image 的特征是通过 ResNet 进行特征提取的,而 ResNet 的架构有多种架构

有 ResNET-18、ResNet-34......ResNet-152,为了避免同学们看不懂,这里详细说了以一下

方便自己学习时能够更快理解,并且最终发现, RoadSeg 使用 ResNet-152 效果最好,也正是因为神经网络学习的知识做过多,所以它最准确呀!

【论文笔记】道路检测 SNE-RoadSeg相关推荐

  1. 图像内复制粘贴篡改取证matlab_[论文笔记] 篡改检测:RGB-N

    [论文笔记] Learning Rich Features for Image Manipulation Detection 说在前面 个人心得: 第一次关注篡改检测,最常见的篡改方式是拼接.复制移动 ...

  2. 道路检测 | SNE-RoadSeg论文阅读

    道路检测 | SNE-RoadSeg: Incorporating Surface Normal Information into Semantic Segmentation for Accurate ...

  3. 路面检测的多尺度网络结构论文笔记

    路面检测的多尺度网络结构论文笔记 1.u-net网络结构 u-net网络具有收缩路径和扩张路径,这里的收缩和扩张指的是图像的尺寸.收缩路径由典型的3*3卷积-relu层组成,在每做两次卷积后接一个2* ...

  4. 3d object是什么文件_[单目3D目标检测论文笔记] 3D Bounding Box Estimation

    本文是3D Bounding Box Estimation Using Deep Learning and Geometry的论文笔记及个人理解.这篇文章是单目图像3d目标检测的一个经典工作之一.其目 ...

  5. 从基础综述、论文笔记到工程经验、训练技巧:值得一看的目标检测好文推荐...

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文授权转自知乎作者跑者小越,https://zhuanlan.z ...

  6. 论文阅读笔记 | 目标检测算法——SAPD算法

    如有错误,恳请指出. 文章目录 1. Introduction 2. Soft Anchor-Point Detector 2.1 Detection Formulation with Anchor ...

  7. 论文阅读笔记 | 目标检测算法——FSAF算法

    如有错误,恳请指出 文章目录 1. Introduction 2. FSAF Module 2.1 Network Architecture 2.2 Ground-truth and Loss 2.2 ...

  8. 《用于水稻病害检测的机器视觉系统:综述》论文笔记

    <用于水稻病害检测的机器视觉系统:综述>论文笔记 链接:Machine Vision Systems for Rice Diseases Detection: A Review | IEE ...

  9. 论文阅读笔记 | 目标检测算法——PP-YOLOv2

    如有错误,恳请指出. 文章目录 1. Introduction 2. Revisit PP-YOLO 2.1 Pre-Processing 2.2 Baseline Model 2.3 Trainin ...

  10. 论文笔记: 贝叶斯在线变点检测:An intuitive understanding

    目录 0. 前言0 1. 前言 2. Overview of BOCD 3. Possible extensions 4. References 5. 后记 0. 前言0 本文是关于一篇关于贝叶斯变化 ...

最新文章

  1. 学习web前端难不难
  2. fragment 横竖屏 不重建
  3. R语言使用DALEX包的model_profile函数对caret包生成的多个算法模型的离散变量进行分析、使用偏依赖图(Partial Dependence Plots)解释某个离散特征和目标y的关系
  4. Python3猜数字小游戏
  5. 线程池用过吗?ThreadPoolExecutor谈谈你的理解? —— 为什么用线程池?优势?|| 线程池如何使用?
  6. 自定义FragmentTabHost实现可控制是否保存fragment状态
  7. C语言:L1-036 A乘以B (5分)
  8. 【HNOI2016】序列【莫队】【单调栈】【ST表】
  9. 使命召唤16计算机内存不足,使命召唤16出现一个问题怎么解决
  10. HCIP-RS-MPLS-LSP建立-静态LSP
  11. 网络工程师Day9--GRE配置
  12. 开启协程_一篇文章搞懂Python协程
  13. 软件工程 第六章 编码与测试
  14. 寻找两个正序数组中的中位数 数组
  15. CAD:AutoCAD快捷键指令大全(非常值得收藏),本人项目案例实践积累总结
  16. 软件工程阶段性总结(一)——概述
  17. 安卓ViewBinding详解
  18. java 打砖块算法_打砖块java代码详细
  19. 工业机器人视觉实训平台
  20. 0x00007FFE9071C408 (ucrtbase.dll) (xxx.exe 中)处有未经处理的异常: 将一个无效参数传递给了将无效参数视为严重错误的函数。

热门文章

  1. 青岛大学软件梦工厂蓝桥讲课_素数题解
  2. 用Python实现复制英文PDF段落后自动去掉换行连字符
  3. git 报错:Your configuration specifies to merge with the ref
  4. 如何通过参加学术会议来展现自己的科研成果?
  5. PCB测试点的设计要求
  6. 实现VOS与VOS平台之间的动态注册
  7. 安卓程序设计课程表app源码
  8. 【算法】二叉树常见算法
  9. Dell R740 USB收集日志
  10. 2020年电赛坡道小车