文章目录

  • 前言
  • 2017
    • DeepRoadMapper
    • Topology Loss
  • 2018
    • RoadTracer
    • iterative-deep-learning
  • 2019
    • Leveraging Crowdsourced GPS Data for Road Extraction from Aerial Imagery
    • RoadNet
    • RoadTagger
    • Generative Graph Transformer
    • road_connectivity
    • NL-LinkNet: Toward Lighter but More Accurate Road Extraction with Non-Local Operations
    • Convolutional Recurrent Network for Road Boundary Extraction(CVPR)
  • 2020
    • DAGMapper: Learning to Map by Discovering Lane Topology
    • Topology-Enhanced Urban Road Extraction via a Geographic Feature-Enhanced Network(TGRS)
    • DeepWindow
    • VecRoad
    • Simultaneous Road Surface and Centerline Extraction
    • Sat2Graph
    • Scribble-based Weakly Supervised Deep Learning for Road Surface Extraction from Remote Sensing Images
    • Adaptive Linear Span Network for Object Skeleton Detection(TIP)
  • 2021
    • SPIN Road Mapper: Extracting Roads from Aerial Images via Spatial and Interaction Space Graph Reasoning for Autonomous Driving
    • CoANet: Connectivity Attention Network for Road Extraction from Satellite Imagery
    • Split Depth-wise Separable Graph Convolution Network for Road Extraction in Complex Environment from High-resolution Remote Sensing Imagery(TGRS)
    • Topo-boundary: A Benchmark Dataset on Topological Road-boundary Detection Using Aerial Images for Autonomous Driving
    • iCurb: Imitation Learning-based Detection of Road Curbs using Aerial Images for Autonomous Driving
  • 2022
    • RNGDet: Road Network Graph Detection by Transformer in Aerial Images
    • Relationformer: A Unified Framework for Image-to-Graph Generation
    • PLGAN: Generative Adversarial Networks for Power-Line Segmentation in Aerial Images
  • 数据集
    • 高分二号乡村道路数据集
    • DeepGlobeRoad

前言

本博文收录一些不一般的道路提取方法。当前主流的模型聚焦与道路面的提取,即只关注IOU的精度,而对于道路的连接性和完整性却很少提及。

2017

DeepRoadMapper

摘要
绘制道路地图对于自动驾驶和城市规划等应用程序至关重要。大部分的工业方法集中在利用昂贵的传感器安装在车队的顶部。当利用循环中的用户时,这将导致非常准确的估计。然而,这些解决方案非常昂贵,而且覆盖面很小。相反,在本文中,我们提出了一种直接从航空图像估计道路拓扑的方法。这为我们提供了一个负担得起且覆盖面广的解决方案。为了实现这一目标,我们利用深度学习的最新发展对航空图像进行初始分割。在此基础上,我们提出了一种算法,将所提取的道路拓扑中缺失连接的原因归结为可以有效解决的最短路径问题。我们在具有挑战性的TorontoCity数据集中演示了我们的方法的有效性,并显示了相对于最先进的数据集非常显著的改进。

Topology Loss


code: https://github.com/dingmyu/Pytorch-Topology-Aware-Delineation

摘要

曲线结构的去线化是计算机视觉中具有多种实际应用的一个重要问题。随着深度学习的出现,目前关于许多自动描述的方法都集中于寻找更强大的深度架构,但继续使用习惯性的像素级损失,如二元交叉熵。在本文中,我们声称像素级损失本身不适合解决这个问题,因为它们无法反映最终预测中错误的拓扑影响。我们提出了一个新的、了解线性结构的高阶拓扑特征的损失项。我们还引入了一个细化管道,它在前面的描述上迭代地应用相同的模型,以细化每个步骤的预测,同时保持参数的数量和模型的复杂性不变。

当与标准的像素级损失相结合时,我们的新损失项和迭代细化都提高了预测描述的质量,在某些情况下,与单独使用二元交叉熵训练的相同分类器相比,精度几乎提高了一倍。我们表明,我们的方法在从显微镜到航空图像的广泛数据范围上优于最先进的方法。

2018

RoadTracer

https://github.com/mitroadmaps/roadtracer
csdn博客

摘要

绘制公路网目前既昂贵又劳力密集。 高分辨率航空图像为自动推断道路网络提供了一个很有前途的途径。 先前的工作使用卷积神经网络(CNNs)来检测哪些像素属于一条道路(分割),然后使用复杂的后处理启发式来推断图形连通性。 我们表明,这些分割方法具有较高的错误率,因为噪声CNN输出是难以纠正的。 本文提出了一种从航空图像中自动构建精确的道路网络图的新方法——道路跟踪器。 道路跟踪器使用基于CNN的决策函数引导的迭代搜索过程直接从CNN的输出导出道路网络图。 我们将我们的方法与15个城市的分割方法进行了比较,发现在5%的错误率下,RoadTracer正确地捕捉到了这些城市45%以上的路口。

论文的贡献

1)提出了RoadTracer方法,利用迭代图构造方式检测影像中的路网,每次迭代时都使用CNN决策网络判断是否将一部分路网加入到已经创建的路网中。这种方法能够避免复杂的后处理过程,从而提高路网检测的精度;
2)提出了一种综合强化学习的CNN决策网络,使用动态标签的方式训练该CNN网络,即同时生成训练数据和训练网络,进而提高CNN决策函数的精度。

iterative-deep-learning

code:https://github.com/carlesventura/iterative-deep-learning

摘要

本文研究了从航空图像中估计道路网络拓扑结构的任务。在对图像像素进行密集语义分类的全局模型的基础上,我们设计了一个卷积神经网络(CNN),它预测输入块的中心像素及其边界点之间的局部连通性。通过迭代这种局部连通性,我们扫描整个图像,并推断出道路网络的全局拓扑,灵感来自于人类用指尖描绘一个复杂的网络。我们对道路网络估计任务进行了广泛和全面的定性和定量评估,并表明我们的方法在进入视网膜血管网络时也能很好地推广。

2019

Leveraging Crowdsourced GPS Data for Road Extraction from Aerial Imagery

code: https://github.com/suniique/Leveraging-Crowdsourced-GPS-Data-for-Road-Extraction-from-Aerial-Imagery

摘要: 深度学习正在彻底改变地图行业。在轻量级的人工管理下,计算机已经使用高分辨率的空中图像在开放街道地图(OSM)上生成了泰国几乎一半的道路。Bing地图在美国显示了1.25亿个计算机生成的建筑多边形。虽然比手工地图要熟练得多,但人们不能从空中绘制出所有的东西。特别是对于道路,一个由图像遮挡的小预测缺口使整个道路没有路径。误连接可能更危险。因此,基于计算机的映射通常需要局部验证,这仍然是劳动密集型的。在本文中,我们提出利用众包GPS数据来改进和支持从航空图像中提取的道路。通过新的数据增强、GPS渲染和一维转置卷积技术,我们显示出与以前的比赛获胜模型相比有了近5%的改进,并且在没有任何新的训练数据或领域适应的预测新区域时具有更好的鲁棒性。

论文的贡献: 在本文中,我们提出将众包GPS数据与航空图像相结合,以进行道路提取。通过来自北京和上海的大型出租车和巴士GPS数据集,我们发现众包GPS数据在变化和偏差方面都有过大的噪声,在密度、分辨率和分布上存在高度的差异。通过将GPS数据作为新的输入层以及分割网络中的RGB通道,再加上我们新的GPS数据增强技术和一维转置卷积,我们的模型显著优于现有的单独使用图像或GPS数据的模型。我们的数据增强对过拟合特别有效。当预测一个新的区域时,尽管GPS数据量和分辨率完全不同,但性能下降幅度远远小于仅使用图像输入的模型。我们已经发布了我们的代码1,我们的数据可以根据要求提供。

RoadNet

code: https://github.com/yhlleo/RoadNet

论文的贡献

  • 该文提出了一个多任务像素端到端CNN,道路网,以同时预测路面,边缘和中心线。 道路网自动学习多尺度和多级特征,并在一个专门设计的级联网络中进行整体训练,可以处理各种场景和尺度的道路。
  • 上述子任务在训练阶段是相关的,其中路面分割的预测被应用于道路边缘检测和道路中心线提取。 一方面,精细的路面分割有利于道路边缘检测和道路中心线提取,这可以看作是具有少数复杂背景的理想初始化。 另一方面,道路的精确边缘/中心线细化了分割边界,特别是道路边缘。
  • 详细设计了所提出的网络的体系结构和损失函数。 因此,经过良好训练的模型可以产生近似单像素宽度的道路边缘/中心线,而不需要非最大抑制(NMS)后处理。
  • 提供了简单的用户交互方法来解决道路上有阴影和遮挡的具有挑战性的区域,这是该领域的第一个工作。
  • 我们开发了一种裁剪和双线性混合方法来处理大的VHR图像,这些图像不可能用有限GPU资源进行整体训练或测试。
  • 发布了一组具有挑战性的针对此类多任务的基准数据集,其中包含图像及其相应的参考地图,每个像素的空间分辨率为0.21米,覆盖了21个背景复杂的典型城市地区。

数据格式:

网络架构


结果

RoadTagger

https://github.com/mitroadmaps/roadtagger

摘要

从卫星图像推断道路属性,如车道数和道路类型,是具有挑战性的。 通常,由于卫星图像中的遮挡和道路属性的空间相关性,只有在考虑道路的遥远路段时,道路属性在道路上的一个位置才能明显。 因此,为了稳健地推断道路属性,该模型必须整合分散的信息,并捕捉沿线特征的空间相关性。 依赖于图像分类器的现有解决方案无法捕获这种相关性,导致精度差。 我们发现这种失败是由一个基本的限制-有限的有效接受场的图像分类器。

为了克服这一限制,我们提出了RoadTagger1,一种端到端的体系结构,它将卷积神经网络(CNNs)和图形神经网络(GNNs)结合起来来推断道路属性。 使用GNN允许信息在道路网络图上传播,并消除了图像分类器的接收场限制。 我们在一个覆盖美国20个城市688平方公里的大型真实世界数据集上对Road Tagger进行了评估,并合成了一个数据集。 在评估中,RoadTagger提高了基于CNN图像分类器的推理精度。 此外,Road Tagger对卫星图像中的干扰具有很强的鲁棒性,并且能够学习复杂的归纳规则来聚集道路网络上的零散信息。

方法

我们提出了RoadTagger,一个端到端的道路属性推理框架,它使用卷积神经网络(CNN)和图形神经网络(GNN)(Wu等人)的新组合来消除这一障碍。 2019)。 它以卫星图像和道路网络图作为输入。 对于道路网络图中的每个顶点,RoadTagger使用CNN从顶点周围的卫星图像窗口导出特征向量。 然后,使用GNN沿道路网络图传播来自每个顶点的信息。 最后,它在每个顶点产生道路属性预测。 该GNN通过沿路网图传播信息,消除了局部图像分类器的有效感知场限制。 联合CNN和GNN模型的端到端训练是该方法成功的关键:RoadTagger不使用CNN选择特征;相反,通过从GNN的输出反向传播,消除了限制先前后处理方法的信息障碍。

Generative Graph Transformer

code:https://github.com/davide-belli/generative-graph-transformer
摘要

图形的深度生成模型在药物设计领域显示出了巨大的前景,但迄今为止除了生成图结构分子之外几乎没有什么应用。在这项工作中,我们演示了一个具有挑战性的任务的概念证明,道路网提取图像数据。这个任务可以被框架为图像条件图的生成,为此我们开发了生成图转换器(GGT),这是一个深度自回归模型,利用注意机制进行图像条件处理和反复生成的图。我们对GGT从语义分割数据中进行道路网提取的应用进行了基准测试。为此,我们引入了基于真实世界的公共数据的图卢兹路网络数据集。我们进一步提出了街道移动距离:一个基于辛克霍恩距离的度量标准,以有效地评估道路网络生成的质量。

论文的贡献
世界上数十万公里的道路尚未绘制好地图。收集和定期更新世界地图是改善自动驾驶系统、优化工业交通和在发生自然灾害时帮助急救行动的关键。目前关于自动道路网提取的研究试图通过使用最先进的深度学习模型找到有效的和可扩展的解决方案[2,4]。特别是,现有的方法[5,9]生成道路网络的语义分割,然后应用人工工程的启发式方法和后处理步骤来提取图表示。后处理是这些方法中的一个关键组成部分,例如用于连接不开连接的路段或去除由噪声分段产生的孤立子图。在这项工作中,我们提出了一个图生成模型来自动从语义分割数据中提取道路网络,消除了后处理启发式的必要性,并允许一个完整的端到端解决问题。

本文的贡献有3个方面:

  • 我们发布了图卢兹路网数据集,用于从卫星图像的语义分割中提取道路网。
  • 我们引入了生成图变换器,这是一个条件图生成的深度自回归模型,由于循环公式和自注意机制,它可以很好地扩展到大图。
  • 我们提出了街道移动距离,一个有效的比较道路网的度量。这个度量是基于点云之间的辛克角距离[10],它对于节点排列、图平移和旋转是不变的。

road_connectivity

code:https://github.com/anilbatra2185/road_connectivity

摘要
从卫星图像中提取道路网络通常会产生支离破碎的路段,导致路线图不适合实际应用。由于缺乏连接监督和难以执行拓扑约束,像素级分类无法预测拓扑正确和连接的道路掩模。在本文中,我们提出了一个名为方向学习的连接任务,其动机是人类通过在特定方向跟踪道路来注释道路的行为。我们还开发了一个堆叠的多分支卷积模块,以有效地利用方向学习和分割任务之间的相互信息。这些贡献确保了该模型预测了拓扑正确的和连接的道路掩模。我们还提出了连接性细化的方法,以进一步增强估计的道路网络。对细化模型进行了预先训练,以连接和细化损坏的地面真相掩罩,然后进行微调,以增强预测的道路掩罩。我们在两个不同的道路提取数据集空间网和深度地球[11]上展示了我们的方法的优势。我们的方法在空间网和深度地球上的道路拓扑度量上比最先进的技术分别提高了9%和7.5%。

论文的贡献
在本文中,我们提出在多分支CNN模型中联合学习一个道路方向和每像素的道路分割(图2)。我们还提出了连接性细化,连接小间隙,减少预测中的假阳性。连接细化模型经过预先训练,以修复损坏的道路地面真相面具(图2和图4)。这使得模型能够有效地纠正各种故障场景。类似于莫辛斯卡等人。[23],我们的连接性改进模型可以迭代使用,然而,我们的改进方法注重在预训练的帮助下改进连接性。最后,通过叠加多分支编码器-解码器结构,设计了一个联合学习模块(图5和图6)。该模块是堆叠沙漏网络[24]的一种变体,但我们的动机不同,即相关任务之间的信息流,以提高多任务学习框架中单个任务的性能。与[3,28]相比,我们的分割模型固有地捕获了中间表示中所连接路段的信息,从而导致了道路网络估计中的精确拓扑结构(图1d)。

NL-LinkNet: Toward Lighter but More Accurate Road Extraction with Non-Local Operations

摘要

从高分辨率卫星(VHR)图像中提取道路是遥感领域的重要课题之一。在本文中,我们提出了一种有效的具有非局部块的非局部链接网络,它可以把握全局特征之间的关系。这使得每个空间特征点都可以参考所有其他的背景信息,并导致更准确的道路分割。详细地说,我们的单一模型没有经过任何后处理,比如CRF的细化,在官方的深度全球挑战中比任何其他已发布的最先进的集成模型表现得更好。此外,我们的NL-LinkNet以43%的参数、giga浮点运算(GFLOPs)和更短的训练收敛时间击败了D-LinkNet。我们还对基线模型的非局部块进行了实证分析。

论文的贡献

  • 我们的单一模型没有任何果后处理,如条件随机场(CRF),比之前在官方的深度地球挑战中发表的任何集成模型显示出更高的性能。NLLinkNet甚至在官方的深度地球挑战[1]中优于排名第一的解决方案[12],使用了43%的参数,更低的GFLOPs和更短的训练收敛时间。
  • 我们代表了对提取道路的非本地作业的实证分析。对于所有不同的成对函数的组合,NL-LinkNet和非局部块的位置,NL-LinkNet取得了比基线(没有任何非局部块)更有希望的结果。单非局部块模型和双非局部块模型都表现出了优于基线模型的性能。
  • 我们首次使用神经非局部操作对VHR卫星图像进行道路提取。非本地操作使模型能够捕获随机依赖关系,以解决部分被阴影、云、建筑物或树木等对象覆盖的道路的地理限制。


Convolutional Recurrent Network for Road Boundary Extraction(CVPR)

摘要: 创建包含场景静态元素的精确信息的高清晰度地图,对于使自动驾驶汽车能够安全驾驶至关重要。本文解决了激光雷达和摄像机图像的可驾驶道路边界提取问题。为了实现这一目标,我们设计了一个结构化模型,其中一个完全卷积网络获得编码道路边界的位置和方向的深度特征,然后,一个卷积递归网络为每个特征输出一个多段线表示。重要的是,我们的方法是全自动的,不需要循环中的用户。我们在北美大城市展示了我们的方法的有效性,在那里我们以99.3%的时间获得完美的道路边界拓扑,在高精度和召回率。

2020

DAGMapper: Learning to Map by Discovering Lane Topology

摘要: 扩大自动驾驶规模的基本挑战之一是能够以低成本创建准确的高清晰度地图(高清地图)。目前试图将这一过程自动化的尝试通常集中在简单的场景上,估计每帧独立的地图,或者没有现代自动驾驶车辆所要求的精度水平。相比之下,在本文中,我们重点绘制复杂公路的车道边界,其中许多车道包含由于分叉和合并引起的拓扑变化。为了实现这一目标,我们将该问题表示为有向无环图形模型(DAG)中的推理,其中图的节点编码车道边界局部区域的几何和拓扑属性。由于我们事先不知道车道的拓扑结构,所以我们也可以推断出每个区域的DAG拓扑结构(即节点和边)。我们在两种不同状态的两条主要北美高速公路上证明了我们的方法的有效性,并显示了较高的精度和查全率以及89%的正确拓扑结构。

Topology-Enhanced Urban Road Extraction via a Geographic Feature-Enhanced Network(TGRS)

摘要: 城市道路提取在公共交通系统和无人驾驶车辆导航中有着广泛的应用。高分辨率遥感图像包含背景杂波,道路外观差异大,连接性复杂,是道路提取中非常具有挑战性的任务。在本文中,我们提出了一种新的端到端深度学习模型,用于从道路区域提取遥感图像。道路特征从三个层次上学习,可以消除背景的分心,增强特征表现。在深度学习模型中引入了一种方向感知的注意块,以保持道路拓扑结构。我们将我们在公共遥感数据集上的方法与其他相关方法进行了比较。实验结果表明,该方法在道路提取和连通性保护方面具有优越性。

论文的贡献:

  • 提出了一种新的从复杂的高分辨率遥感图像中有效提取道路形状特征的深度学习框架。该框架能够有效地识别出背景杂乱的三种尺度下的道路。
  • 通过将点、边缘和区域特征集成到深度学习网络中,可以自动学习出像素、边缘和区域三个层次的形状特征。
  • 在深度学习模型中引入了一种方向感知的注意块,以保持道路拓扑结构。该街区保持了道路的连通性,进一步提高了道路识别的精度。


DeepWindow

https://github.com/rob-lian/DeepWindow/tree/master/ManualPointSampling
论文的创新点

  • 设计了一个基于修补的道路中心估计模型,并通过点注释进行了训练,该模型预测了局部斑块中的道路中心点。
  • 提出了一种道路方向估计算法,以提高跟踪过程的自动化程度,该算法根据犬牙边缘的谱估计道路方向。
  • 实现了一种自动寻种算法,使跟踪过程与道路方向估计算法相结合,实现了全自动化。
  • 一个大型和具有挑战性的道路补丁数据集,手动采样的道路中心点,用于道路提取,将公开用于进一步研究弱监督学习。

方法流程

  1. 道路中心点提取
  2. 自动搜索跟踪种子
  3. 道路方向估计
  4. 迭代拓扑跟踪




VecRoad

https://mmcheng.net/vecroad/
摘要
与野外采集相比,从航空图像中自动提取道路图效率更高,成本更低。这可以通过对CNN预测的道路分割进行向量化的后处理步骤来实现,但不完美的预测将导致道路图的连通性较低。另一方面,迭代的下一步探索可以构建具有更好的道路连接性的道路图,但通常只关注本地信息,不能提供与真实道路的精确对齐。为了提高道路连通性,同时保持道路图与真实道路的精确对齐,我们提出了一种基于点的迭代图探索方案,采用分割线索引导和灵活的步骤。在我们的方法中,我们将下一步移动的位置表示为一个点,该点统一了多个约束的表示,如每一步移动的方向和步长。联合检测道路分割和道路交叉口等信息线索,引导下一步行动,实现更好的道路对齐。我们证明,我们所提出的方法在公共数据集上的f测度和道路连通性指标方面,比最先进的道路图提取方法有相当大的改进。

创新点

  • 一种基于点的迭代步长探测方法,采用灵活的步长检测技术,可以在探测过程中对非平凡点进行精确定位。
  • 基于分割线索的勘探引导,生成具有良好连通性和良好对齐精度的道路图。

方法

迭代探索概述

基于点的迭代探索

Simultaneous Road Surface and Centerline Extraction

https://github.com/astro-ck/Road-Extraction

摘要

准确和最新的路线图在广泛的应用中非常重要。 不幸的是,由于树木和建筑物的遮挡、道路的可辨性和复杂的背景,从高分辨率遥感图像中自动提取道路仍然具有挑战性。 为了解决这些问题,特别是道路连通性和完整性,本文引入了一种新的基于深度学习的多级框架,以同时准确地提取路面和道路中心线。 我们的框架包括三个步骤:增强分割、多个起点跟踪和融合。 初始路面分割是用完全卷积网络(FCN)实现的,然后再多次应用另一个较轻的FCN来提高初始分割的准确性和连通性。在多个起点跟踪步骤中,通过提取分割结果的道路交叉口自动生成起点,然后通过嵌入在卷积神经网络(CNN)中的迭代搜索策略来跟踪连续和完整的道路网络)。 融合步骤通过将分割和跟踪结果相结合来聚合道路网络的语义和拓扑信息,以产生最终的和细化的道路分割和中心线映射。 我们利用三个数据集对我们的方法进行了评估,这些数据集涵盖了世界上40多个城市的各种道路情况。 结果表明,我们提出的框架具有优越的性能。 具体来说,对于用于路面分割的连通性指标和用于中心线提取的完整性指标,我们的方法的性能分别超过了其他方法的7%和40%。

论文的贡献

  • 提出了一种从遥感图像中同时提取路面和中心线的多级框架,该框架结合了基于CNN的分割和跟踪的优点,聚集了道路网络的语义和拓扑信息。 据我们所知,它是第一个同时进行路面分割和中心线跟踪的集成框架。
  • 引入Boosting策略,通过应用多个分割网络来增强道路分割结果,该网络从先前分割的失败案例中逐步学习,以连接初始掩码中的破碎段。 此外,还设计了一种新奇、轻量的编解码结构来促进分割。
  • 将一种基于CNN决策函数的改进迭代搜索算法引入到从多个交点开始跟踪的中心线跟踪中,该算法是从Boost分割预测的道路分割图中自动导出的,这证明了中心线映射的自动化和完整性都得到了提高。
  • 最后,利用经验融合方法,将前一步骤的分割结果与中心线图融合,得到最终的细化路面和中心线。

Sat2Graph

code:https://github.com/songtaohe/Sat2Graph

摘要
从卫星图像中推断道路图是一项具有挑战性的计算机视觉任务。 先验解决方案分为两类:(1)基于像素的分割方法,它预测每个像素是否在道路上;(2)基于图形的方法,它迭代地预测道路图。 我们发现,这两种方法具有互补的优势,同时也受到自身固有的局限性。

在本文中,我们提出了一种新的方法Sat2Graph,它将两个先验类别的优点结合到一个统一的框架中。 在Sat2Graph中的关键思想是一种新的编码方案,即图张量编码(GTE),它将道路图编码成张量表示。 GTE可以训练一个简单的、非经常性的、有监督的模型来预测一组丰富的特征,这些特征直接从图像中捕获图形结构。 我们使用两个大型数据集评估Sat2Graph。 我们发现Sat2Graph在两个广泛使用的度量上超过了现有的方法,TOPO和APLS。 此外,虽然先前的工作只推断平面道路图,但我们的方法能够推断堆叠的道路(例如立交桥),并且这样做是稳健的。


论文的贡献
除了基于张量的网络编码外,本文还做出了两个贡献:

  • 在对20个美国城市覆盖720平方公里区域的大型城市数据集和流行的空间网道路数据集的评估中,Sat2Graph在广泛使用的地形相似度度量上超过了最先进的方法。
  • Sat2Graph可以自然地推断出堆叠的道路,而以前的方法不能处理这些道路。


Scribble-based Weakly Supervised Deep Learning for Road Surface Extraction from Remote Sensing Images

摘要
使用深度学习方法从遥感图像中提取路面已经取得了良好的性能,而现有的方法大多基于完全监督学习,这需要大量具有费力的每像素注释的训练数据。在本文中,我们提出了一种基于涂鸦的弱监督路面提取方法ScRoad提取器,它从容易获得的涂鸦,如中心线中学习,而不是密集注释的路面地面真相。为了将语义信息从稀疏的涂鸦传播到未标记的像素,我们引入了一种道路标签传播算法,该算法同时考虑了道路网络基于缓冲区的特性以及超像素的颜色和空间信息。利用道路标签传播算法生成的方案掩码训练了我们设计的一个双分支编码解码器网络,它由一个语义分割分支和一个辅助边界检测分支组成。我们在三个不同的公路数据集上进行了实验,这些数据集由高分辨率的遥感卫星和世界各地的航空图像组成。结果表明,对于联合相交(IoU)指示器,ScRoad提取器超过经典的涂鸦监督分割方法20%,比最先进的基于涂鸦的弱监督方法至少4%。

Adaptive Linear Span Network for Object Skeleton Detection(TIP)

code: github.com/sunsmarterjie/SDL-Skeleton
摘要

传统的目标骨架检测网络通常都是手工制作的。尽管它们很有效,但它们需要大量的先验知识来为不同尺度粒度的对象配置代表性特性。在本文中,我们提出了由神经结构搜索(NAS)驱动的自适应线性跨度网络(AdaLSN),以自动配置和集成尺度感知特征,用于目标骨骼检测。AdaLSN采用线性跨度理论,为多尺度深度特征融合提供了最早的解释之一。AdaLSN是通过定义一个混合的单位-金字塔搜索空间来实现的,它超越了许多现有的使用单元级或金字塔级特征的搜索空间。在混合空间中,我们应用遗传结构搜索来联合优化单元级操作和金字塔级连接来进行自适应特征空间扩展。与现有技术相比,AdaLSN通过实现显著更高的准确性和延迟权衡来证实其多功能性。它还证明了对图像分割任务,如边缘检测和道路提取的一般适用性。

2021

SPIN Road Mapper: Extracting Roads from Aerial Images via Spatial and Interaction Space Graph Reasoning for Autonomous Driving

code : https://github.com/wgcban/SPIN_RoadMapper

道路提取是建设自主导航系统的重要步骤。检测路段具有挑战性,因为它们的宽度不同,在整个图像中被分叉,并且经常被地形、云或其他天气条件遮挡。仅使用卷积神经网络(ConvNets)来解决这个问题并不有效,因为它在捕获图像中道路段之间的遥远依赖关系方面效率低下,而这对于提取道路连通性是必不可少的。为此,我们提出了一个空间和交互空间图推理(SPIN)模块,当插入ConvNet时,它会对从特征图投影的空间和交互空间上构建的图执行推理。对空间空间的推理提取了不同空间区域和其他上下文信息之间的依赖关系。对投影交互空间的推理有助于从图像中出现的其他地形中适当地描绘道路。因此,SPIN提取了路段之间的长期依赖关系,并有效地描述了其他语义中的道路。我们还引入了一个旋转金字塔,它执行跨多个尺度的旋转图推理来提取多尺度特征。提出了一种基于堆叠沙漏模块和SPIN金字塔的道路分割网络,比现有方法具有更好的性能。此外,该方法计算效率高,显著提高了训练时的收敛速度,可应用于大尺度高分辨率的航空图像。

CoANet: Connectivity Attention Network for Road Extraction from Satellite Imagery

code: https://github.com/mj129/CoANet

摘要

从卫星图像中提取道路是有效、及时地更新道路网络动态变化的一种很有前途的方法。然而,由于其他物体造成的遮挡和复杂的交通环境,基于像素的方法往往会产生破碎的道路,无法预测拓扑的正确性。本文在图网络中的道路形状和连接的激励下,我们提出了一个连接注意网络(CoANet)来联合学习分割和成对依赖关系。由于条形卷积与道路形状更一致,道路呈大跨度、窄、连续分布。我们开发了一个条带卷积模块(SCM),它利用四个条带卷积从不同的方向捕获远程上下文信息,并避免来自无关区域的干扰。此外,考虑到建筑和树木对道路区域造成的遮挡,提出了一种连接性注意模块(CoA)来探讨相邻像素之间的关系。CoA模块包含了图形信息,并可以更好地保持道路的连接。在流行的基准测试(太空网和深地球数据集)上进行的大量实验表明,我们提出的CoANet建立了新的最先进的结果。

论文的贡献:

  • 我们提出了一种连接注意网络,联合学习相邻像素之间的分割和关系,以提高道路的连通性,在广泛使用的道路数据集上比其他方法取得了显著的改进。
  • 我们开发了一个条带卷积模块,它利用四种不同方向的条带卷积来捕获远程上下文信息,并避免来自无关区域的干扰。
  • 我们设计了一个连接注意模块,通过利用成对相邻像素之间的依赖关系并结合图形信息来提高道路的连通性。

Split Depth-wise Separable Graph Convolution Network for Road Extraction in Complex Environment from High-resolution Remote Sensing Imagery(TGRS)

code: https://github.com/tist0bsc/SGCN

摘要:

高分辨率遥感图像的道路信息在各个领域得到广泛应用,基于深度学习的方法有效地显示了较高的道路提取性能。然而,在高分辨率遥感图像中,检测柏油路封闭或树木覆盖的道路,仍存在一些挑战,限制了提取的准确性:1)道路之间的阶级内差异较大,城市物体,特别是道路和建筑物之间的阶级间差异不明显;2)被树木、阴影和建筑物遮挡的道路难以提取;3)道路缺乏高精度遥感数据集。为了提高从高分辨率遥感图像中提取道路的精度,我们提出了一种深度分割(DW)可分离图卷积网络(SGCN)。首先,我们将dw可分卷积进行分割,得到信道和空间特征,以提高道路特征的表达能力。然后,我们提出了一个图卷积网络来捕获通道和空间特征中的全局背景道路信息。利用Sobel梯度算子构造了特征图的邻接矩阵。在马萨诸塞州道路数据集上总共使用了13个深度学习网络,在我们自建的山路数据集上使用了9个,以便与我们提出的SGCN进行比较。我们的模型实现了Union(IOU)的81.65%,f1分数为78.99%,我们提出的数据集的平均IOU为62.45%,f1分数为45.06%。可视化结果表明,SGCN在提取覆盖道路和微小道路方面性能较好,能够有效地从高分辨率遥感图像中提取道路。

论文的贡献:

这项研究有两个创新。(1)我们分割dw可分离卷积以获得信道和空间特征。(2)为了获取道路分割的全局上下文信息,我们使用两种不同的图卷积神经网络对这两个特征进行建模。最后,利用一个梯度算子构造了图的邻接矩阵。

Topo-boundary: A Benchmark Dataset on Topological Road-boundary Detection Using Aerial Images for Autonomous Driving

code: https://paperswithcode.com/paper/topo-boundary-a-benchmark-dataset-on

摘要: 道路边界检测对自动驾驶具有重要意义。它可以用来限制自动驾驶车辆在道路区域上行驶,以确保驾驶安全。与使用车载摄像机/激光雷达在线进行道路边界检测相比,使用航空图像进行离线检测可以缓解严重的遮挡问题。此外,离线检测结果可以直接用于高清(HD)地图的标注。近年来,深度学习技术已被应用于离线检测中。但这一任务仍缺乏公开的数据集,这阻碍了这一领域的研究进展。因此,在本文中,我们提出了一个新的基准数据集拓边界,用于离线拓扑道路边界检测。该数据集包含25,295 1000张×1000大小的4通道航空图像。每个图像提供8个不同子任务的训练标签。我们还设计了一种新的基于熵的连通性评估度量方法,它可以更好地处理噪声或异常值。我们使用该数据集实现和评估了3个基于分割的基线和5个基于图的基线。我们还提出了一个新的基于模仿学习的基线,这在我们之前的工作中得到了加强。通过比较,证明了我们的增强方法的优越性。

iCurb: Imitation Learning-based Detection of Road Curbs using Aerial Images for Autonomous Driving

code: https://paperswithcode.com/paper/icurb-imitation-learning-based-detection-of

摘要: 检测道路限制是自动驾驶的一项基本能力。它可以用于自动驾驶汽车来确定道路上的可驾驶区域。通常,道路路缘是在线检测使用车载传感器,如摄像机和三维激光雷达。然而,使用摄像机进行在线检测可能会面临具有挑战性的照明条件,而且由于点云的稀疏性问题,基于激光激光的方法可能难以检测到遥远的道路限制。近年来,航空图像在世界范围内越来越普及。我们发现,在航空图像中,道路区域和越野区域之间的视觉外观通常是不同的,因此我们提出了一种新的利用航空图像离线检测道路路缘的解决方案。我们的方法的输入是一个航空图像,输出是一个直接表示道路路缘的图(即顶点和边)。为此,我们将该问题表述为一个模仿学习问题,并设计了一个新的网络和一个创新的训练策略来训练一个代理迭代地寻找路边图。在一个公共数据集上的实验结果证实了该方法的有效性和优越性。

2022

RNGDet: Road Network Graph Detection by Transformer in Aerial Images

摘要: 道路网络图为自动驾驶车辆的应用提供了关键的信息,如在可驾驶区域的运动规划。然而,手动标注道路网图是低效的和劳动密集型的。自动检测路网图可以缓解这个问题,但现有的工作要么是基于分割的方法,不能确保令人满意的拓扑正确性,要么是基于图的方法,不能提供足够精确的检测结果。为了解决这些问题,我们提出了一种基于变压器和模仿学习的新方法,即RNGDet(变压器道路网络图检测)。鉴于目前世界各地的高分辨率航空图像都可以很容易地访问,我们在我们的方法中使用了航空图像。该方法以航空图像为输入,迭代地逐点生成道路网络图。我们的方法可以处理各种数量的路段的复杂交叉点。我们在一个公开可用的数据集上评估我们的方法。通过比较实验,证明了该方法的优越性。

Relationformer: A Unified Framework for Image-to-Graph Generation

code: https://github.com/suprosanna/relationformer

图像的全面表示需要理解对象及其相互关系,特别是在图像到图的生成方面,例如,道路网络提取、血管网络提取或场景图生成。传统上,图像到图的生成是通过一种两阶段的方法,包括对象检测,然后是一个单独的关系预测,这防止了同时进行的对象关系交互。本文提出了一个统一的基于变压器的框架,即联合预测对象及其关系。我们利用直接的基于集合的对象预测,并结合对象之间的交互来共同学习对象关系表示。除了现有的[obj]标记外,我们还提出了一种新的可学习标记,即[rln]标记。与[obj]标记一起,[rln]标记通过一系列的相互关联来利用图像中的局部和全局语义推理。与成对的[obj]标记相结合,该标记有助于实现计算效率高的关系预测。

PLGAN: Generative Adversarial Networks for Power-Line Segmentation in Aerial Images

code: https://paperswithcode.com/paper/plgan-generative-adversarial-networks-for
摘要: 各种航空图像中电力线的精确分割对无人机的飞行安全具有重要意义。然而,复杂的背景和非常薄的电力线结构,使其成为计算机视觉中一项固有的困难的任务。本文提出了一种简单而有效的基于生成对抗网络的从不同背景的航空图像中分割电力线的方法PLGAN。我们不是直接使用对抗性网络来生成分割,而是将它们的某些解码特征,通过考虑电力线的上下文、几何和外观信息,将它们嵌入到另一个语义分割网络中。我们进一步利用生成的图像的适当形式进行高质量的特征嵌入,并在霍夫变换参数空间中定义了一个新的损失函数,以增强对非常薄的功率线的分割。大量的实验和综合分析表明,我们提出的PLGAN在语义分割和线检测方面优于现有的最先进的方法。

数据集

高分二号乡村道路数据集

1000*1000 pixel 59张,download

DeepGlobeRoad

链接:https://pan.baidu.com/s/1aG1qdTFEcIwzh2YruBGUNA
提取码:podb

基于遥感影像的道路提取论文、开源代码和数据集汇总相关推荐

  1. 水果分割论文、代码和数据集汇总

    文章目录 2020 MinneApple: A Benchmark Dataset for Apple Detection and Segmentation Grape detection, segm ...

  2. Fruit Ripeness论文、代码和数据集汇总

    文章目录 2019 Microwave-Assisted Extraction Applied to Merlot Grapes with Contrasting Maturity Levels: E ...

  3. 基于遥感影像及轨迹数据融合的地图自动化生成器

    自动化的地图生成对于城市服务及基于位置服务非常重要,现有的工作研究主要利用遥感影像或可以充分反映地图路网情况的车辆轨迹数据生成地图,数据源较为单一,如果能将遥感影像数据及轨迹数据融合起来,地图生成的质 ...

  4. AI实战:基于深度学习的空气质量预测模型开源代码汇总

    基于深度学习的空气质量预测模型开源代码汇总 一.传统机理空气质量模型 空气质量模型是基于人类对大气物理和化学过程科学认识的基础上,运用气象学原理及数学方法,从水平和垂直方向在大尺度范围内对空气质量进行 ...

  5. CVPR2021 行人重识别/Person Re-identification 论文+开源代码汇总

    点击上方"AI算法与图像处理",选择加"星标"或"置顶"重磅干货,第一时间送达 行人重识别(Person re-identification ...

  6. 【目标检测】基于yolov3交通标志检测和识别(附代码和数据集)

    Hello,大家好,我是augustqi.今天给大家分享的目标检测项目是:基于yolov3交通标志检测和识别(附代码和数据集)[目前yolov7都出来了,为什么要用2018年的yolov3呢?因为我想 ...

  7. 基于遥感影像的耕地地块提取相关论文、代码以及相关开源数据集

    文章目录 前言 2000 (传统方法) Agricultural Field Extraction from Aerial Images Using a Region Competition Algo ...

  8. 水体因子在DEM和遥感影像中的提取

    目录 一.介质的区别 二.遥感影像 波段合成 (1)NDWI (2)提取水体并裁剪 (3)计算水域区域的面积. (5)重分类 三.DEM 1.洼地填平 2.水流方向计算 3.水流积聚计算 4.提取河网 ...

  9. 基于遥感影像的变化检测数据集

    文章目录 1. S2MTCP 2. Hi-UCD 3. SECOND 4. CD_Data_GZ 5. LEVIR-CD 6. LEVIR-CD+ 7.SLADCD 8. HRSCD 9. Mts-W ...

最新文章

  1. 【每日随笔】电子签名 ( 下载 “e 签保“ 应用 | 使用 手机号 + 短信验证码 登录 | 发起签署 | 签名 | 获取签名后的 PDF 文件及出证信息 )
  2. PHP+MySQL登录注册,完整版,详细注释
  3. 数据中心的企业正羽科技技术收购虚拟主机VantiCore
  4. iphone7无服务_iphone7基带坏了怎么办,iphone7基带修复多少钱
  5. 长短时记忆网络(LSTM)部分组件(六)
  6. 【必知必会】pro文件及常用配置
  7. java中thread实例_Java多线程并发执行demo代码实例
  8. FPGA SPI总线协议简介
  9. C++类继承 函数调用顺序
  10. 【进击大厂之力扣每日打卡】七进制数
  11. C语言和设计模式(外观模式)
  12. android之weex之component插件开发
  13. Posix信号量操作函数
  14. 6.通信原理 ——数字基带传输系统(第七版 樊昌信 曹丽娜编著)
  15. google地图距离算法,如何计算谷歌地图中两点之间的距离?
  16. 企业微信使用扫一扫案例(含代码和具体步骤)
  17. Matlab 之meshgrid interp griddata interp2
  18. SX1278调试记录
  19. 收藏:学做美食--欢乐年夜饭之神七年糕火焰虾
  20. 哀其不幸,怒其不争!

热门文章

  1. 前端之CSS篇(四)——CSS浮动详解
  2. php购物车页面如何做,HTML代码实现简易购物车
  3. 实时音视频会议场景下QoS策略
  4. Linux系统中安装软件的几种方式
  5. 海康威视DS-2DC2402IW-D3/W 安装使用教程
  6. GCD及其扩展GCD详解
  7. 成语接龙和唐诗背诵文字游戏开发
  8. LikeLib区块链底层公链技术应用
  9. 设计模式 - 状态模式
  10. Windows Mobile开发资源介绍