论文地址 :Rethinking Atrous Convolution for Semantic Image Segmentation
论文代码:Github链接

1. 摘要

  文章主要的工作:

  • 使用空洞卷积来调整滤波器的感受野并控制特征图分辨率
  • 使用不同空洞率的空洞卷积的串联或者并行操作来分割不同尺度的目标,捕获不同尺度的语义信息
  • 扩展的ASPP
  • 实现和训练的细节
  • 没有了DesneCRF的后处理

2. 介绍

  使用DCNN做语义分割取得了一定的效果但是存在两个问题。其一,为了使DCNN学习到更加抽象的特征,采用了多次池化操作和带步长的卷积,使得特征图分辨率降低,但同时这不利于密集预测任务,因为后者需要空间位置信息。为了克服这个问题,引入空洞卷积——通过去掉最后几层的上采样和下采样来获得更加密集的特征图,这样还能在不适用额外参数的情况下控制分辨率。
  其二,如何捕获不同尺度的目标。目前主要有四种不同的方法,如下图:

  • Image Pyramid:对输入图像进行缩放分别输入网络最后合在一起:小的输入用于捕获long-range context,大的输入用于捕获小物体。但是这样做会使得深层的DCNN计算代价高
  • 编解码结构:在编码结构中获取不同尺度的特征并在解码结构中复原
  • 额外的后处理以精细画边框,比如DenseCRF
  • 空间金字塔池化

3. 方法

  在模块串联合金子塔池化的框架中应用带有不同空洞率的空洞卷积和BN层。空洞卷积作为语义模块和SPP的工具,论文提出的模型具有较好的通用性,可以移植到其他网络中。这个模型将ResNet最后一个block多次复制并串联,然后联通ASPP模块,ASPP模块中包含几个并行的空洞卷积,这几个空洞卷积直接应用在特征图而不是信念图上。训练时层上加上BN层。而且,为了捕获全局语义,ASPP还叠加了了图像级别的特征。

3.1 用于密集特征提取的空洞卷积

  克服多次池化和带步长的卷积对密集预测任务的影响。

3.2 使用空洞卷积设计更深的模型


  如上图,简单地复制ResNet最后一个block几次并且并行起来并不利于网络获取深层语义信息,因为这样使得图像的特征集中在最后几层比较小的特征图中,但是连续的带步长卷积不利于语义分割,所以使用了空洞卷积来设计最终的output_stride(原始图像尺寸之于输出特征图尺寸的倍数),如下图所示:

  初次之外还引入了Multi-grid Method,上图中Block4至7,采用Multi-grid来描述这三层的空洞率,比如,当output_stride=16时,Multi_Grid=(1,2,4),相应的空洞率为(2,4,8)。

3.3 ASPP

  ASPP中虽然包含几个不同的空洞率的卷积操作,但是当空洞率越来越大时,有效的滤波器的权重数越来越小。比如在65 X 65的特征图上应用3 X 3的滤波器,非但不能捕获全局图像语义,其效果还退化到与1 X 1滤波器效果一致,因为仅有中心的滤波器权重是有效的。
  因此,ASPP模块中包含几个并行的空洞卷积,这几个空洞卷积直接应用在特征图而不是信念图上。训练时层上加上BN层。而且,为了捕获全局语义,ASPP还叠加了了图像级别的特征。

  如上图所示,ASPP模块中有一个1x1的卷积层和三个3x3的卷积层,空洞率分别为6,12,18,output_stride为16(每一层都有256个滤波器并且后跟BN层);而且ASPP中还增加了image-level特征,最后在模型输出的特征图上进行1x1的卷积(256个滤波器并且后跟BN层)并进行插值上采样至所需的空间维度尺寸。

4. 实验

4.1 ResNet50 v.s. ResNet101

4.2 block4中应用不同的Multi-grid

4.3 ASPP

  在block4中应用Multi-grid以及ASPP中使用不同的空洞率:

4.4 FINAL


欢迎扫描二维码关注微信公众号 深度学习与数学   [每天获取免费的大数据、AI等相关的学习资源、经典和最新的深度学习相关的论文研读,算法和其他互联网技能的学习,概率论、线性代数等高等数学知识的回顾]

图像语义分割(9)-DeepLabV3: 再次思考用于图像语义分割的空洞卷积相关推荐

  1. 图像语义分割_图像语义分割(9)-DeepLabV3: 再次思考用于图像语义分割的空洞卷积...

    论文地址 :Rethinking Atrous Convolution for Semantic Image Segmentation 论文代码:Github链接 1. 摘要 文章主要的工作: 使用空 ...

  2. 【分割模型解读】感受野与分辨率的控制术—空洞卷积

    这是专栏<分割模型解读>的第3篇文章.在这里,我们将共同探索解决分割问题的主流网络结构和设计思想. 前两篇文章介绍了编解码分割结构,今天具体聊聊解码器中涉及到的空间分辨率恢复问题. 作者 ...

  3. 输电线路巡检红外图像与可见光图像融合数据集(含分割标签,1700多张图像),可见光图像,红外灰度图像,一一对应可用于图像配准

    下载地址 :输电线路巡检红外图像与可见光图像融合数据集

  4. 图像的七个不变矩 可用于图像的匹配

    图像的几何不变矩 矩特征主要表征了图像区域的几何特征,又称为几何矩, 由于其具有旋转.平移.尺度等特性的不变特征,所以又称其为不变矩.在图像处理中,几何不变矩可以作为一个重要的特征来表示物体,可以据此 ...

  5. 制作用于图像语义分割训练的标签数据【图像分割】【labelme】

    制作用于图像语义分割训练的标签数据 *写在前面 一.使用labelme制作json数据 1.安装labelme 2.利用labelme制作json数据 二.将json数据转化为图像数据 1.单个jso ...

  6. 用于图像语义分割的GAU与PPM

    简单记录一下用于图像语义分割的2个模块 1. GAU(Global Attention Upsample, 全局注意力上采样模块) 全局注意力上采样模块 (GAU)通过全局池化将高层特征作为低层特征的 ...

  7. Toronto-3D:用于城市道路语义分割的大规模移动激光雷达数据集

    文章:Toronto-3D: A Large-scale Mobile LiDAR Dataset for Semantic Segmentation of Urban Roadways 作者:Wei ...

  8. pytorch 三维点分类_用于RGBD语义分割的三维图神经网络(2017ICCV,已开源)

    3D Graph Neural Networks for RGBD Semantic Segmentation(2017ICCV, citation:78) 开源地址:https://github.c ...

  9. 语义分割之Deeplabv3源码解读

    写在前面,本文的代码是基于Pytorch框架resnet101基础网络的DeepLabv3网络复现 先贴一张代码效果图: 预备知识 本文提到的output_stride来源于deeplabv3论文,指 ...

  10. BiSeNet:用于实时语义分割的双边分割网络-7min精简论文阅读系列-Leon

    BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation BiSeNet:用于实时语义分割的双边分割网络 ...

最新文章

  1. Xcode5搭建Python开发环境
  2. iOS相关,过年回来电脑上的证书都失效了
  3. 通俗讲清楚为什么使用信息熵增益比而不是信息熵增益?
  4. JTable 一个最好的例子
  5. 下拉选择_在管理Excel中实现联动下拉选择
  6. 语言 泰克示波器程序_泰克Tektronix 任意波函数发生器AFG2000系列AFG2021
  7. 如何在 macOS Monterey 中管理应用程序和联系人的 Mac 通知?
  8. java集合框架中迭代器的作用_Java中的集合框架之迭代器
  9. bt种子增加服务器,bt发布-BT种子怎么发布?服务器地址、发布者网址应怎么填写? 爱问知识人...
  10. 计算机自动隐藏桌面图标,Windows 8.1 右下角图标莫名自动隐藏
  11. ibator mysql 分页,ZUI分页器的使用案例(ECLIPSE SMS项目)
  12. php 云片网对接,云片网络短信发送 PHP SDK 奉上
  13. Arduino Uno 使用 人体红外传感器(HC_SR051)实现 人体感应灯
  14. Dilated conv扩张卷积的理解(一看就会)
  15. vim常用操作记这些完全够用了
  16. 老程序员吐槽,今天面试了一个被培训班坑了的学生
  17. js实现上下左右移动小方块
  18. 使用kms导致Windows defender安全中心空白还原方法(windows defender被关闭仍然显示病毒)
  19. Python+tkinter库实现简单图书管理系统
  20. Kalibr安装教程

热门文章

  1. 对列 、生产者与消费者
  2. HDU3032_NimOrNotNim解题报告
  3. 20155313 2016-2017-2 《Java程序设计》第十周学习总结
  4. Linux下搭建BT服务器
  5. VS 2010 复制代码到word出现乱码解决办法
  6. 如何处理Spring、Ibatis结合MySQL数据库使用时的事务操作
  7. 通过IP获取相应所在地的地址
  8. Windows中使用Docker安装ClickHouse
  9. GDB使用gdb-stl-views打印STL容器元素
  10. C++ 调用批处理命令或者.bat(.cmd)文件或者.exe文件