DL之DeepLabv3:DeepLab v3和DeepLab v3+算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

目录

DeepLab v3和DeepLab v3+算法的简介(论文介绍)

DeepLab v3

DeepLab v3+

0、实验结果

DeepLab v3算法的架构详解

DeepLab v3算法的案例应用


相关文章
DL之DeepLabv1:DeepLabv1算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之DeepLabv1:DeepLabv1算法的架构详解
DL之DeepLabv2:DeepLab v2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之DeepLabv2:DeepLab v2算法的架构详解
DL之DeepLabv3:DeepLab v3和DeepLab v3+算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
DL之DeepLabv3:DeepLab v3和DeepLab v3+算法的架构详解

DeepLab v3和DeepLab v3+算法的简介(论文介绍)

DeepLab v3

Abstract  
       In this work, we revisit atrous convolution, a powerful tool  to explicitly adjust filter’s field-of-view as well as control the  resolution of feature responses computed by Deep Convolutional  Neural Networks, in the application of semantic image  segmentation. To handle the problem of segmenting objects  at multiple scales, we design modules which employ atrous  convolution in cascade or in parallel to capture multi-scale  context by adopting multiple atrous rates. Furthermore, we  propose to augment our previously proposed Atrous Spatial  Pyramid Pooling module, which probes convolutional features  at multiple scales, with image-level features encoding  global context and further boost performance. We also elaborate  on implementation details and share our experience  on training our system. The proposed ‘DeepLabv3’ system  significantly improves over our previous DeepLab versions  without DenseCRF post-processing and attains comparable  performance with other state-of-art models on the PASCAL  VOC 2012 semantic image segmentation benchmark.
       在本工作中,我们重新讨论了atrous convolution,这是一个强大的工具,可以显式调整滤波器的视野,并控制深度卷积神经网络计算的特征响应的分辨率,这是在语义图像分割中的应用。针对多尺度目标分割问题,设计了采用级联或并行的无级卷积模块,采用多尺度速率捕获多尺度上下文。此外,我们建议增加先前提出的Atrous空间金字塔池模块,该模块在多个尺度上探测卷积特征,并使用图像级特征编码全局上下文,进一步提高性能。我们也详细阐述了系统的实施细节,并分享了我们在训练系统方面的经验。提出的“DeepLabv3”系统在没有经过DenseCRF后处理的情况下,大大改进了我们之前的DeepLab版本,并在PASCAL VOC 2012语义图像分割基准上取得了与其他先进模型相当的性能。
Conclusion  
       Our proposed model “DeepLabv3” employs atrous convolution  with upsampled filters to extract dense feature maps  and to capture long range context. Specifically, to encode  multi-scale information, our proposed cascaded module gradually  doubles the atrous rates while our proposed atrous spatial  pyramid pooling module augmented with image-level  features probes the features with filters at multiple sampling  rates and effective field-of-views. Our experimental results  show that the proposed model significantly improves over  previous DeepLab versions and achieves comparable performance  with other state-of-art models on the PASCAL VOC  2012 semantic image segmentation benchmark.
       我们提出的“DeepLabv3”模型利用上采样滤波器的卷积来提取密集的特征图,并捕获长范围的上下文。具体来说,为了对多尺度信息进行编码,我们提出的级联模块逐步将atrous速率提高一倍,而我们提出的atrous空间金字塔池模块使用图像级特征增强,探测具有多个采样速率和有效视场的过滤器的特征。实验结果表明,该模型较之前的DeepLab版本有了明显的改进,并在PASCAL VOC 2012语义图像分割基准上取得了与其他现有模型相当的性能。

论文
Liang-ChiehChen, George Papandreou, Florian Schroff, HartwigAdam.
Rethinking AtrousConvolution for Semantic Image Segmentation. CVPR, 2017
https://arxiv.org/abs/1706.05587

DeepLab v3+

Abstract  
       Spatial pyramid pooling module or encode-decoder structure  are used in deep neural networks for semantic segmentation  task. The former networks are able to encode  multi-scale contextual information by probing the incoming  features with filters or pooling operations at multiple rates  and multiple effective fields-of-view, while the latter networks  can capture sharper object boundaries by gradually  recovering the spatial information. In this work, we propose  to combine the advantages from both methods. Specifically,  our proposed model, DeepLabv3+, extends DeepLabv3 by  adding a simple yet effective decoder module to refine the  segmentation results especially along object boundaries. We  further explore the Xception model and apply the depthwise  separable convolution to both Atrous Spatial Pyramid Pooling  and decoder modules, resulting in a faster and stronger  encoder-decoder network. We demonstrate the effectiveness  of the proposed model on the PASCAL VOC 2012 semantic  image segmentation dataset and achieve a performance  of 89% on the test set without any post-processing. Our  paper is accompanied with a publicly available reference  implementation of the proposed models in Tensorflow.
       深度神经网络采用空间金字塔汇聚模块或编码解码器结构进行语义分割。前者通过滤光器探测输入特征或以多种速率和多个有效视场汇聚操作来编码多尺度上下文信息,后者通过逐步恢复空间信息来捕捉更清晰的对象边界。在这项工作中,我们建议结合这两种方法的优点。具体来说,我们提出的模型DeepLabv3+扩展了DeepLabv3,添加了一个简单而有效的解码器模块来细化分割结果,尤其是沿着对象边界的分割结果。我们进一步探讨了Xception模型,并将深度可分离卷积应用于无源空间金字塔池和解码器模块中,得到了一个更快、更强的编解码器网络。我们在PASCAL VOC 2012语义图像分割数据集上验证了该模型的有效性,在没有任何后处理的情况下,测试集的性能达到89%。我们的论文附带了Tensorflow中提出的模型的公开参考实现。
Conclusion  
       Our proposed model “DeepLabv3+” employs the encoderdecoder  structure where DeepLabv3 is used to encode the  rich contextual information and a simple yet effective decoder  module is adopted to recover the object boundaries.  One could also apply the atrous convolution to extract the  encoder features at an arbitrary resolution, depending on  the available computation resources. We also explore the  Xception model and atrous separable convolution to make  the proposed model faster and stronger. Finally, our experimental  results show that the proposed model sets a new  state-of-the-art performance on the PASCAL VOC 2012  semantic image segmentation benchmark.
       我们提出的模型“DeepLabv3+”采用了encoderdecoder结构,其中DeepLabv3用于编码丰富的上下文信息,并采用一个简单而有效的解码器模块来恢复对象边界。根据可用的计算资源,还可以应用无源卷积以任意分辨率提取编码器的特性。同时,我们还研究了Xception模型和atrous可分离卷积,使所提出的模型更快、更强。最后,我们的实验结果表明,该模型在PASCAL VOC 2012语义图像分割基准上设置了一个新的最先进的性能。

论文
Liang-ChiehChen, YukunZhu, George Papandreou, Florian Schroff, Hartwig Adam.
Encoder-Decoder with AtrousSeparable Convolution for Semantic Image Segmentation. Feb. 2018
https://arxiv.org/abs/1802.02611v1

0、实验结果

1、Performance on PASCAL VOC 2012 test

                                 DeepLab v3                                  DeepLab v3+

2、 DeepLabv3+算法PASCAL VOC 2012

Visualization results on the PASCAL VOC 2012 valset

DeepLab v3算法的架构详解

更新……

DL之DeepLabv3:DeepLab v3和DeepLab v3+算法的架构详解

DeepLab v3算法的案例应用

更新……

DL之DeepLabv3:DeepLab v3和DeepLab v3+算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略相关推荐

  1. DL之DeepLabv2:DeepLab v2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之DeepLabv2:DeepLab v2算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 DeepLab v2算法的简介(论文介绍) 0.实验结果 1.DeepLab-v2 ...

  2. DL之YoloV3:Yolo V3算法的简介(论文介绍)、各种DL框架代码复现、架构详解、案例应用等配图集合之详细攻略

    DL之YoloV3:Yolo V3算法的简介(论文介绍).各种DL框架代码复现.架构详解.案例应用等配图集合之详细攻略 目录 Yolo V3算法的简介(论文介绍) 0.YoloV3实验结果 1.Yol ...

  3. DL之InceptionV2/V3:InceptionV2 InceptionV3算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之InceptionV2/V3:InceptionV2 & InceptionV3算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 InceptionV2 & ...

  4. DL之Xception:Xception算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之Xception:Xception算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 Xception算法的简介(论文介绍) 1.论文使用的数据集 Xception算法的架构详 ...

  5. DL之DeepLabv1:DeepLabv1算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之DeepLabv1:DeepLabv1算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 DeepLabv1算法的简介(论文介绍) 0.实验结果 1.FCN局限性及其改进 De ...

  6. DL之PSPNet:PSPNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之PSPNet:PSPNet算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 PSPNet算法的简介(论文介绍) 0.实验结果 PSPNet算法的架构详解 PSPNet算法的案 ...

  7. DL之InceptionV4/ResNet:InceptionV4/Inception-ResNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之InceptionV4/ResNet:InceptionV4/Inception-ResNet算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 InceptionV4/Inc ...

  8. DL之BN-Inception:BN-Inception算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之BN-Inception:BN-Inception算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 BN-Inception算法的简介(论文介绍) BN-Inception算 ...

  9. DL之GoogleNet:GoogleNet(InceptionV1)算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之GoogleNet:GoogleNet(InceptionV1)算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 目录 GoogleNet算法的简介 GoogleNet算法的架构详 ...

最新文章

  1. python复习冒泡排序
  2. 全新发布:《SQL语法速成手册》
  3. Visual Studio警告IDE0006的解决办法
  4. 打开Excel文件并插入图片
  5. .net mvc actionresult 返回字符串_ASP.NET Core中的Action的返回值类型
  6. AD19 add pins to nets错误_《英雄联盟手游》错误代码问题大全 LOL的错误代码都是什么意思...
  7. python 到 poc
  8. 建模实训报告总结_刘鹏在2020江西省职业院校计算机院长主任年会作报告
  9. 高通设备进入高通9008模式
  10. 在线IDE开发入门之从零实现一个在线代码编辑器
  11. UEFI规范实现EDKII项目学习笔记绪论[0]
  12. 音频功率放大电路(使用过的语音方案电路记录)
  13. 小牛叔讲Python第2章:安装配置Python编程环境
  14. 免费4s店汽车保养维修记录查询的方式
  15. 【ROM制作工具】如何精简ROM?快速精简ROM详细教程!
  16. 游戏中随机地图的实现
  17. iOS-Core-Animation-Advanced-Techniques(六)
  18. KMP算法(快速找出字串)
  19. goahead用jst进行简单互动
  20. python中双等号与单等号的区别_双等号 == 与单等号 =

热门文章

  1. Java内存管理和客户加载过程_Java内存管理的进一步理解-模拟过程图解
  2. javaweb网上书店项目设计_计算机毕业设计能不能用成品?
  3. 计算机怎么模拟人,计算机能不能模拟人的思维?
  4. lua 的编译和使用
  5. Linux系统常用磁盘阵列RAID5
  6. KA,连接池居然这么简单?
  7. 分布式架构知识体系必读
  8. 再有人问 Java 中的注解就把这篇文章丢给他!
  9. Java 10 实战第 1 篇:局部变量类型推断
  10. 事件溯源|日志记录-一个基础的微服务模式