DeepLab v3

论文地址:Rethinking Atrous Convolution for Semantic Image Segmentation

1、相比于DeepLab v2,有一点改进就是,在v2的时候,dilaconv只是用在最后一层也就是pool5层,然后通过不同的rate进行尺寸的融合,而在v3中,dilaconv在图像缩小16倍的时候,之后全部都使用了dilaconv,用来捕捉感受野而不降低分辨率

如上图所示,(a)为正常的ResNet,(b)为v3中提出来的使用dilaconv的方式

2、ASPP(Atrous Spatial Pyramid Pooling)中加入了BN(batch normalization),并且使用了image-level future

并且特征图进行1*1卷积,三个3*3卷积(rate=6、12、18),在经过一个global average pooling(image level future),然后把这五个特征图concat一起,在使用1*1卷积降低纬度得到特征图

DeepLab v3+

论文地址:Encoder-Decoder with Atrous Separable Convolution for Semantic Image Segmentation

相较于v3的改进:

1、使用了encoder和decoder模型,encode还是使用之前v3的结构,然后在此基础上又加入了decode

文中提到了使用output stride来表示最终输出特征图和输入图像尺寸之间的倍数关系,如最终特征图缩小了32倍,则output stide=32

encoder:也就是DeepLab v3的结构中,可以通过调整最后几层atrous conv的参数来调整output stide,v3中在ASPP中还加入了image-level future(也就是用global average pooling得到的1*1特征图)

decoder:如下图(c)所示,也就是在根据最后的output stide进行4倍双线性插值,然后在找到encoder中相同尺寸中特征图层中最后的输出进行concate(在concate之前会用1*1卷积调整到合适的通道数),然后再通过3*3卷积调整特征图,再通过4倍上采样得到最后的score map

文中还提到了output stide=16的时候,是速度和准确率最均衡的一种,output stide=8的时候会使分割的边界效果更好但是会增加计算量

上图中(a)就是DeepLab v3的结构,(b)是传统encoder-decoder,(c)是本文提出的使用atrous conv的encoder-decoder结构

2、使用了Xception中的Depthwise separable convolution(深层可分离卷积)

3、融合了Depthwise separable convolution和atrous convolution得到atrous separable convolution

如上图所示,(a)为Xception中的Depthwise conv,(c)就是本文提出的融合了Depthwise separable convolution和atrous convolution得到atrous separable convolution

4、对Aligned Xception进行了改进

所有的maxpooling替换成了depthwise separable convolution以便于在任意的分辨率上使用atrous separable convolution提取特征

在每个3*3depthwise convolution后边都加上了BN(batch normalization)和ReLU激活函数

[深度学习从入门到女装]DeepLab v3相关推荐

  1. [深度学习从入门到女装]V-Net

    论文地址:V-Net: Fully Convolutional Neural Networks for Volumetric Medical Image Segmentation V-Net相当于对于 ...

  2. [深度学习从入门到女装]keras实战-Unet3d(BRAST2015)

    本文采用Unet3d进行BRAST2015数据集的分割 BRAST2015读取 BRAST2015数据集为脑部肿瘤分割的,数据集分为两类,一类为HGG(高分级胶质瘤),另一类为LGG(低分级胶质瘤) ...

  3. [深度学习从入门到女装]DSFD: Dual Shot Face Detector

    论文地址:https://arxiv.org/abs/1810.10220v2 Dual Shot Face Detector 这是一篇CVPR19来自腾讯的论文,本文是在SSD的基础上,加入了Fea ...

  4. 《Keras深度学习:入门、实战与进阶》之印第安人糖尿病诊断

    本文摘自<Keras深度学习:入门.实战与进阶>. 1.数据理解 本节使用Pima Indians糖尿病发病情况数据集.该数据集最初来自国家糖尿病/消化/肾脏疾病研究所.数据集的目标是基于 ...

  5. 150页书籍《PyTorch 深度学习快速入门指南》附PDF电子版

    为什么说是极简教程,首先本书只涵盖了150页.内容比较精简,特别适合作为 PyTorch 深度学习的入门书籍.为什么这么说呢?因为很多时候,一份厚重的书籍往往会削弱我们学习的积极性,在学习一门新的语言 ...

  6. 深度学习动手入门:GitHub上四个超棒的TensorFlow开源项目

    原文:http://www.techweb.com.cn/news/2017-07-31/2566452.shtml 深度学习动手入门:GitHub上四个超棒的TensorFlow开源项目 2017. ...

  7. 深度学习---从入门到放弃(九)RNN入门

    深度学习-从入门到放弃(九)RNN入门 1.RNN简介 RNN(Recurrent Neural Network)是一类用于处理序列数据的神经网络.回想一下我们之前说到过的CNN,它可以通过在空间上共 ...

  8. 深度学习---从入门到放弃(一)pytorch基础

    深度学习-从入门到放弃(一)pytorch Tensor 类似于numpy的array,pandas的dataframe:在pytorch里的数据结构是tensor,即张量 tensor简单操作 1. ...

  9. 【机器学习】机器学习和深度学习概念入门

    机器学习和深度学习概念入门(上) 作者:谭东  来源:机器学习算法与自然语言处理 目  录 1   人工智能.机器学习.深度学习三者关系 2   什么是人工智能 3  什么是机器学习 4  机器学习之 ...

最新文章

  1. winform 控件半透明设置
  2. 从零开始撸一个Kotlin Demo
  3. php 获取一年的月份_php 根据日期获取星座
  4. effective python 90个有效方法_Effective Python:编写高质量Python代码的90个有效方法(原书第2版)...
  5. 并发编程的挑战——sychronized锁
  6. PCB的制作工艺流程
  7. wps怎么关闭那个登录界面_关闭wps窗口快捷键是什么?
  8. BUUCTF-MISC-被劫持的神秘礼物~梅花香之苦寒来
  9. 【无中生有】---14---用户行为监控系统嵌入
  10. Kassl dOPC Client Toolkit Version 4.36XX-国内数一数二的工具包全能版
  11. NOIP2016 酱油记
  12. 提升你幽默感的经典短句
  13. 在一起计时器_没想到吧?快手竟然给厕所上安装了计时器,或许职场从此再无带薪拉屎...
  14. python程序设计论文_浅谈初中Python程序设计教学的实践与体会
  15. 解读《花木兰》中的木兰形象
  16. C++ 将字符串转换为浮点数
  17. OpenPLC61850: An IEC 61850 MMS compatible open source PLC for smart grid research
  18. 关于Invoke、InvokeRepeating、StartCoroutine调用规则释义
  19. 模糊控制器的MATLAB仿真(位置跟踪和 Simulink仿真)
  20. [蓝桥杯python] 无聊的逗:逗志芃在干了很多事情后终于闲下来了,然后就陷入了深深的无聊中。不过他想到了一个游戏来使他更无聊。他拿出n个木棍,然后选出其中一些粘成一根长的,然后再选一些粘成另一个长

热门文章

  1. mvc html.dropdownlist onchange,JS简单操作select和dropdownlist实例
  2. Python数据类型与数据结构简单整理(未完成)
  3. Ubuntu16.04下ffmpeg把MP4转换成图片的方法
  4. 2021年全球音频接口收入大约145.1百万美元,预计2028年达到171.2百万美元
  5. Android最全炫酷UI
  6. 2011级-csdn-java-张侃— 过滤器(自动登录)
  7. 3.ROS编程学习:话题通信python
  8. 计算机如何通过手机连接网络打印机,如何让手机连接上打印机,原来是这样的...
  9. 时间计算方法(时区)
  10. 【数据结构】:有序树和无序树