空洞卷积

  也可以根据字面意思把dilated这个词直接翻译成膨胀卷积或者扩张卷积。这个概念就得重新回到感受野这个话题上,这里补充一些感受野的知识点。感受野可以理解为一个神经元接触到原始特征图的区域范围,感受野越大,神经网络越可以看到更加宏观的特征。这个也很好理解,如果关注一个像素,只能看到图像的颜色信息,但是关注更多像素,这样就能看到轮廓。所以增大感受野对于宏观语义特征的提取是有帮助的。
  我们之前谈到过正常的卷积,卷积核的大小对应感受野的大小,这个3×3的卷积,感受野区域也就是这么大。但是如果给一个卷积加上dilated的概念,就意味着要对这个卷积核做膨胀处理,我在转置卷积中提到了膨胀这个概念,那个时候是特征图做膨胀处理,这个时候是对卷积核做膨胀处理,操作是一样的。而卷积一旦膨胀之后,虽然是通过在卷积核中填充了一些零,但是不得不说,卷积核的感受野确实变大了,是在没有增加参数的前提上,感受野变大了。

  在VGG Net的文章中提出来一种理论:一个5×5的卷积,等价于两个3×3的卷积在不同层上的堆叠(stack),而一个7×7的卷积等价于三个3×3的卷积在不同层上的堆叠。这个概念主要也是从感受野的角度去理解的,把一个7×7的特征图(感受野区域)经过三层3×3的卷积之后,得到的结果正好是1×1的,这个1×1的小区域其实就是感受到了特征图中7×7的区域。使用三个3×3的卷积在不同层上的堆叠代替一个7×7的卷积,不仅可以减少参数量(7×7−>3×3×37×7->3×3×37×7−>3×3×3),而且增加了网络的层数,可以引入更多的非线性单元。
  神经网络中除了卷积可以逐渐的扩大神经元的感受野,还有一种方式是通过下采样来增大图像的感受野。如常见的池化操作,通过一个池化(最大池化、平均池化)一般都能把一个元素的感受野扩大两倍,因为一个池化结果对应着上层特征图2×2的区域。但是使用池化层会带来一些问题:
  首先是内部数据结构的丢失,池化层对数据的丢弃理由是不充分的,这样会丢失信息。其次是如果在语义分割的任务中,小物体的信息是无法重建的,假如使用了四个池化层,则感受野(的边长)经过四个池化层扩大了16倍,此时一个区域对应16×16个上层特征图区域。如果物体的尺寸小于16个像素,显然这个物体的的特征就丢失了,已经再也无法对这个物体进行重建了。而且下采样是不可学习的。
  针对以上几个问题,在语义分割的网络中,提出了扩张卷积这个概念,通过卷积来实现下采样。如上图,7×7的特征图,经过3×3的卷积核做膨胀系数为2的卷积运算,结果变成了3×3的。而且每一个1×1的区域在原来的特征图上关联区域是5×5的,直接就扩大了感受野。


  膨胀系数,就是卷积核一个1×1小区域扩张的倍数,原本两个小区域的之间的差距是1,扩张系数是几,扩张后的距离就是几。所以两个小区域之间填充0的个数=扩张系数-1。而扩张后整个卷积核的感受野的边长=(卷积核的边长-1)×膨胀率+1。
  但是使用扩张卷积,可能会出现The Gridding Effect(网格效应)这个问题,假如多次叠加膨胀系数为2的卷积核(大小为3×3)的话,则我们最终得到的一个小区域,是对应原特征图的5×5的感受野的。

  假如这个5×5的感受野是我们通过同样尺寸同样方式的卷积得到的,我们可以将其对应到上层9×9的特征图中。

  我们可以继续往上追溯,但是每一层总会有没有用到的一些的特征图信息,造成了很严重的信息丢失和不连续。事实上,不同层级的扩张系数如果不互质的话,总会存在这样没有用到的区域。所以一般设置的时候都需要满足不同层的dilation rate互质的关系,至于这里还会有更深入的分析,这里仅给出一点点比较重要的。
  转置卷积和空洞卷积都是符合卷积的输出大小计算公式的,转置卷积中想要输出的特征图更大,就得扩大特征大,所以对特征图进行扩张,而这里想要让感受野更大,也就意味着要对卷积核做扩张。

空洞(扩张dilated)卷积相关推荐

  1. Speech Bandwidth Extension With WaveNet

    利用WAVENET扩展语音带宽 作者:Archit Gupta, Brendan Shillingford, Yannis Assael, Thomas C. Walters 博客地址:https:/ ...

  2. 总结-空洞卷积(Dilated/Atrous Convolution)、gridding问题以及解决方案、训练技巧BN和PReLU、CReLU

    这里有个可视化.直观的图:https://github.com/vdumoulin/conv_arithmetic https://zhuanlan.zhihu.com/p/50369448 http ...

  3. 【深度学习】讲一个深度分离卷积结构和空洞卷积的应用

    [深度学习]讲一个深度分离卷积结构和空洞卷积的应用 文章目录 前言:看一张图像 1 概述1.1 正常卷积1.2 Depth可分离卷积 2 深度可分离卷积的优点 3 空洞(扩张)卷积(Dilated/A ...

  4. 深度学习中常见卷积(普通卷积、1×1卷积、转置卷积、可分离卷积、膨胀(空洞)卷积、3D卷积)

      总是在网络上看到各种名词的卷积,但是有搞不懂是什么含义,于是结合网上查阅的资料,总结一下.目前比较常用的卷积主要有常规的卷积.1×1卷积.转置卷积.可分离卷积.膨胀卷积.3D卷积.   以下是一些 ...

  5. 关于深度可分离卷积、空洞卷积、分组卷积的理解笔记

    深度可分离卷积(Depthwise separable convolution) 深度可分离卷积由逐通道卷积(Depthwise Convolution)和逐点卷积(Pointwise Convolu ...

  6. 对深度可分离卷积、分组卷积、扩张卷积、转置卷积(反卷积)的理解

    参考: https://zhuanlan.zhihu.com/p/28749411 https://zhuanlan.zhihu.com/p/28186857 https://blog.yani.io ...

  7. 论文解读丨空洞卷积框架搜索

    摘要:在通用目标检测算法,空洞卷积能有效地提升网络的感受野,进而提升算法的性能.本次解读的文章提出了一种空洞卷积变体及对应的空洞卷积搜索方法,充分探索空洞卷积的潜力,进一步提升网络模型的性能. 本文分 ...

  8. 膨胀卷积(空洞卷积)学习篇

    文章目录 提出背景 感受野 膨胀卷积是什么 膨胀卷积的设计原理 膨胀卷积的优缺点 膨胀卷积的改进 膨胀卷积基于Pytorch的代码实现 总结 原论文链接: 2016ICLR<Multi-Scal ...

  9. 一文看懂膨胀(空洞)卷积(含代码)

    前言:本文的个别内容.图片出自各个博客,但是因时间较久目前找不到原作者链接,如有需要,烦请各位原作者联系我. 目录 一.什么是膨胀卷积?为什么要用膨胀卷积 二.膨胀卷积的特点(优点) 三.膨胀卷积特点 ...

  10. 图像语义分割_图像语义分割(9)-DeepLabV3: 再次思考用于图像语义分割的空洞卷积...

    论文地址 :Rethinking Atrous Convolution for Semantic Image Segmentation 论文代码:Github链接 1. 摘要 文章主要的工作: 使用空 ...

最新文章

  1. 图片过渡效果一例 使用bitmapData操作
  2. JQuery iframe 刷新效果
  3. 文件的读取流和书写流
  4. 利用74LS161计数器芯片分别实现模12,模20的计数器,并在QuartusⅡ上进行仿真
  5. html部分位置属性
  6. 测试员不可不知的几款bug管理工具
  7. 《权力的游戏》第八季剧情翻水:超40万粉丝请愿重拍
  8. VS2015自带的LocalDB数据库的用法
  9. 20种在学习编程的同时也可以在线赚钱的方法
  10. 计算机课题推荐人意见,课题申请推荐人意见怎么写
  11. react 函数组件使用了 hook 后闪屏问题的分析与解决
  12. Python中使用print函数的三种输出方式
  13. python做一个网页多少钱_网站建设平台_ 网站建设多少钱_ _做一个企业网站需要多少钱_64岁的Python之父表示退休后太无聊 正式加入微软...
  14. Mac常用的五款思维导图软件,中文版推荐
  15. 模拟电子技术设计--简易函数信号发生器的设计与制作
  16. 大型网站架构演进历程
  17. 一文读懂md5,md5有什么用,什么是md5加盐
  18. 打造爆款时怎么做淘宝付费推广?
  19. vue中使用echarts折现图表(多图表与定时递归刷新图表解决方案在附录1、2中)
  20. 笔记本计算机无法开机密码,笔记本开机密码搞忘了如何解决_笔记本电脑忘了开机密码怎么办-win7之家...

热门文章

  1. 安全工具(免费杀毒软件Avast、免费防火墙费尔、免费木马清理工具arswp,AVG/Ewido,超级兔子)...
  2. IE首页被劫持,桌面图标异常的个人综合清理方法
  3. Canvas 仿百度贴吧客户端 loading 小球
  4. oracle ssd加速,使用Oracle的SSD
  5. sql 2008 R2 备份和还原
  6. kudu设计-tablet
  7. Linux下C语言开发通讯录管理软件(一)
  8. 【权限设计】权限系统的设计——由浅至深
  9. jflash烧录教程_Flash基础入门之J-Link固件烧录以及使用J-Flash向arm硬件板下载固件程序...
  10. Epub与Kindle