膨胀卷积 (Dilated Convolution,也称为空洞卷积),与标准的卷积核不同,膨胀卷积在 kernel 中增加了一些空洞,从而可以扩大模型的感受野。

1.膨胀卷积和标准卷积区别

我们先通过下图看一下膨胀卷积和标准卷积的区别,采用的卷积核都是 3×3 的。膨胀卷积有一个超参数 dilation rate,表示卷积核的间隔,标准卷积的 dilation rate 为 1,下图的膨胀卷积 dilation rate 为 2。

2.为什么需要膨胀卷积

用 CNN 进行图像处理时,通常需要经过多次卷积和 pooling 操作增大模型的感受野。pooling 可以减少图像的尺寸,再使用卷积核可以增大感受野;多个卷积核堆叠也可以增大感受野。经过卷积和 pooling 的 feature map 会比较小,这时可以传到全连接网络进行分类。

但是在进行图像分割时,需要针对每个像素点进行预测,因此还要把减小尺寸后的 feature map 通过 up sampling 的方法 (如 deconv 反卷积) 转回原始图像尺寸再进行预测。如下图所示:

这一过程的主要问题:

信息丢失,pooling 操作是不可逆转的,通过对 feature map 进行 up sampling 还原图像尺寸时丢失信息。无法重构小的物体图像,如果一个物体占 4×4 的像素,则经过 4 次 pooling 操作之后,物体的信息就无法重构了。为了避免使用 pooling 等操作扩大感受野,《MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS》中提出了膨胀卷积 (dilated convolution)。膨胀卷积会在卷积的过程中增加一些空洞,略过空洞的点,如下图所示。

上图中的三个卷积核尺寸都是 3×3。

(a) 中的卷积为标准的卷积,即 dilation rate = 1,此时这个卷积核的感受野大小为 3×3。

(b) 中的卷积核跟在 (a) 的卷积操作后面,但是采用膨胀卷积,dilation rate = 2,即卷积的空洞为 1,此时每个卷积操作的点的感受野为 3×3,整个卷积核的感受野为 7×7。

(c) 中的卷积核跟在 (b) 的卷积操作后面,dilation rate = 4,即卷积空洞为 3,此时每个卷积点对应的感受野为 7×7,整个卷积核的感受野为 15×15。

在 NLP 中也可以利用膨胀卷积,使模型获得更大的上下文信息,如下图所示。

第一层卷积层使用尺寸为 3 的标准卷积核,第二层使用尺寸为 3 的膨胀卷积核 (dilation rate 为 2)。这样第二层的每一个点感受野变成了 7。

3.膨胀卷积的一些问题

膨胀卷积替代了传统的 max-pooling 和 strided convolution,能够增大感受野并保持 feature map 的尺寸和原始图片一致。但是膨胀卷积仍然存在一些问题,在论文《Understanding Convolution for Semantic Segmentation》中提到:

gridding problem,如果我们叠加多个相同的膨胀卷积,会发现感受野中有很多像素没有利用上,出现大量空洞。此时,会丢失数据之间的连续性及完整性,不利于学习。下图展示了连续进行 3 次相同膨胀卷积的效果 (卷积核大小为 3×3,dilation rate = 2)。

长距离的信息有时是不相关的,膨胀卷积扩大了感受野,因此可以取得长距离信息,但是有些长距离信息和当前点是完全不相关的,会影响数据的一致性。为了解决上述问题,论文中提出了混合膨胀卷积 HDC (hybrid dilated convolution)。HDC 主要措施:

使多个膨胀卷积后的感受野内不存在空洞,假设有 n 个膨胀卷积核,dilation rate 分别是 [r1, r2, ..., rn]。如果 [r1, r2, ..., rn] 能使下式满足,则说明感受野不会存在空洞,下式中的 Mi 指第 i 层可以使用的最大的 dilation rate,K 使卷积核尺寸。

不同的卷积层使用不同的 dilation rate,对于一组膨胀卷积,设置不同的 dilation rate,dilation rate 逐渐增大。例如 3 个卷积核可以分别设置 dilation rate 为 [1, 2, 5]。这样最后一层有比较大的感受野,同时不会丢失大量的局部信息,如下图所示。

4.参考文献

MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS

Convolutional Sequence to Sequence Learning

Understanding Convolution for Semantic Segmentation

膨胀卷积的缺点_膨胀卷积学习笔记相关推荐

  1. 膨胀卷积的缺点_膨胀卷积与IDCNN

    Dilation 卷积,也被称为:空洞卷积.膨胀卷积. 一.一般的卷积操作: 首先,可以通过动态图,理解正常卷积的过程: 如上图,可以看到卷积操作. 对于CNN结构,通常包括如下部分: 输入层 (in ...

  2. 膨胀卷积的缺点_卷积、反卷积与膨胀卷积

    卷积(多---->1 的映射) 本质:在对输入做9--->1的映射关系时,保持了输出相对于input中的位置性关系 对核矩阵做以下变形:卷积核的滑动步骤变成了卷积核矩阵的扩增 卷积的矩阵乘 ...

  3. 分组卷积计算量_轻量级卷积神经网络的设计技巧

    作者 | zhouyuangan 来源 | CVer 这篇文章将从一个证件检测网络(Retinanet)的轻量化谈起,简洁地介绍,我在实操中使用到的设计原则和idea,并贴出相关的参考资料和成果供读者 ...

  4. y空间兑换代码_【CV学习笔记】色彩空间

    关注"深度学习冲鸭",一起学习一起冲鸭! 设为星标,第一时间获取更多干货 作者:云时之间来源:知乎链接:https://zhuanlan.zhihu.com/p/103387082 ...

  5. opencv 手选roi区域_【opencv学习笔记六】图像的ROI区域选择与复制

    图像的数据量还是比较大的,对整张图片进行处理会影响我们的处理效率,因此常常只对图像中我们需要的部分进行处理,也就是感兴趣区域ROI.今天我们来看一下如何设置图像的感兴趣区域ROI.以及对ROI区域图像 ...

  6. cs客户端 实时权限_【CS学习笔记】7、SMBbean的作用

    0x00 SMB Beacon 简介 SMB Beacon 使用命名管道通过一个父 Beacon 进行通信.这种对等通信对同一台主机上的 Beacon 和跨网络的 Beacon 都有效.Windows ...

  7. 漏洞payload 靶机_【CS学习笔记】5、如何建立Payload处理器

    这一小节学起来感觉有些吃力,里面很多概念理解的不是很清楚,如果有大佬看到描述错误的地方欢迎留言指正,避免误导他人. 再次声明,这只是我的个人学习笔记,不要当成教程去看,建议想学习CS的小伙伴可以看看A ...

  8. dw超链接标签_小花园DW学习笔记

    点击蓝字关注我们   DW学习笔记 1.站点文件夹命名为学号-姓名,首页文件名为index.htm,站点所有图片均保存在images子目录中,图片可以从其它网站下载.抓图或手机拍照,要处理成.jpg或 ...

  9. malloc 源码_【C++学习笔记(九)】之 new运算符的使用/ new 与 malloc的异同(附代码,详细注释)...

    new 运算符的使用 一. new的简单介绍: new运算符用于在堆区开辟空间,所有new出来的对象,对返回该类对象的指针. 二. new 与 malloc 的异同点: 1.malloc作用相同, m ...

最新文章

  1. Git 初始化及仓库创建及操作
  2. 操作系统 第五章【虚拟存储器】【MOOC答案】
  3. redis为什么选择单线程工作模型
  4. Linux之基本正则表达式(grep)
  5. mysql的索引和执行计划
  6. Linux内核分析课程期中总结
  7. 利用python进行数据分析—五、pandas入门
  8. SEO:搜索引擎优化的35个技巧
  9. 将excel文件中的数据导入导出至SQL数据库中(Microsoft.Jet.OLEDB.4.0和Microsoft.ACE.OLEDB.12.0|office2003和office2007)...
  10. 2022年应届毕业生求职简历模板:电子商务、销售、新媒体运营,80份毕业生个人简历模板
  11. jQuery灯箱插件lightBox使用方法
  12. java中ArrayList(基础)
  13. MCU多系统服务器与云平台,MCU多系统服务器与云平台
  14. 升级至android 5.0,OPPO X9007 升级到Android5.0 Color2.1(root版) 详细纪实
  15. Vue3悬浮返回主页按钮设计与实现
  16. github上下载的源码 如何使用 ?
  17. HTML实现动态圣诞树和雪花效果
  18. 计算机初二说课稿,初二数学说课稿
  19. 【2017】法定各种假期的规则及概念
  20. 计算机绘图三号图纸,江苏开放大学计算机绘图形考3

热门文章

  1. MSDN Library Visual Studio .NET 2003 简体中文版(ISO) 免费下载
  2. 2022年意识科学十大主题焦点与研究进展
  3. 无线功率单位mW(毫瓦)和dBm(分贝毫瓦)的换算关系
  4. 手工雕刻图纸_手工玉石雕刻图样大全
  5. 清博舆情系统_什么是舆情
  6. Apache和 Nginx的介绍
  7. Python编程 | 系统编程 | 脚本运行上下文 | 标准流
  8. C#,图像二值化(17)——全局阈值的ISODATA算法(亦称作InterMeans法)及其源程序
  9. 【CSDN博客之星】您的支持就是我最大的动力!喜欢本博客的读者,请拿出您宝贵的几秒钟时间来支持一下吧,非常感谢~
  10. 晒晒我的厨艺修炼成果