Dilated Convolution介绍

相关的两篇论文分别是[ICLR2016]MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS[CVPR2017]Dilated Residual Networks。作者为Fisher Yu(http://www.yf.io/) 。

1.问题背景

  • 语义分割,目标检测检测任务需要高分辨率的featuremap来获得更准确的结果。
  • 要想保证高分辨率的特征图可能导致感受野过小,而上述语义分割,目标检测需要大量上下文信息。
  • 于是出现下采样再上采样的U型结构网络,同时兼顾感受野和featuremap分辨率。但pooling操作会损失信息。

2.解决方法

通过pooling不断下采样会损失信息,降低精度。单纯地增大卷积核会导致计算复杂度增加。而 dilated convolution 可以解决上述问题。

3.Dilated Convolution

通常被译作扩张卷积空洞卷积。(个人观点:因为dilated和形态学处理的膨胀运算单词一样,所以我经常叫作膨胀卷积。)

2-dilated卷积如下图所示,就是卷积核的元素间隔拉大了。所以2-dilated 3 * 3卷积实际上会覆盖一个5*5的区域。覆盖的区域更大,自然而然感受野就更大。(图片引自水印出处)

dilation_kernel_size = dilation * (original_kernel_size - 1) + 1

此外,论文作者在2015年12月就向caffe提交了dilated卷积的实现代码,有兴趣的话可以到github caffe的提交记录中看到大家当时对于是否用dilation命名的讨论,还挺有意思。

caffe中配置dilation参数如下,直接在prototxt中配置dilation参数即可:

repeated uint32 dilation = 18; // The dilation; defaults to 1

4.dilated卷积核的感受野

  • F1F1{F_1}由 1-dilated 卷积产生,每个元素感受野为3*3
  • F2F2{F_2}在F1F1{F_1}基础上由2-dilated卷积产生,每个元素感受野为7 * 7
  • F3F3{F_3}在F2F2{F_2}基础上由4-dilated卷积产生,每个元素感受野为15 * 15

所以感受野计算公式:Fi+1=(2i+2−1)∗(2i+2−1)Fi+1=(2i+2−1)∗(2i+2−1){F_{i+1}=(2^{i+2}-1)*(2^{i+2}-1)}

5.存在问题

  • dilated卷积使得卷积核不连续,损失了连续性信息,容易导致网格化问题

  • dilated卷积虽然可以获得较大感受野,但不利于小物体分割

6.解决网格化问题

出自第二篇文章《Diltated Residual Resnet》。因此作者的实验都是在ResNet上进行的,作者通过实验证明了一些结构可以消除网格化问题:

  • 去除Max pooling
  • 在dilated 卷积后面增加普通卷积的残差block
  • 去掉后接block的shortcut

7.实验结果

  • 分类


* 目标定位

  • 语义分割


首先实验证明了作者提出的消除网格化的结构是非常有效的。

其次证明了dilated卷积与ResNet相结合效果优秀,用更少的block达到甚至超过了更深的ResNet才有的效果。

7.个人体会

  • 对于需要较大感受野和featuremap的任务例如语义分割,关键点定位,dilated 卷积是非常有用的操作。在2017年COCO人体关键点检测竞赛中获得第一名的CVPR2018文章《Cascaded Pyramid Network for Multi-Person Pose Estimation 》也提到ResNet+dilated卷积的效果与U型网络hourglass相当。
  • 对于dilated卷积的优化还有一篇文章待读《Understanding Convolution for Semantic Segmentation》,文章提出了一些标准化设计Hybrid Dilated Convolution (HDC)。https://arxiv.org/pdf/1702.08502.pdf

Dilated Convolution介绍相关推荐

  1. 【多标签文本分类】Semantic-Unit-Based Dilated Convolution for Multi-Label Text Classification

    ·阅读摘要:   在本文中,作者基于Seq2Seq模型,提出多级膨胀卷积.混合注意力机制两点来加以改进,应用于多标签文本分类,提高了效果. ·参考文献:   [1] Semantic-Unit-Bas ...

  2. 如何理解空洞卷积(dilated convolution)

    论文:Multi-scale context aggregation with dilated convolutions 简单讨论下dilated conv,中文可以叫做空洞卷积或者扩张卷积.首先介绍 ...

  3. 空洞卷积(Dilated Convolution):有之以为利,无之以为用

    https://www.toutiao.com/a6695893685260780044/ 原论文链接 https://arxiv.org/pdf/1705.09914.pdf 一.论文核心 < ...

  4. 膨胀卷积(Dilated convolution)

    Dilated conv,中文叫做空洞卷积或者扩张卷积,起源于语义分割,大部分文章也用于语义分割,具体能否对其他应用有价值姑且还不知道,但确实是一个不错的探究方向. 感受野(receptive fie ...

  5. 空洞卷积(dilated convolution)

    目录 一.dialated convolution的发展由来 二.对dialated convolution的理解 三.重新思考卷积: Rethinking Convolution 四.空洞卷积的拯救 ...

  6. Dilated Convolution + Receptive Field

    1.感受野(Receptive Field) Receptive field 是啥?看看网上的大佬们怎么说. The receptive field is defined as the region ...

  7. dilated convolution

    首先是诞生背景,在图像分割领域,图像输入到CNN(典型的网络比如FCN[3])中,FCN先像传统的CNN那样对图像做卷积再pooling,降低图像尺寸的同时增大感受野,但是由于图像分割预测是pixel ...

  8. Hybrid Dilated Convolution学习笔记

    Hybrid Dilated Convolution学习笔记 1.膨胀卷积 也叫空洞卷积,是在普通卷积的基础上加了一个空洞率,如下图所示: 上图就是一个空洞率为2的空洞卷积,以3×3为例,算上空洞率为 ...

  9. casual Convolution 和 dilated Convolution

    参考链接:https://www.cnblogs.com/fantastic123/p/9389128.html author:gswycf "An Empirical Evaluation ...

最新文章

  1. 【spring boot】8.spring boot的日志框架logback使用
  2. PHP 魔术方法__set() __get() 方法详解
  3. 通达信公式大全_通达信MACD金叉的选股公式大全
  4. spring cloud微服务_年后进大厂,必备这份微服务面试题:Dubbo+SpringBoot+Cloud
  5. 做人真善美,做事拖后腿
  6. (软件工程复习核心重点)第三章需求分析-第三节:状态转换图
  7. 声明式事务、Spring 中常用注解、Ajax
  8. 到上海,与陈绪零距离
  9. Windows平台下使用GoLand生成Linux可执行文件
  10. 隧道人员定位管理系统
  11. python中1 100的质数_Python求解1到100之间的质数
  12. java找不到符号解决办法
  13. 高端android手机,7月Android中高端手机性能榜出炉:华为高端落榜,中端没进前三!...
  14. 关于破解邮箱的一点心得
  15. plsql developer 怎么卸掉中文语言包
  16. android uyghur app,‎App Store 上的“Uyghur Quran And Translation”
  17. 使用kali对同一局域网内的设备进行断网和查看设备图片
  18. matlab中条件数无穷大报错,matlab求条件数
  19. Camera Framework 分析
  20. 中国月子中心行业发展形势展望及投资前景预测报告2021年版

热门文章

  1. 猎豹移动推出直播产品Live.me风靡美国
  2. 为啥女性洗澡都很慢,究竟在干啥?
  3. 树莓派+STM32人脸识别门禁系统(中)----- 树莓派部分
  4. Jmeter接口自动化(八)函数 上
  5. 八数码 || 九宫重排(A*搜索代码)
  6. OneDrive,在云端
  7. Excel编号相同数字
  8. python基础以及面向对象
  9. 进入 32 位时代,谁能成为下一个8051?
  10. 【数据结构 树:二叉树分类、红黑树讲解】