Dilated Convolution介绍
Dilated Convolution介绍
相关的两篇论文分别是[ICLR2016]MULTI-SCALE CONTEXT AGGREGATION BY DILATED CONVOLUTIONS 和 [CVPR2017]Dilated Residual Networks。作者为Fisher Yu(http://www.yf.io/) 。
1.问题背景
- 语义分割,目标检测检测任务需要高分辨率的featuremap来获得更准确的结果。
- 要想保证高分辨率的特征图可能导致感受野过小,而上述语义分割,目标检测需要大量上下文信息。
- 于是出现下采样再上采样的U型结构网络,同时兼顾感受野和featuremap分辨率。但pooling操作会损失信息。
2.解决方法
通过pooling不断下采样会损失信息,降低精度。单纯地增大卷积核会导致计算复杂度增加。而 dilated convolution 可以解决上述问题。
3.Dilated Convolution
通常被译作扩张卷积或空洞卷积。(个人观点:因为dilated和形态学处理的膨胀运算单词一样,所以我经常叫作膨胀卷积。)
2-dilated卷积如下图所示,就是卷积核的元素间隔拉大了。所以2-dilated 3 * 3卷积实际上会覆盖一个5*5的区域。覆盖的区域更大,自然而然感受野就更大。(图片引自水印出处)
dilation_kernel_size = dilation * (original_kernel_size - 1) + 1
此外,论文作者在2015年12月就向caffe提交了dilated卷积的实现代码,有兴趣的话可以到github caffe的提交记录中看到大家当时对于是否用dilation命名的讨论,还挺有意思。
caffe中配置dilation参数如下,直接在prototxt中配置dilation参数即可:
repeated uint32 dilation = 18; // The dilation; defaults to 1
4.dilated卷积核的感受野
- F1F1{F_1}由 1-dilated 卷积产生,每个元素感受野为3*3
- F2F2{F_2}在F1F1{F_1}基础上由2-dilated卷积产生,每个元素感受野为7 * 7
- F3F3{F_3}在F2F2{F_2}基础上由4-dilated卷积产生,每个元素感受野为15 * 15
所以感受野计算公式:Fi+1=(2i+2−1)∗(2i+2−1)Fi+1=(2i+2−1)∗(2i+2−1){F_{i+1}=(2^{i+2}-1)*(2^{i+2}-1)}
5.存在问题
dilated卷积使得卷积核不连续,损失了连续性信息,容易导致网格化问题
dilated卷积虽然可以获得较大感受野,但不利于小物体分割
6.解决网格化问题
出自第二篇文章《Diltated Residual Resnet》。因此作者的实验都是在ResNet上进行的,作者通过实验证明了一些结构可以消除网格化问题:
- 去除Max pooling
- 在dilated 卷积后面增加普通卷积的残差block
- 去掉后接block的shortcut
7.实验结果
- 分类
* 目标定位
- 语义分割
首先实验证明了作者提出的消除网格化的结构是非常有效的。
其次证明了dilated卷积与ResNet相结合效果优秀,用更少的block达到甚至超过了更深的ResNet才有的效果。
7.个人体会
- 对于需要较大感受野和featuremap的任务例如语义分割,关键点定位,dilated 卷积是非常有用的操作。在2017年COCO人体关键点检测竞赛中获得第一名的CVPR2018文章《Cascaded Pyramid Network for Multi-Person Pose Estimation 》也提到ResNet+dilated卷积的效果与U型网络hourglass相当。
- 对于dilated卷积的优化还有一篇文章待读《Understanding Convolution for Semantic Segmentation》,文章提出了一些标准化设计Hybrid Dilated Convolution (HDC)。https://arxiv.org/pdf/1702.08502.pdf
Dilated Convolution介绍相关推荐
- 【多标签文本分类】Semantic-Unit-Based Dilated Convolution for Multi-Label Text Classification
·阅读摘要: 在本文中,作者基于Seq2Seq模型,提出多级膨胀卷积.混合注意力机制两点来加以改进,应用于多标签文本分类,提高了效果. ·参考文献: [1] Semantic-Unit-Bas ...
- 如何理解空洞卷积(dilated convolution)
论文:Multi-scale context aggregation with dilated convolutions 简单讨论下dilated conv,中文可以叫做空洞卷积或者扩张卷积.首先介绍 ...
- 空洞卷积(Dilated Convolution):有之以为利,无之以为用
https://www.toutiao.com/a6695893685260780044/ 原论文链接 https://arxiv.org/pdf/1705.09914.pdf 一.论文核心 < ...
- 膨胀卷积(Dilated convolution)
Dilated conv,中文叫做空洞卷积或者扩张卷积,起源于语义分割,大部分文章也用于语义分割,具体能否对其他应用有价值姑且还不知道,但确实是一个不错的探究方向. 感受野(receptive fie ...
- 空洞卷积(dilated convolution)
目录 一.dialated convolution的发展由来 二.对dialated convolution的理解 三.重新思考卷积: Rethinking Convolution 四.空洞卷积的拯救 ...
- Dilated Convolution + Receptive Field
1.感受野(Receptive Field) Receptive field 是啥?看看网上的大佬们怎么说. The receptive field is defined as the region ...
- dilated convolution
首先是诞生背景,在图像分割领域,图像输入到CNN(典型的网络比如FCN[3])中,FCN先像传统的CNN那样对图像做卷积再pooling,降低图像尺寸的同时增大感受野,但是由于图像分割预测是pixel ...
- Hybrid Dilated Convolution学习笔记
Hybrid Dilated Convolution学习笔记 1.膨胀卷积 也叫空洞卷积,是在普通卷积的基础上加了一个空洞率,如下图所示: 上图就是一个空洞率为2的空洞卷积,以3×3为例,算上空洞率为 ...
- casual Convolution 和 dilated Convolution
参考链接:https://www.cnblogs.com/fantastic123/p/9389128.html author:gswycf "An Empirical Evaluation ...
最新文章
- 【spring boot】8.spring boot的日志框架logback使用
- PHP 魔术方法__set() __get() 方法详解
- 通达信公式大全_通达信MACD金叉的选股公式大全
- spring cloud微服务_年后进大厂,必备这份微服务面试题:Dubbo+SpringBoot+Cloud
- 做人真善美,做事拖后腿
- (软件工程复习核心重点)第三章需求分析-第三节:状态转换图
- 声明式事务、Spring 中常用注解、Ajax
- 到上海,与陈绪零距离
- Windows平台下使用GoLand生成Linux可执行文件
- 隧道人员定位管理系统
- python中1 100的质数_Python求解1到100之间的质数
- java找不到符号解决办法
- 高端android手机,7月Android中高端手机性能榜出炉:华为高端落榜,中端没进前三!...
- 关于破解邮箱的一点心得
- plsql developer 怎么卸掉中文语言包
- android uyghur app,App Store 上的“Uyghur Quran And Translation”
- 使用kali对同一局域网内的设备进行断网和查看设备图片
- matlab中条件数无穷大报错,matlab求条件数
- Camera Framework 分析
- 中国月子中心行业发展形势展望及投资前景预测报告2021年版