P4.膨胀卷积(Dilated Convolution)空洞卷积(Atrous Convolution)

1.膨胀卷积的作用

增大感受野

保持原输入特征图W、H

kernel元素间存在间隙即膨胀因子r(r=1,相邻,即普通卷积)

因为没有设置padding,所以高宽发生了改变。若padding=1,则保持原输入特征图W、H

FCN网络在backbone中下采样32倍,然后经过上采样还原回原图尺寸。若下采样倍率过大,对还原回原图尺寸将产生很大的影响。VGG16网络通过MaxPooling层进行池化操作,降低特征图的高度和宽度,还会丢失一些细节信息及比较小的目标,这些丢失的信息无法通过上采样进行还原。若去掉MaxPooling层,会导致得到的特征图所对应的原图的感受野变小,MaxPooling层可以增大特征层的感受野。后面的一系列卷积层是在之前所对应的感受野之上做进一步操作,移除MaxPooling层会带来一些问题。

2.gridding effect

https://arxiv.org/abs/1702.08502

膨胀系数相同

gridding effect现象:Layer4没有利用到范围内的所有像素值

膨胀系数不同

两次实验的感受野相同,但是膨胀系数不同时很多像素值没有被利用到

膨胀系数均为1 (普通卷积)

参数相同的情况下,使用膨胀卷积可以增大感受野

3.Hybrid Dilated Convolution(HDC)

当连续使用多个膨胀卷积时设置膨胀系数

连续堆叠N个膨胀卷积

卷积核KxK

膨胀系数r1,r2,r3......

HDC的目标:通过一系列膨胀卷积后能够完全覆盖底层特征层的方形区域,并且这个方形区域之间没有任何孔洞

定义第i层两个非0元素间的最大距离Mi = max[Mi+1 - 2ri, Mi-1 - 2(Mi+1 - ri), ri]

第n层两个非0元素间的最大距离为最后的膨胀系数Mn = rn

设计目标:M2 <= K

膨胀系数从1开始:若希望在高层特征图中的pixel利用到底层的所有像素,那么M1=1,M1>=r1,若r1>1,则M1>1,产生了间隙,所以必须r1=1

将膨胀系数(dilation rates)设置成锯齿结构

公约数不能大于1

4.效果对比

霹雳吧啦Wz语义分割学习笔记P4相关推荐

  1. 霹雳吧啦Wz语义分割学习笔记P3

    P3.FCN网络结构详解 1.前言 Fully Convolutional Networks for Semantic Segmentation 2015CVPR https://arxiv.org/ ...

  2. 霹雳吧啦Wz语义分割学习笔记P6

    P6.DeepLabV1网络简介 1.前言 semantic image segmentation with deep convolutional nets and fully connected C ...

  3. 霹雳吧啦Wz语义分割学习笔记P2

    P2.转置卷积Transposed Convolution 1.作用:上采样 转置卷积不是卷积的逆运算 转置卷积也是卷积 2.转置卷积运算步骤 在输入特征图元素间填充s-1行.列0 在输入特征图四周填 ...

  4. 霹雳吧啦Wz语义分割学习笔记P8

    P8.DeepLabV3网络简介 1.前言 Rethinking Astrous Convolution for Semantic Image Segmentation 2017CVPR https: ...

  5. 霹雳吧啦Wz语义分割学习笔记P5

    P5.Pytorch官方实现的FCN网络结构 backbone:VGG16 -> ResNet50:使用了膨胀卷积

  6. 使用Pytorch搭建U-Net网络并基于DRIVE数据集训练(语义分割)学习笔记

    使用Pytorch搭建U-Net网络并基于DRIVE数据集训练(语义分割)学习笔记 https://www.bilibili.com/video/BV1rq4y1w7xM?spm_id_from=33 ...

  7. 语义分割学习笔记(四)膨胀卷积

    推荐课程: 1.膨胀卷积_哔哩哔哩_bilibili(膨胀卷积原理讲的很清楚) 2.膨胀卷积(Dilated convolution)详解_哔哩哔哩_bilibili(gradding effect问 ...

  8. 联合目标检测和语义分割——学习笔记

    联合目标检测和语义分割 目标检测 目标检测是一种与计算机视觉和图像处理相关的计算机技术,用于检测数字图像和视频中特定类别的语义对象(例如人,建筑物或汽车)的实例.然而现实中物体的尺寸.姿态.位置都有很 ...

  9. 语义分割学习笔记(一)

    文章目录 一.区别 二.代码演示原图像与mask融合 三.数据处理 一.区别 语义分割:每个像素都打上标签(这个像素是人,树,背景等)语义分割只区分类别,不区分类别中的具体单元 实例分割:不光要区分类 ...

  10. 点云分割学习笔记2022

    PointCloudSegmentation 点云分割 PointCloudSegmentation测试笔记_AI视觉网奇的博客-CSDN博客 代码地址:https://github.com/Liya ...

最新文章

  1. 使用DjangoUeditor将Ueditor移植到Django(BAE环境下)
  2. Oracle的left join中on和where的区别
  3. 中国剩余定理 互质与非互质版本
  4. 如何在labview中用c语言编程,编程语言之争:LabVIEW还是C语言?-测试测量-与非网...
  5. pythonjava app切出后无网络连接_写了一个java的Server 用python的client访问却访问不通问题。...
  6. python 整数对应的字符,在Python中将字符串从字母解密为整数映射
  7. IT不是技术,IT是一个世界
  8. Mybatis之代码自动生成工具
  9. dev cpp编译c语言,C语言实践|Dev cpp开发环境及其介绍
  10. FM国际复利理财基金
  11. 学习记录-FDD大规模MIMO系统的稀疏信道估计技术研究
  12. Excel复制单元格样式
  13. 录入姓名完成座位表,学习前端的小伙伴可以关注一波,用js+html+css构成
  14. Android 文件存储-图片存储
  15. 如何查询中文期刊影响因子
  16. Python中inplace、subset参数的意义
  17. C++内存问题(很多公司面试的题目,值得一看,看懂了别忘了告诉我)
  18. 网络:access和trunk端口和hybird端口的区别
  19. 大数据、云计算、物联网、数据库、数据仓库、OLAP、OLTP等学习大数据你必须了解的概念,我的学习总结
  20. 用python测测你身体是否健康

热门文章

  1. html中怎么做弹窗广告,基于JQuery实现页面定时弹出广告
  2. python 住区数据_GitHub - dstao/data_analysis: 基于Python的南京二手房数据采集及可视化分析...
  3. 汽车分类(奔驰G系列和奔驰c系列)
  4. 【密码术】openssl椭圆曲线密钥对生成
  5. 收集一些电子书下载的网站
  6. 《1024伐木累》-小白篇之丽姐(前篇)-总章节四
  7. 《西方的智慧》伯特兰 罗素
  8. 联机带AI版3D桌球游戏源码
  9. 小游戏《塔防》开发(一)上篇
  10. 数据走进宫崎骏的动画世界