语义分割论文系列总结

  • 1.0经典论文总结
    • 1.1 FCN
    • 1.2 Parse-Net
    • 1.3 U-Net
    • 1.4 Deeplab系列(v1,v2,v3,v3+)
    • 1.5 Non-local

在语义分割领域研究论文和实现代码已经有快半年了,对语义分割目前阅读的所有论文做一个总结和回顾

语义分割定义:
对图片中每一个像素点进行像素级别的分类。

1.0经典论文总结

语义分割是图像领域一个重要的分支,而深度学习对图像领域的推动作用毋庸置疑,整篇文章也只是针对所有的深度学习语义分割论文进行总结。

1.1 FCN

2015年,语义分割在深度学习领域的里程碑论文,论文创新式的将图像分类网络转换为全卷积网络,让语义分割达到了端到端训练的效果。该网络结构如下

1.2 Parse-Net

论文的主要创新点是考虑了全局上下文特征,即在网络中使用了一个全局池化层。具体操作如下:(L2Norm是因为作者在文中提出全局池化的特征不能直接concate,所以加入了一个Norm操作)

1.3 U-Net

语义分割中的传奇网络,至今依然在各个领域活跃,之后语义分割的一大部分模型设计都是基于这个结构:(论文中总结了patchwise训练和全图像训练的优缺点,也第一次使用了损失加权来解决类别不平衡)

1.4 Deeplab系列(v1,v2,v3,v3+)

语义分割长盛不衰的模型,一直在改进,这里主要看v3+就行,他们的改进如下:
v1:第一次加入空洞卷积,即在backbone上将最后两个下采样取消,用2,4空洞率的空洞卷积代替,现在已经是常用操作。
v2:(1)设计出ASPP模块的第一个版本,没有全局pool;
v3:(1)设计出ASPP模块完全版本,(2)并复制backbone的最后一个块,并应用多重网格对最后一个块进行设计(指resnet);
v3+:(1)结合skip链接的思路,将4倍下采样的中间层结果,concate到最后特征中,效仿fcn做了一个恢复空间信息的操作。(2)同时改变xception网络(重复middle_flow16次)作为backbone。(3)也实现了深度可分离空洞卷积。
v3+的网络结构如下:

1.5 Non-local

最后一个经典网络并不是专门用于语义分割,Nonlocal是2017年发表的注意力机制应用在图像领域的第一篇论文,也是这篇论文开启了语义分割领域注意力机制的热潮,一直到2020年的今天,很大一部分的顶会论文都是注意力机制。

注意力机制的思想很简单,计算两者之间的一个权值,比如a和b,计算a和b之间的一个关系权重w,然后用wa(b也可以,主要看你想得到什么),然后最终的输出就是(wa + b),而这个权值代表什么,也是由网络的设计者决定,这里简单举个例,w为a和b的相似度,相似度越高,w越大,则wa+b也就越大,基于此,将这个思路扩展到2维上,可以发现,这样的一个操作,可以改变b的分布,如今的绝大多数网络都是如此进行设计。

语义分割网络的设计如今大体上就是对这几类经典网络进行组合。现在的主流是注意力与各种结构的结合,以及注意力机制中各种a和b的选择,这些a和b需要在网络中进行抽取,并不是一个简单的工作。

当然,也有一些另辟蹊径的新网络,比如改变backbone,设计语义分割的专属的特征提取网络,如实时分割的Bisenet。

总结一下这些经典网络的work原因:
(1)deeplab系列的空洞卷积和aspp增大了感受野,但是并没有进行下采样,对于语义分割而言,下采样会严重丢失空间信息。
(2)aspp和unet这种类型的结构,相当于考虑了多尺度,对于图像中相同类别的物体大小有差异以及不同物体大小也有差异的问题进行了一定解决。
(3)Unet的结构以及fcn的skip链接,做了恢复空间信息的操作。
(4)上下文信息的考虑,Nonlocal网络主要是学习了上下文关系,而parsenet和aspp由于感受野较大的关系,也在一定范围内考虑了上下文信息。

可以发现,语义分割主要是空间信息和上下文信息,以及语义信息三种。之后的Bisenet就抽取了上下文信息和语义空间信息进行融合,也就诞生了bisenetv1。

语义分割经典论文总结相关推荐

  1. 引用量超6000的语义分割经典论文DeepLabv3解读

    分享语义分割领域的一篇经典论文DeepLabv3,由谷歌发表于CVPR2017.开源代码地址: Tensorflow版本:https://github.com/tensorflow/models/tr ...

  2. 综述 | 语义分割经典网络及轻量化模型盘点

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 基于图像的语义分割又被理解为密集的像素预测,即将每个像素进行分类, ...

  3. 一文看尽9篇语义分割最新论文(GPSNet/Graph-FCN/HMANet等)

    前言 恰逢 2020年,本文再次更新近期值得关注的最新语义分割论文.这次分享的paper将同步推送到 github上,欢迎大家 star/fork(点击阅读原文,也可直接访问): https://gi ...

  4. 【语义分割】论文代码资料汇总

    语义分割的资料总结 1.Github一份丰富的论文清单 from hangdong1587,这份清单中包含了一下几个部分: 语义分割基础论文 基于多边形的分割 基于U-net的分割 前景分割 语义分割 ...

  5. 语义分割系列论文 ParseNet

    语义分割系列论文 ParseNet 核心思想--Global Context 理论感受野的大小(Receptive Field) 实际感受野的大小 此文章如何扩大感受野? 疑点(读者可以忽略本节) 总 ...

  6. 干货 | 语义分割综述论文总结与推荐

    添加几篇 19-20 年的综述 Evolution of Image Segmentation using Deep Convolutional Neural Network: A Survey 这篇 ...

  7. 制作自己的segnet数据集_语义分割【论文解读】经典网络SegNet 值得仔细反复阅读...

    摘要: 提出了一种新颖而实用的深度全卷积神经网络结构用于语义像素分割称为SegNet.这个核心的可训练分割引擎包括一个编码器网络,一个相应的解码器网络,以及一个像素级的分类层.编码器网络的架构与VGG ...

  8. 【语义分割】语义分割经典模块

    本文将介绍深度学习语义分割任务中几个经典模块,主要包括:ASPP.PP.Encoding.JPU.DCM,Criss-Cross Attention几个模块,同时给出了各个模块的实现代码. 目录 一. ...

  9. 介绍一篇通过无监督depth estimation改进语义分割的论文

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨黄浴@知乎 来源丨https://zhuanlan.zhihu.com/p/341180239 ...

最新文章

  1. 驾驶员行为监控系统:需要它来管理车队
  2. AngularJs 取消对 html 字符串标签转义
  3. 使用Nessus漏扫
  4. Flutter是什么
  5. 光流 | 由粗到精的稠密光流算法
  6. gedit用圖形界面修改背景顏色
  7. mysql win7 sp1 常见问题_win7旗舰版安装不了mysql问题-------win7系统版本选择问题的一点探索...
  8. 私人博客定制----封装数据库接口
  9. 一个关于Remoting的简单例子
  10. github 使用方法总结 还有一部分不太懂
  11. python中使用frame需要安装_python – 在SFrame中分组而不安装graphlab
  12. java 正则表达式 html,java正则表达式语法大全
  13. 主机无法复制文件到ubuntu虚拟机的解决方法
  14. uniapp使用阿里字体图标库
  15. 自定义异常 extends Exception
  16. python 应用程序无法正常启动 000007b_“应用程序无法正常启动(oxc000007b)”解决方案...
  17. 如何快速熟悉一套程序的框架结构
  18. 令人担忧的5G网络可被黑客入侵
  19. Vue3 第十篇Plus:使用iconfont阿里巴巴矢量图标库
  20. 毕业季,说一说自己从学生初入职场的感受

热门文章

  1. 借贷记账法下的账户结构、借贷记账法的记账规则、借贷记账法下的账户对应关系与会计分录
  2. 2022研究生数学建模竞赛(华为杯)B题
  3. df.to_excel用法
  4. 2.6 数学公式增补
  5. 计算:单纯形法求解线性规划问题
  6. java设计模式--工厂模式、静态代理模式、动态代理模式
  7. 金山词霸 IE9取词兼容性补丁包下载(来自官方)
  8. Linux内核源码目录结构及含义
  9. linux变量inode,Linux inode cache分析
  10. 区块链随想录——为啥很多做技术的人,都没有发财?