语义分割算法汇总

  记录一下各类语义分割算法,便于自己学习。
  由DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation开始,在文章中,作者说明了在Cityscapes test set上各类模型的表现。如下图所示:

主流算法在PASCAL VOC2012数据集上的效果对比。

1.DFANet

  文章梳理了语义分割网络中常见的模型,如下图所示

(a)这种模型可以获取多尺度的特征,并且保留空间信息。但是,它在处理High level feature时的效果不够好,因为它没有应用卷积来融合特征;同时,在高分辨率的那个分支上限制了模型的速度。
(b)语义分割中,金字塔池化是处理High level feature的常用的方法,然而金字塔池化在速度上会极大消耗资源。
©feature maps通过对网络输出进行上采样并用另一个子网络优化特征映射来替换High level feature,在高分辨率与子像素细节上同时进行学习,可以获得更多细节信息。然而,由于特征流是单一的,随着整个结构深度的增加,高维特征和感受场通常会使得精确损失。
(d)基于以上方法,文章提出一种层级别的方法,将low-level features与空间信息传给语义理解。因为所有的网络结构相似,可以连接所有相同分辨率的层,获得不同层级的信息。

DFANet网络结构图

backbone


  通常语义分割模型都会选择预训练模型作为编码模块,通常有 ResNet, Xception, DenseNet等,DFANet选择了一种计算量更小的模型作为backbone(修改后的Xception),并且探究了怎么才能在限制计算量的情况下提升模型表现能力。
  由于网络越深,细节丢失越多,从网络结构图可以看到DFA网络综合了模型连接与层级连接方式来避免这个问题,模型中采用了三个backbone的连接。最后在xception的全连接层之后接一个1*1的卷积层递归通道数,去匹配Xception的backbone的feature map。

decoder

  文章直接将高级特征与之前的细节部分融合,然后高级特征进行4倍双线性上采样,每个backbone的层级的输出的与其他backbone有相同分辨率的部分进行融合,然后高级特征与细节都在最后的结果中展现,这时候再进行4倍上采样,得到最后的预测结果。

2.PSPNet

PSP网络结构

pspnet的网络结构图如下:

网络结构为:

  1. CNN(这里用的是resnet)提取出抽象特征
  2. (重点)经过金字塔池化层,获得四个不同尺度的信息,然后再用1*1卷积综合各个通道的信息,这里我个人理解就是远看一个物体与近看一个物体会获得不同的结果,全局池化即上图中红色的块产生的效果类似远看一个物体获得的信息,而后面的就是越来越近的看一个物体获得的信息。
  3. 上采样,这里对每个尺度池化结果做双线性上采样,到feature map的大小(缩小1/8)
  4. 将不同尺度的信息结合,对不同尺度的结果做concanate
  5. 上采样,并输出结果,这里上采样经过了三次,一次放大两倍,最终将feature map大小的结果还原为原图大小(图中没有展示出来,代码中是这样做的)。

PSP解决的问题


  在上图第一行图片中,模型没有考虑到物体之间的联系(空间信息丢失,车几乎不会在水上),FCN将船预测为了车。第二行,FCN产生了分类混淆的情况,建筑的镜面反射使得墙体被分类为天空。第三行图片中,FCN无法很好的识别小物体,没能将枕头识别出来。
  PSP网络结合不同尺度的信息可以解决以上FCN的不足。

3.BiSenet

网络结构


  BiSenet网络最突出的特点就是应用了双向网络(图中的Spatial path与Context path),在语义分割中,最难的两个点,一个是感受野(Receptive field)的大小,另一个是空间信息(Spatial information)。一般网络越深,感受野越大,空间信息丢失越多。
  通过三个卷积提取特征,保留了空间信息,同时Context path快速下采样,使得感受野变大,最后再融合两种特征后经过上采样就可以得到结果。

语义分割算法汇总(长期更新)相关推荐

  1. 汇总|实时性语义分割算法(全)

    我们在上篇--汇总|实时性语义分割算法(上篇)中,已经总结了[1]~[12],这里我们继续. [13]用于实时语义分割的双向分割网络 <BiSeNet: Bilateral Segmentati ...

  2. mask rcnn算法分析_实例分割综述(单阶段/两阶段/实时分割算法汇总)

    作者:Danny明泽 来源:公众号@3D视觉工坊 链接:实例分割综述(单阶段/两阶段/实时分割算法汇总) 简介 目标检测或定位是数字图像从粗到细的一个渐进过程.它不仅提供了图像对象的类,还提供了已分类 ...

  3. 弱监督的语义分割论文汇总

    弱监督的语义分割论文汇总 弱监督语义分割导读 弱监督语义分割论文整理 基于Bounding box的弱监督语义分割 基于Image-level labels的弱监督语义分割 基于Scribbles的弱 ...

  4. 道路场景语义分割算法

    道路场景语义分割算法 输入输出接口 Input: (1)左右两个摄像头采集的实时图像视频分辨率(整型int) (2)左右两个摄像头采集的实时图像视频格式 (RGB,YUV,MP4等) (3)摄像头标定 ...

  5. DL之SegNet:SegNet图像分割/语义分割算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略

    DL之SegNet:SegNet图像分割/语义分割算法的简介(论文介绍).架构详解.案例应用等配图集合之详细攻略 导读 基于CNN的神经网络SegNet算法可进行高精度地识别行驶环境. 目录 SegN ...

  6. 语义分割算法性能比较_语义分割江湖那些事儿

    今天的分享者是旷视余昌黔,来自旷视研究院 Detection 组,他将向我们分享旷视研究院 Detection 组近两年持续在做的 Semantic Segmentation 相关工作,代表性成果主要 ...

  7. FCN与U-Net语义分割算法

    FCN与U-Net语义分割算法 图像语义分割(Semantic Segmentation)是图像处理和是机器视觉技术中关于图像理解的重要一环,也是 AI 领域中一个重要的分支.语义分割即是对图像中每一 ...

  8. CV之IS:计算机视觉之图像分割(Image Segmentation)/语义分割算法的简介、使用方法、案例应用之详细攻略

    CV之IS:计算机视觉之图像分割(Image Segmentation)/语义分割算法的简介.使用方法.案例应用之详细攻略 目录 图像分割算法的简介 1.常用的数据集 2.图像分割的评价指标

  9. 实时语义分割算法大盘点

    本文转载自计算机视觉工坊 语义分割论文 语义图像分割是计算机视觉中发展最快的领域之一,有着广泛的应用.在许多领域,如机器人和自动驾驶汽车,语义图像分割是至关重要的,因为它提供了必要的上下文,以采取行动 ...

  10. 新开源!实时语义分割算法Light-Weight RefineNet

    点击我爱计算机视觉标星,更快获取CVML新技术 前几日52CV君分享了论文<Real-Time Joint Semantic Segmentation and Depth Estimation ...

最新文章

  1. uml识别事件表格_LOPA分析:使能条件和修正因子在场景识别方法中的应用
  2. Markdown基本语法【转】
  3. 【沟通交流】弱关系向强关系的转变
  4. C语言自定义实现string字符串的算法(附完整源码)
  5. 计算机基础知识赏花主观题,计算机研究生考什么?你知道吗?
  6. chrome浏览器net::ERR_TOO_MANY_REDIRECTS
  7. python 管道队列_关于python:Multiprocessing-管道与队列
  8. spring创建webservice项目
  9. eclipse新建tomcat server但是总是报404的解决方法
  10. 弹性理论法研究桩基受力计算公式_桩基础沉降计算方法及相关的理论分析
  11. python中pandas作用_Python Pandas滚动功能
  12. TPS63020-电池升降压芯片及静态电流7~8mA原因
  13. 利用JAVA求定积分
  14. 游戏性能优化指南:如何将HTML5性能发挥到极致
  15. 设计一个简单的socket通信协议
  16. 传统行业如何搭建大数据团队?
  17. 微型计算机中的内存主要包括哪两类,微机原理考试资料.doc
  18. 收费企业邮箱与收费个人邮箱区别,你造吗?
  19. 超酷3D粒子分散PS动作_使用教程
  20. Windows系统安装lua

热门文章

  1. pe系统怎么安装linux系统教程,U盘安装windows+ubuntu+winpe三系统详细教程
  2. 联想电脑摄像头无法使用
  3. 小飞鱼APK签名工具
  4. 完全体,千字详解:“Java性能调优六大工具”之JConsole工具
  5. [1]数学建模基础入门知识
  6. 07-PKI证书体系
  7. 计算机组装与维修第3版,计算机组装与维护(第3版)
  8. 徐州一姑娘写的(女孩看了是自省,男孩看了是激励)
  9. Qt QWidget 软件开发模版
  10. Webpack打包UMD的export要带default访问问题