作者 | 孙叔桥

来源 | 转载自有三AI(ID: yanyousan_ai)

本文的12篇文章总结了当前主流的分割网络及其结构,涵盖从编解码结构到解码器设计;从感受野到多尺度融合;从CNN到RNN与CRF;从2D分割到3D分割;从语义分割到实例分割和全景分割网络,感兴趣的朋友可以仔细研读每一篇文章。

1 FCN

Fully Convolutional Network(FCN)是神经网络用于图像分割任务的鼻祖,后续提出的大部分基于编解码结构的图像分割网络都是从FCN上发展、改进而来的。

FCN用卷积层替换了分类网络结构中的全连接层,从而得到稠密的分割结果,实现端到端训练。

同时,网络还将不同尺度下的特征信息进行融合,实现更细节的图像分割。



  • 【图像分割模型】从FCN说起

2 SegNet

SegNet在FCN的基础上增加了解码器,形成目前分割任务中最流行的编解码结构,并给出了不同解码器对效果的影响和原因。

此外,由于应用了基于位置信息的加码过程,相比较FCN而言,SegNet中的对应结构的体量要小得多。



  • 【图像分割模型】编解码结构SegNet

3 空洞卷积

编解码结构中,为了平衡空间尺寸与计算量,同时增大网络结构的感受野,通常会对输入图像进行一定的下采样。为了恢复分割结果的空间分辨率,解码器往往需要应用上采样或反卷积。

但是,基于插值的上采样效果通常不理想,而反卷积操作则增加了计算量。基于此,DeepLab中就提出了“空洞卷积”的概念,在不增加参数个数的基础上,实现感受野与分辨率的控制。



  • 【分割模型解读】感受野与分辨率的控制术—空洞卷积

4 ENet

图像分割的任务最终还是要落脚于实际应用,而此前的网络结构最快也只能达到1fps,远不及实时所需要的10fps。

ENet基于空洞卷积,实现了NVIDIA TX1上分辨率480x320下的21.1fps。

此外,文中还介绍了设计实时网络结构所需要考虑的6个重要内容。



  • 【图像分割模型】快速道路场景分割—ENet

5 CRFasRNN

在许多计算机视觉任务中,后处理操作能够有效提升算法的质量。而在众多后处理方法中,条件随机场(CRF)的效果名列前茅。

然而,CRF的理论性强,应用起来不方便。因此,CRFasRNN中提出以RNN的形式实现CRF的解决方案,从而让基于CRF的后处理变得简单。



  • 【图像分割模型】以RNN形式做CRF后处理—CRFasRNN

6 PSPNet

不同感受野下所带来的上下文信息对图像分割而言十分重要,往往感受野选择的恰当性会直接影响最终的分割效果,这种影响对极端尺寸(极大和极小)目标表现地尤为明显。

为了在同一级别下融合多尺度下的上下文信息,PSPNet提出了池化金字塔结构,从而实现了可以理解目标所处环境的图像分割。



  • 【图像分割模型】多感受野的金字塔结构—PSPNet

7 ParseNet

尽管从网络结构看,有些网络的理论感受野能够达到非常大,但实际上,理论感受野并不能等同于实际感受野,其覆盖和利用的信息也不够完整。

基于这个发现,ParseNet提出了基于池化的全局特征利用,从而实现全局特征与局部特征融合下的图像分割。

文中也介绍了如何有效融合两种特征,并利用好融合特征。



  • 【图像分割模型】全局特征与局部特征的交响曲—ParseNet

8 RefineNet

尽管前面的特征融合方法能够恢复在计算过程中被下降的空间分辨率,但是这种恢复往往没有利用完整的原始空间信息,从而导致最终结果中的信息丢失。

基于此,RefineNet设计了空间分辨率的恢复结构,实现了基于残差卷积模块(RCU)、多分辨率融合模块(MRF)和串联残差池化模块(CRP)下的高精度图像分割。



  • 【图像分割模型】多分辨率特征融合—RefineNet

9 ReSeg

尽管CNN的效果不错,但是其需要依赖人工指定的核函数实现计算,从而限制了上下文的处理能力。因此,ReSeg提出基于双向循环神经网络(BRNN)实现分割,来克服这种不足。

在ReNet的基础上,ReSeg通过依次扫描互相垂直的两个方向,实现不同时序下的特征提取。



  • 【图像分割模型】用BRNN做分割—ReSeg

10 LSTM-CF

除了单纯基于2D的RGB图像的分割外,图像分割任务的完成还可以利用深度信息进行辅助,从而实现纹理信息下无法判断的分割。

LSTM-CF基于ReNet和空洞卷积,实现结合了深度信息的图像分割。为精度提升和深度信息利用提供了一种思路。




  • 【图像分割模型】BRNN下的RGB-D分割—LSTM-CF

11 DeepMask

除了语义分割,图像分割中还有另外两种类别的任务:实例分割和全景分割。

我们通过DeepMask,给出了实例分割下的网络的设计思路。DeepMask可以同时实现前背景分割、前景语义分割和前景实例分割。



  • 【图像分割模型】实例分割模型—DeepMask

12 全景分割

语义分割与实例分割任务虽然相似,但是由于度量不同,二者无法直接结合。为了实现整图内things类别和stuff类别的同时分割,全景分割任务提出了新的度量。

全景分割任务下,图像内的每个像素点都有其对应的语义标签和实例标签(things类别),从而能够最大程度上地理解整幅图像。



  • 【图像分割模型】全景分割是什么?

(*本文为 AI科技大本营转载文章,转载请联系原作者)

精彩推荐

参与投稿加入作者群,成为全宇宙最优秀的技术人~

大会开幕倒计时5天!

2019以太坊技术及应用大会特邀以太坊创始人V神与众多海内外知名技术专家齐聚北京,聚焦区块链技术,把握时代机遇,深耕行业应用,共话以太坊2.0新生态。即刻扫码,享优惠票价。

推荐阅读

  • 6月技术福利限时免费领

  • 2019年技术盘点容器篇(一):听UCloud谈风生水起的K8S | 程序员硬核评测

  • 异类框架BigDL,TensorFlow的潜在杀器!

  • 吐血总结!100个Python面试问题集锦(上)

  • 5G 时代,微软又走对了一步棋!

  • LinkedIn最新报告: 区块链成职位需求增长最快领域, 这些地区对区块链人才渴求度最高……

  • 写代码不严谨,我就不配当程序员?

  • 碾压Bert?“屠榜”的XLnet对NLP任务意味着什么

  • 如何向妹子解释:为啥 5G 来了需要换 SIM卡!

你点的每个“在看”,我都认真当成了喜欢

当今主流分割网络有哪些?12篇文章一次带你看完相关推荐

  1. 12篇文章带你逛遍主流分割网络

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 作者 | 孙叔桥 来源 | 有三AI 本文的12篇文章总结了当前主流的分割网络及其结构,涵盖从编解码结 ...

  2. 「完结」12篇文章带你逛遍主流分割网络

    https://www.toutiao.com/a6717221469463511566/ 专栏<图像分割模型>正式完结了.在本专栏中,我们从编解码结构入手,讲到解码器设计:从感受野,讲到 ...

  3. 【完结】12篇文章带你逛遍主流分割网络

    专栏<图像分割模型>正式完结了.在本专栏中,我们从编解码结构入手,讲到解码器设计:从感受野,讲到多尺度融合:从CNN,讲到RNN与CRF:从2D分割,讲到3D分割:从语义分割到实例分割和全 ...

  4. 【完结】12篇文章告诉你深度学习理论应该学到什么水平

    专栏<AI初识境>正式完结了,在这一个专题中,我们给大家从神经网络背景与基础,讲到了深度学习中的激活函数,池化,参数初始化,归一化,优化方法,正则项与泛化能力,讲到了深度学习中的评测指标, ...

  5. 每个程序员都必读的12篇文章

    作为一名Java程序员和软件开发人员,那些每个程序员都应该知道的XXX的文章教会了我不少东西,它们提供了某个特定领域的一些实用的并且有深度的信息,这些东西通常很难找到. 在我学习的过程中我读到过许多非 ...

  6. 深度学习之对象检测_深度学习时代您应该阅读的12篇文章,以了解对象检测

    深度学习之对象检测 前言 (Foreword) As the second article in the "Papers You Should Read" series, we a ...

  7. 12篇文章带你进入NLP领域,掌握核心知识

    专栏<NLP>第一阶段正式完结了.在本专栏中,我们从NLP中常用的机器学习算法开始,介绍了NLP中常用的算法和模型:从朴素贝叶斯讲到XLnet,特征抽取器从RNN讲到transformer ...

  8. 【完结】 12篇文章带你完全进入NLP领域,掌握核心技术

    专栏<NLP>第一阶段正式完结了.在本专栏中,我们从NLP中常用的机器学习算法开始,介绍了NLP中常用的算法和模型:从朴素贝叶斯讲到XLnet,特征抽取器从RNN讲到transformer ...

  9. 知道吗?BAT去年在KDD上作为第一单位发表了12篇文章!(内附每篇文章解读)...

    本文转载自"SciTouTiao"微信公众号 如今,全世界每天都有几十亿人在使用计算机.平板电脑.手机和其它数字设备产生海量数据.各个行业和领域都已经被数据给渗透,数据已成为非常重 ...

最新文章

  1. 《强化学习周刊》第24期:CORL 2021强化学习的最新研究与应用
  2. Android插件化开发基础之静态代理模式
  3. 巧用1个GPIO控制2个LED显示4种状态
  4. nginx_keepalived配置(转载保存)
  5. SQL查询数据库结构信息
  6. html 图片移动动画,HTML5移动端图片左右切换动画DEMO演示
  7. 批处理 批量s扫1433_批处理批量字符替换
  8. 请问 土壤粒径的多重分形维数怎么计算?有matlab计算代码吗?
  9. 用计算机研究唐诗,妙哉!用文言文编程 竟从 28 万行唐诗中找出了对称矩阵
  10. 【mcuclub】温度传感器DS18B20
  11. linux驱动与设备实例(字符设备(互斥读写),misc设备和platform_device)
  12. 158玩游戏平台最新上线
  13. 因果推断学习笔记三——Uplift模型
  14. 事后诸葛亮(葫芦娃队)
  15. 《那些年啊,那些事——一个程序员的奋斗史》——99
  16. python爬虫下载梨视频
  17. Mysql培训第一天
  18. NoHttp的学习使用
  19. 五福背后的 Web 3D 引擎 Oasis Engine 正式开源
  20. 树莓派开发系列教程3——树莓派rasp-config配置

热门文章

  1. statpot:使用mongo+bootstrap+highcharts做统计报表
  2. 基于多核DSP处理器DM8168的视频处理方法
  3. lr手工添加关联函数的步骤:
  4. JVM内存管理学习总结(一)
  5. sql server日志占用空间过大的问题
  6. 从特斯拉Autopilot看车载计算平台技术挑战与发展趋势
  7. 2018-3-15模式识别--学习笔记(一)
  8. Annotation
  9. 反射 -- 通过字符串操作对象中的成员
  10. python的深拷贝与浅拷贝