fcn提出了一个新颖的架构,目前来看,这也几乎是目前所有的语义分割问题的架构,encoder-decoder架构。

1.introduction

from coarse to fine inference is to make a prediction at every pixel,从粗推理到精细推理的下一步是对每个像素进行预测。

Semantic segmentation faces an inherent tension between semantics and location: global information resolves what while local information resolves where. 语义分割面临语义和位置的内在张力:全局信息在解决什么,局部信息在解决什么,深度特征层次在local-to-global金字塔上联合编码位置和语义信息。我们定义了一种新颖的skip结构来联合deep,coarse,semantic信息和shallow,fine,appearance信息。

2.fully convolutional networks

Locations in higher layers correspond to the locations in the image they are path-connected to, which are called their receptive fields.较高层中的位置对应于他们路径连接到图像中的位置,成为他们的感受野。convnets建立在平移不变性上, 它们的基本组件(卷积、池化和激活函数)在局部输入区域上运行,并且仅依赖于相对空间坐标。

2.1 adapting classifiers for dense prediction

全连接层具有固定的维度并丢弃了空间坐标,让位置信息消失了,只保留语义信息,因此将全连接操作更换为卷积操作可以同时保留位置信息及语义信息,达到给每个像素分类的目的。这些全连接层也可以视为具有覆盖其整个输入区域内核的卷积,这样做会将他们转换为完全卷积的网络,该网络接受任何大小的输入和输出分类图。用fc产生最后一层输出和cnn是等效的,但是cnn要快的多。全卷积的输出是相对输入大小减少一个因子,该因子等于输出单元的感受野的像素步长。

fc输出的是1x1x1000的一个向量,1000维经过softmax之后,概率最高的就是预测的类别,如果换成全卷积输出的就是热力图,但是也是1000张图,每个像素点都有1000类的预测,取每个像素点预测的最大值。

2.2 shift-and-stitch is filter rarefaction

这块后续也并没有采用这个方法,而是通过上采样做。

2.3  upsampling is backwards strided convolution

to connect coarse outputs to dense pixels is interpolation.将粗略输出到密集像素的方法是插值。此处是用反卷积效果好一点。

2.4 两种训练方法,在mmseg中应该对whole和slice两种方式

3.segmentation architecture

这块的输入多以一张原图和一张mask这种形式,这也是最为普遍的一种训练集

3.1 from classifier to dense fcn

丢掉了最终的分类层,并将所有的fc层转成卷积层,我们附加一个通道维度为21的1x1卷积来预测每个粗略输出位置的每个voc类(包括背景)的分数,然后是一个反卷积层,将粗略输出双线性上采样到像素密集输出。

3.2 combining what and where

相对非常简单的上下融合,其实fpn也有类似的效果,但是在文字检测上一般是fpn出来的层做融合,目标检测上一般是分而治之,语义分割将pred还原到label在做预测。

Fully Convolutional Networks for Semantic Segmentation相关推荐

  1. 深度图像分割 -- Fully Convolutional Networks for Semantic Segmentation

    CVPR2015 PAMI 2016 Fully Convolutional Networks for Semantic Segmentation Code: https://github.com/s ...

  2. (FCN)-Fully Convolutional Networks for Semantic Segmentation

    文章目录 Fully Convolutional Networks for Semantic Segmentation 摘要 全局信息和局部信息 感受野 FCN算法架构 训练技巧 详细参考 Fully ...

  3. Fully Convolutional Networks for Semantic Segmentation (FCN)论文翻译和理解

    论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...

  4. 论文精读及分析:Fully Convolutional Networks for Semantic Segmentation

      本文主要内容为论文<Fully Convolutional Networks for Semantic Segmentation> 的阅读笔记,在原始论文的基础上加入了自己的一些理解, ...

  5. 【FCN】Fully Convolutional Networks for Semantic Segmentation学习

    论文翻译 又是一个看不懂原文,又看不懂翻译的论文. semantic segmentation 图像语义分割 就是预测每个像素所属的对象类别 语义分割是指像素级地识别图像,即标注出图像中每个像素所属的 ...

  6. FCN的学习及理解(Fully Convolutional Networks for Semantic Segmentation)

    大多数人接触"语义"都是在和文字相关的领域,或语音识别,期望机器能够识别你发出去的消息或简短的语音,然后给予你适当的反馈和回复.嗯,看到这里你应该已经猜到了,图像领域也是存在&qu ...

  7. 论文笔记《Fully Convolutional Networks for Semantic Segmentation》

    [论文信息] <Fully Convolutional Networks for Semantic Segmentation> CVPR 2015 best paper key word: ...

  8. 【论文翻译】Fully Convolutional Networks for Semantic Segmentation

    论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...

  9. 【论文笔记】FCN:Fully Convolutional Networks for Semantic Segmentation

    <Fully Convolutional Networks for Semantic Segmentation>,CVPR 2015 文章目录 1. 概览 2. 主要亮点 2.1 全卷积化 ...

  10. 【2015-CVPR】Fully Convolutional Networks for Semantic Segmentation

    概述 卷积网路自身逐像素端到端训练效果好于目前的SOTA语义分割网络,本文提出了FCN可接受任意大小输入并推理学习产生对应大小输出,它将来自深层的粗糙层语义信息和来自浅层的精细的外观信息相结合,该网络 ...

最新文章

  1. 计算机绘图 招聘,计算机绘图-网课答案.pdf
  2. 面试者面试官,双向角度的程序员面试指南!
  3. 用DataBindings属性绑定控件的值
  4. python怎么把程序封装成函数_PYTHON中如何把固定格式代码,封装成一个函数?
  5. Spring4.X系列之AOP-@AspectJ
  6. 二叉树的层序遍历 使用队列和不使用队列
  7. 寒假每日一题(入门组)【week6 完结】
  8. 如何将catia装配件附材料_在网上买的快餐桌椅如何安装?餐厅快餐桌椅安装顺序与流程知识...
  9. PHP on Windows Azure 入门教学系列(2) ——利用SQL Azure做一个简单的访问计数器...
  10. Hive中视图机制的初步使用及分析
  11. SimpleDateFormat类 java 1614697530
  12. [JDK8] Lambda
  13. “渠道之王”2.0   百丽携手乐淘的背后
  14. shell脚本中set -e作用
  15. c语言大作业实现程序功能描述,C语言程序设计大作业——员工管理系统(代码超详细内含实验报告)...
  16. 新冠病毒数据分析报告
  17. 小程序地理位置接口wx.getLocation申请审核解决方法(详细说明及避坑)
  18. Anaconda+PyCharm+PyTorch+Gym深度强化学习环境搭建 送新手直接送进炼丹炉
  19. 高数——定积分计算大法之换元法
  20. mysql 建表最佳实践

热门文章

  1. vue+echarts地图下钻(全国-省-市)
  2. 【题库】上海学校心理咨询-普通心理学-考点解析 4.4 知觉的特征
  3. 某航空公司客户价值分析
  4. 腾讯测试“儿童锁模式”:13周岁以下想玩游戏须家长先“开锁”
  5. 316级和304级不锈钢有什么区别?
  6. nalu模式多slice_H.264中NAL、Slice与frame意思及相互关系
  7. _Win7_Ultimate_x64_.gho
  8. vs code 不能正确补全结构体成员变量的解决方法
  9. idea 启动时怎么选择工作空间
  10. autojs pro采用递归的方式,遍历所有子控件的源码分享