目录

  • 论文详解
  • 1.和VGG网络的对比
  • 2.那么fcn是什么?
  • 3.论文改进的模型
    • 3.1怎样进行上采样的问题
    • 3.2从哪里开始上采样的问题--跳跃连接的问题
    • 3.3整体设计思想
  • 4.1实验结果
    • 4.1语义分割的评价标准
    • 4.2参数设置的问题
  • 5.论文解决的问题

论文详解

下面的五个部分是对论文提出的模型的理解,如果你想了解论文本身,那么请移步:
1.论文阅读的储备知识-CNN
2.读论文的普适性过程
3.摘要部分详细阅读
4.引言部分详细阅读
5.相关工作部分

1.和VGG网络的对比

我们清楚在VGG网络当中,我们最后需要使用三个全连接层开始对原有图像进行处理,最后得到的是一个1×1000的向量,表示的是1000种识别种类的概率。VGG当中最后的全连接是整个模型中的较大败笔
我们可以粗略的理解一下这个事情,1.我们使用一维向量进行计算的过程中,会丢失大量的二维信息。这是十分不好的。

2.那么fcn是什么?

经过下采样操作和上采样还原之后,得到的还是一张图片,经过人眼观看,我们可能什么都看不出来,但是计算机还是可以看出来这是一个图片。
其实就是将最后的几层也是做成一个卷积层,让其还是一个图片。
当然在这里我们注意一下,正常的,我们做卷积,最后都是通过一个view()让其变成一维的,然后送到线性层进行处理。这呢,就会丢失很多信息,这是我们不愿意看到的。

所以fcn是对原来的没有经过view的图片进行处理,来来完成信息的保留。再加之,我们本身的目的就是在像素级别进行识别。

3.论文改进的模型

3.1怎样进行上采样的问题

我们为了更好的理解这个图片,我们得先明白这个东西里面每个到底都是表示些什么。这里的每一块都是包含了卷积和池化,也就是我们常常说的下采样的意思。得到的内容是图像的像素信息缩小。为了达到端到端的目的,我们就必须对缩小后的图片进行还原。
这个还原的过程就对应着被称作,上采样,这个上采样的方法其实有很多,但是本文提出的上采样的方法是反卷积。


这里我们回忆之前常有的上采样方式就是差值的方式,FCN创新性提出的就是使用反卷积的方式来完成这个上采样的方式。这个想到反卷积这个概念其实不难,因为有卷积就可能有反卷积。关键就在于怎么具体定义这个反卷积的操作。
这里注意反卷积的问题,他并不是真正的反向的卷积,不能还原因卷积而丢失的值,只是恢复了大小。同时反卷积又称为转置卷积。
仔细理解其原理的话,其实就是一个可以放大原有内容的卷积操作。

3.2从哪里开始上采样的问题–跳跃连接的问题

在开始之前我们要先明确一个概念。什么是浅层网络,什么是深层网络?什么是浅层网络?,粗略的理解一下就是:深层网络就是经过的层数较多,浅层网络就是经过的层数较少。较浅层的网络就是较浅层的几个下采样块,较深层的网络就是深层的下采样块。

经过本文的试验,研究团队得到一个信息就是,浅层网络,所能学习的范围更小,但是更能得到某一点的具体细节,深层网络学习的范围更大,但是不能很好的得到局部信息。这就是之前我们在阅读论文当中提到的,局部信息和全局信息不能同时得到的这个矛盾。

当然这里的学习范围是有一个专有名词的,那就是感受域。

文章之前已经说了上采样的事情,这时候第二件事情就是什么时候开始上采样的问题。

这里注意一个问题,我们直接使用一个跳跃连接把两个下采样都连接起来不久局部信息和整体信息都联系起来了吗,哪还有什么两者的冲突?其实是对的,但是逻辑上的先后不对。

我们在一开始的时候是没有提出这种跳跃连接的,必须是一层一层的不断得出来。这样持续不断的下采样,到最后我们只得到了全局的信息,而没有得到整体的信息。所以,大家的感觉的是没有错的,跳跃连接正是缓解两个冲突的一个方法。

我们看一下这篇文章是如何做跳跃连接的操作的:

为了看懂这个图我们先要理解两个事情:
1.这个5005003的这个表示方式是什么意思,这里的500500是宽度,3是我们熟系的通道数channels。
2.这里的蓝色是卷积层,这里的绿色是池化层,橘色是反卷积层,黄色是合并层(add或是cat),灰色的是一个卷积核大小为3
3的卷积层,这里主要是对其中内容进行一步预处理之后再加入其中。

好了现在我们可以开始理解这个图了,
1.输入之后经过不断地操作,我们从原有的输入逐渐变成了343421这里的34*34好理解就是一个最后输出的结果的大小,这个21呢是这个论文当中的标签种类的个数。
2.这个叠加的过程中一边还原一边叠加新的,是还原到对应大小才能叠加之前的内容嘛。

3.3整体设计思想

这里整体的设计思想就是在深层次的网络当中,使用反卷积进行还原的时候,可能丢失部分细节信息,所以我们使用跳连接的方式来缓解这个问题。

4.1实验结果

4.1语义分割的评价标准

Pixel Accuracy(PA)像素精度:标记正确的像素占比。

Mean Pixel Accuracy(MPA)均像素精度:计算每个类内被正确分配的像素的比例,之后直接对比例进行平均(不加权重,加入权重不久和之前一样了吗?)

Mean Intersection over Union(MIoU)均交并比:计算真实值和预测值的交集和并集。(可以看到均交并比就是多了一个简单的均值其实没什么)

前面两个我们是很容易理解的但是其并不是最好用,最好用的是第三个,但是第三个又不好理解,所以我们画了下面一个图来帮助我们理解一下。这里的真实值表示为实际为标签a的位置,预测值为预测为真的位置。也就AB的交集和AB的并集的比例嘛一下子就理解了。就是看重合的多少嘛。

4.2参数设置的问题

GPU: NVIDIA Tesla K40c

优化器:SGD
优化器一般就选择SGD或是Ada

学习率:10的-4次方,一般情况下,学习率在1000个epoch之后会有更新,一般是大家根据自己网络设置的。

batch size:20

5.论文解决的问题

1.CNN网络输出为一个概率值,不太够用。
FCN输出一个图片更加好用。

2.CNN网络使用全连接层使得信息丢失。
FCN全部使用卷积层,保留二维信息。

3.上采样丢失很多细节信息。
使用跳连接保留这些信息。

全卷积网络的理解——理解论文Fully Convolutional Networks for Semantic Segmentation相关推荐

  1. 【FCN】Fully Convolutional Networks for Semantic Segmentation学习

    论文翻译 又是一个看不懂原文,又看不懂翻译的论文. semantic segmentation 图像语义分割 就是预测每个像素所属的对象类别 语义分割是指像素级地识别图像,即标注出图像中每个像素所属的 ...

  2. Fully Convolutional Networks for Semantic Segmentation ————全卷积网络 FCN论文解读

    Fully Convolutional Networks for Semantic Segmentation 作者: Jonathan Long, Evan Shelhamer, Trevor Dar ...

  3. Fully Convolutional Networks for Semantic Segmentation (FCN)论文翻译和理解

    论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...

  4. FCN的学习及理解(Fully Convolutional Networks for Semantic Segmentation)

    大多数人接触"语义"都是在和文字相关的领域,或语音识别,期望机器能够识别你发出去的消息或简短的语音,然后给予你适当的反馈和回复.嗯,看到这里你应该已经猜到了,图像领域也是存在&qu ...

  5. 论文笔记(FCN网络,语义分割):Fully Convolutional Networks for Semantic Segmentation

    FCN论文笔记:Fully Convolutional Networks for Semantic Segmentation 语义分割模型结构时序: FCN SegNet Dilated Convol ...

  6. Fully Convolutional Networks for Semantic Segmentation(FCN)阅读理解

    1. 作者介绍 在论文中声明 Jonathan Long 和 Evan Shelhamer 为共同一作,随后是 Trevor Darrell . 首先介绍 Jonathan Long,通过他的主页我们 ...

  7. 论文精读及分析:Fully Convolutional Networks for Semantic Segmentation

      本文主要内容为论文<Fully Convolutional Networks for Semantic Segmentation> 的阅读笔记,在原始论文的基础上加入了自己的一些理解, ...

  8. 论文笔记《Fully Convolutional Networks for Semantic Segmentation》

    [论文信息] <Fully Convolutional Networks for Semantic Segmentation> CVPR 2015 best paper key word: ...

  9. 【论文翻译】Fully Convolutional Networks for Semantic Segmentation

    论文题目:Fully Convolutional Networks for Semantic Segmentation 论文来源:Fully Convolutional Networks for Se ...

最新文章

  1. python3 的windows下文件操作注意问题
  2. Vue基础进阶 之 实例方法--生命周期
  3. ubuntu下的linux怎样备份文件,Ubuntu系统如何备份还原?Ubuntu系统备份还原教程
  4. 合成未来宝宝照片_当英国皇室宝宝长大:阿奇王子变卷毛星人,夏洛特公主颜值最能抗...
  5. php mysql帮助类,基于PHP的MYSQL操作类
  6. java shell文件_Java 文件读写示例1
  7. Unity 工具 之 常用插件分类汇总(UI/VR/AR/建模/Shader/动画/网络/AI/资源/数据/区块链等)
  8. 使用hue时hive的历史查询记录结果无法下载
  9. Android获取缓存大小和清除缓存功能实现
  10. 关于Document类型的总结
  11. 操作系统 - 虚拟存储管理技术之虚拟页式存储管理
  12. 计算机管理可以全自动,这款全自动化的小工具,可以让你在父母面前光明正大得玩电脑啦...
  13. Fail2ban 防爆力破解
  14. 计算机二级考试vb试题,2016计算机二级考试《VB》真题练习
  15. 微信停止苹果手机服务器,IOS13微信杀后台终极解决办法亲测有效
  16. 微信智慧支付日系统服务器崩溃,微信支付大面积出现故障 微信支付系统繁忙怎么解决 微信支付崩溃原因是什么...
  17. DP动态规划-爬塔(双层dp)
  18. 汽车厂商对高通骁龙820A系统平台的支持
  19. HyperMesh 2D网格划分
  20. 世界杯四强大胆预测!!

热门文章

  1. 微信小程序学习:开发注意点
  2. 黄聪:C# 开发Chrome内核浏览器(WebKit.net)
  3. ios 自定义UIView绘制时文字上下颠倒问题解决
  4. 交易劫持、钓鱼网站、盗号***严重威胁网购安全
  5. windows mobile开发循序渐进(4)移动应用程序的数据存储之本地数据存储第二篇
  6. 关于source insight 3.5 无法同步文件的问题
  7. 2021考研数学一李林4套卷整理
  8. 2020年余丙森概率统计强化笔记-第五章 大数定律和中心极限定理 第六章 数理统计
  9. 最大异或对[Trie树]
  10. 台湾国立大学郭彦甫Matlab教程笔记(13) 3D