日常吐槽

为什么明明英文论文动辄8,9页,十来页的,结果最后看人家翻译成中文,也并不多!!??我还是看的很吃力??

反(上)卷积-反(上)池化-上采样

  • 反卷积 Deconvolution

如上图的(a)。反卷积操作并不能还原出卷积之前的图片,只能还原出卷积之前图片的尺寸。那么到底反卷积有什么作用呢?通过反卷积可以用来可视化卷积的过程,反卷积在GAN等领域中有着大量的应用。

  • 反池化 Unpooling

在池化的过程中,上图中,橙色一个区进行最大池化,绿色一个区进行最大池化。记录最大值以及最大值的位置,在uppooling的过程中,原来的最大值重新出现在了它原来的位置,其他位置给0.

  • 上采样 Unsampling

在 第一个图中的b)图,在于UnSampling阶段没有使用MaxPooling时的位置信息,而是直接将内容复制来扩充Feature Map。从图中即可看到两者结果的不同。

DeConvNet

Learning Deconvolution Network for Semantic Segmentation
ICCV2015

  • FCN的不足

DeConvNet是针对FCN进行了改善。

下图是FCN 的结构

1)FCN 因为其固定尺寸receptive field只能解决单尺度的semantics ,对于过大过小的目标分割都有可能有问题
the network can handle only a single scale semantics within image due to the fixed-size receptive field. Therefore, the object that is substantially larger or smaller than the receptive field may be fragmented or mislabeled.

如图,a)图由于bus太大了,挡住了person,bicycle,car的分割。b)图则由于person太小了,根本检测不到2333.

2)FCN 的 deconvolution procedure 太粗糙太简单,FCN 的 deconvolution procedure输入尺寸只有16 × 16,将这个尺寸通过 bilinear interpolation 放大到输入图像尺寸。目标很多细节信息丢失

  • DeConNet的架构

DeconvNet 和 SegNet 的结构非常类似,只不过 DeconvNet 在 encoder 和 decoder 之间使用了 FC 层作为中介,用于增强类别的分类。

卷积层:使用VGG-16(去除分类层),把最后分类的全连接层去掉,在适当的层间应用Relu和Maxpooling。增加两个全连接层(1x1卷积)来强化特定类别的投影。
反卷积层:卷积层的镜像,包括一系列的 unpooling,deconvolution,Relu 层
网络输出:概率图,和输入图像大小相同,表明每个像素点属于预定义类别的概率

  • 和SegNet的关系

DeConvNet基于FCN改进了上采样层,用到了反池化和反卷积操作,参数量2亿多,非常大.

Segnet把两个全连接层去掉,效果也能很好,显著减少了参数,只有290万,提升了性能

SegNet

  • 应用场景

SegNet背后的主要动机是需要设计一种有效的道路和室内场景理解架构。

截了个图https://www.youtube.com/watch?v=CxanE_W46ts

  • SegNet的架构

在编码器处,执行卷积和最大池化。VGG-16有13个卷积层。 不用全连接的层。在进行2×2最大池化时,存储相应的最大池化索引(位置)。

使用最大池化的索引进行Unpooling。

在解码器处,执行反池化和卷积。最后,每个像素送到softmax分类器。调用相应编码器层处的最大池化索引以进行反池化。

最后,使用K类softmax分类器来预测每个像素的类别。

反池化如图(前面也介绍了):

参考链接

反池化原理

DeconvNet 笔记

Deconvnet论文总结思考

语义分割--DeconvNet--Learning Deconvolution Network for Semantic Segmentation

学习语义分割反卷积网络DeconvNet

一文带你读懂 SegNet(语义分割)

[论文笔记]SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

【论文翻译】SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

【SegNet】 A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation相关推荐

  1. 【翻译】【VGGNet】VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION

    VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION 用于大规模图像识别的非常深的卷积网络 作者:Karen Simon ...

  2. Hybrid LSTM and Encoder–Decoder Architecture for Detection of Image Forgeries论文阅读

    Hybrid LSTM and Encoder–Decoder Architecture for Detection of Image Forgeries Code link:https://gith ...

  3. 【论文阅读】DeepPap: Deep Convolutional Networks for Cervical Cell Classification

    写在前面:该文章发于期刊. DeepPap: Deep Convolutional Networks for Cervical Cell Classification Ling Zhang, Le L ...

  4. 【Cascade FPD】《Deep Convolutional Network Cascade for Facial Point Detection》

    CVPR-2013 文章目录 1 Background and Motivation 2 Related Work 3 Advantages / Contributions 4 Method 5 Ex ...

  5. 语义分割-- SegNet:A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation

    SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation PAMI 2017 http://mi ...

  6. [论]【DSTGCN】Dynamic SpatiotemporalGraph Convolutional Neural Networks for Traffic Data Imputation

    Dynamic Spatiotemporal Graph Convolutional Neural Networks for Traffic Data Imputation with Complex ...

  7. 【Es】es deep paging问题

    1.概述 关联博客:[elasticsearch]elasticsearch 搜索结果的含义 转载:https://blog.csdn.net/gwd1154978352/article/detail ...

  8. 【HRNet】《Deep High-Resolution Representation Learning for Human Pose Estimation》

    CVPR-2019 代码:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch 文章目录 1 Background and Mo ...

  9. 【RedNet2018】RedNet: Residual Encoder-Decoder Network for indoor RGB-D Semantic Segmentation

    RedNet: Residual Encoder-Decoder Network for indoor RGB-D Semantic Segmentation RedNet: 用于室内RGB-D语义分 ...

最新文章

  1. mysql备份psb文件怎么打开_Navicat for MySQL 数据备份教程
  2. oracle tns 代理配置_OGG实现Oracle到MySQL数据平滑迁移
  3. android 漂亮的表单界面,面向ArcGIS for Android的表单界面生成器的设计与实现
  4. LESS实战::not与:hover混合使用
  5. debian php安装pdo扩展,在debian下为PHP5.0.3安装pdo模块
  6. python编写网页游戏脚本_[大数据]用Python脚本做一些网页游戏中力所能及的自动化任务 - 码姐姐找文...
  7. DNS劫持DNSmasq详细解析及详细配置
  8. mysql-server rpm_Mysql rpm包安装
  9. 戴尔-卡耐基:《人性的优点 How to stop worrying and start living》
  10. 软件实施人员具备的技能和素养
  11. kafka comsumer消费消息后不commit offset的情况分析
  12. 电邮里面是图片怎么下载_这是最有效的采访后谢谢您的电子邮件
  13. 删掉nd array数组中的所有零元素
  14. hulu dpp_什么是直播电视的Hulu,它可以代替您的有线电视订阅吗?
  15. 利用双均线策略计算中国平安股票收益
  16. Html5 Egret游戏开发 成语大挑战(六)游戏界面构建和设计
  17. vCenter Server 补丁升级手册
  18. windows 10 build 10074 内部预览版 连不上windows update
  19. QQ远程协助连不上解决办法
  20. [picoCTF]Scavenger Hunt write up

热门文章

  1. 大四计算机系的,毕设该怎么下手?
  2. 一文帮你深度了解Axie Infinity-啊蟹(内含细致教程)
  3. 关于@Vaild注解的使用
  4. DIV根据里面文字自动撑开
  5. Arduino ESP32Web配网
  6. io-nio-socket步步为营(七) IO模型-心得体会
  7. 苹果ipad如何横向_苹果iPad的阵容是一个完整的混乱
  8. 论微信朋友圈,巨头的解决之道
  9. Kindle Paperwhite 越狱/加字体/支持PDF、EPUB、DjVu、FB2、CHM和DOC文档
  10. 2022年,程序员如何选择电脑