一、这是google的一篇探索的文章,探讨decoder结构的一篇文章

二、主要贡献点

1、 探讨了不同的几种decoder的优劣,提出自己的上采样方案

2、 提出针对上采样的residual connection

3、 横向多任务对比各种不同方案

三、不同结构decoder的对比

Transposed Convolution:这个也是我们常说的“反卷积” “上采样卷积”,但是要注意这并不是卷积的“反操作”,而是一种类似普通上采样的操作。具体过程分为两步:1、根据放大倍数,填0;2、普通卷积操作。下面这张图非常清晰的显示了,整个过程,3x3的反卷积,总体stride=2.从结构上谈这个模块的缺点的话,我认为主要是输出map的每个pixel的来源不平衡,有的来源2个,有的4个,有的只有1个。3x3的卷积核能否应对h,w较大时,产生一个较好的soomth系数,对于feature map的每个区域都适用?

Decomposed Transposed Convolution:这个如果熟悉inception的人,其实很好理解,把3x3的卷积拆成1x3,和3x1,这样参数就少了,那么整个操作流程就是:先竖着填0,卷积,横着填0,卷积。这是第一种的严格子集。

Separable Transposed Convolution : 这个就是分离卷积,先通道,在1x1,依然是减少参数。这是第一种的严格子集。

Depth To Space :可以搜下pixel shuffle,基本上就是这个意思。这个会带入“对齐问题”,因为同一组feature maps,虽然不同通道,但是计算来源都是一样的。The drawback of this approach is that it introduces alignment artifacts.为什么呢?我没办法给出一个理论上的解释。有没有人解释下

Bilinear Upsampling :增加显存的同时,后续的卷积也会需要更多的操作。

Bilinear additive upsampling :借鉴 “depth to space”,不同的在于,上采样后,这里直接用加法了,输出的feature map,可以发现,每个pixel来源都是平衡的。

四、上采样residual

用作者的Bilinear additive upsampling + conv(通道增加4倍)输出的为X',在把原始输入经过普通的bilinear upsample得到 X'',加起来就是了。

     下面这个图的skip,就是我们Unet常用的那种线,这也基本上证明了,这个skip是有效的,但是作用不是特别大。

【文章阅读】The Devil is in the Decoder【计算机视觉中的上采样方式-6种】相关推荐

  1. 地震反演近期文章阅读

    地震反演近期文章阅读 [1]Low-Frequency Impedance Inversion by Using InterpretableGated Recurrent Encoder-Decode ...

  2. 2022CVPR边缘检测——EDTER: Edge Detection with Transformer文章阅读

    EDTER: Edge Detection with Transformer文章阅读 今天阅读了一篇文章,名为EDTER: Edge Detection with Transformer,作者将ViT ...

  3. 如何估算文章阅读时长?

    简评:包括 Medium 在内的很多阅读类网站或 App 都有阅读时长的提示,那么这个数值是怎么来的呢? 早些时候,阅读类平台还在野蛮生长. Medium 的工程师写着代码的同时,也在阅读自家平台上的 ...

  4. .Net Discovery系列文章阅读索引--带你探索未知的.Net世界

    .Net Discovery系列文章是讲述.Net平台机制的文章,目前已有12篇,分别讲述了.Net垃圾收集.实时编译.字符串等部件的机制,现在推出1周年之际总结文章阅读索引,希望对大家有所帮助.   ...

  5. “云时代架构”经典文章阅读感想十二

    云时代架构"经典文章阅读感想十二 (牛逼的架构师是怎么炼成的?) 前几周阅读的三四十岁的大龄程序员,应该如何保持自己的职场竞争力?中提到如何在35岁左右可以实现掌握有核心竞争力.其中之一便是 ...

  6. 用户dsn保存位置‘_苹果iOS 13.6终于能保存文章阅读进度了 朋友都等秃了

    几天前,iOS 13.6 Beta 2和iPadOS 13.6 Beta 2发布,据外媒iPhoneHacks消息,苹果此次通过新软件更新对Apple News应用程序进行了改进,更新后的iOS 13 ...

  7. 阅读量PHP设计,zblogPHP如何修改文章阅读量

    很多网站访问量比较少,尤其是对于新站来说,有时发布的文章几天下来阅读量一直上不去,甚至还保留在个位数,这样看起来难免会有些尴尬,如何打破这种尴尬?zblogphp文章阅读量可以修改吗?答案是肯定的,修 ...

  8. python刷阅读_通过python+selenium3实现浏览器刷简书文章阅读量

    准备工作 下载python,本文以python3.6为例.python3.6下载地址:python3下载地址,选择合适的版本安装.安装成功后,打开命令提示符,在其中输入python,显示如下信息,则说 ...

  9. [html] 请实现一个文章阅读的进度条

    [html] 请实现一个文章阅读的进度条 chrome 浏览器中,通过document.documentElement.scrollTop获取页面滚过高度,通过document.documentEle ...

最新文章

  1. 使用Struts2标签遍历集合
  2. bzoj 2142 礼物
  3. Mac openCV环境搭建
  4. 12.混淆——混叠图像,对比敏感度,图像压缩_4
  5. mac自动生成路径问题
  6. [转]OpenGL基础技术讲座--发展历史
  7. leetcode经典题 刷题题解 python版
  8. 从 GitHub 上手动安装python包教程
  9. Android App 架构设计
  10. 唐诗学习系统-java课程设计
  11. linux安装nodejs 7,在CentOS 7上安装Node.js的4种方法
  12. (解决)org.apache.ibatis.binding.BindingException: Invalid bound statement (not found)问题的办法
  13. python余弦相似度_Python 简易聊天机器人(附带基础余弦相似度实现)
  14. 计算机网络:CSMA/CD 与 CSMA/CA
  15. Linux CentOS(常用命令)
  16. 操作系统安装和u盘认识
  17. 如何压缩pdf文件大小?四种方法随意选择
  18. 一位“屌丝”的逆袭,每一位从底层走过来的人都应该有的信念!
  19. java计算机毕业设计ssm学生课堂考勤小程序947n4(附源码、数据库)
  20. 黑客利用DDoS造成美国有史以来规模最大的网络攻击,简单来讲就是,交钱不杀。

热门文章

  1. 分布式秒杀 - 实战
  2. Error:(13, 8) 错误: xxx不是抽象的, 并且未覆盖xxx中的抽象方法onBindViewHolder(BaseSimpleRecyclerAdapter.ViewHolder,int)
  3. 关于计算重叠四边形的面积的算法
  4. 【python】微博热点话题舆情聚类分析
  5. 一路走来的飞控设计研发之路
  6. 重要通知(温馨提示:大家访问博客的时候先清理一下浏览器缓存)
  7. bootstrap开发tab选项卡事例
  8. 计算机里面哪个代表度,二叉树中的度是什么?
  9. 动网论坛8.2经典注入漏洞利用
  10. --i和i--的区别