论文地址

一、主要内容介绍

1. 问题背景

对于高分辨率的图像,如何在高推断速度的情况下,保证推断精度呢?

  1. U型网络的分割效果不错,但是计算量较大;
  2. 一些方法通过减小输入图像的尺寸或者裁剪掉多余的通道来提高推断的速度,但是会损失边界部分的细节以及对于小目标识别效果不好;
  3. 浅层的网络削弱了特征的辨别能力。
  4. 针对这些问题,有人提出将空间细节和上下文信息结合在一起的多分支框架(Figure 2(a))。然而,高分辨率图像上的附加分支限制了速度,分支之间的相互独立性限制了模型学习能力。
  5. SPP(Spatial Pyramid Pooling)(Figure 2(b))会增加高层的特征,同时也会增加计算量。通过最后的输出增加特征图,这样会缺少前面层保留的图像语义信息。

为了提高模型的学习能力,以及增大感受野,特征重利用(feature reuse) 是个不错的方法。文章提出的网络结构如图Figure 2(d).通过子网络聚合(sub-network aggregation)和子状态聚合(sub-stage aggregation)来重利用特征。

2. 文章贡献点

文章提出了一种深度信息整合网络(DFANet)用于实时语义分割。
主要有三个贡献点:

  1. 采用轻量级的网络作为基本骨架(backbone)
  2. 子网络聚合——网络级联。
  3. 子状态聚合。将不同骨架间的相应状态聚合。

二、网络结构


1. backbone
Figure 3中共有3个backbone,每个backbone都是改进版的Xception网络。


2. 子网络聚合——网络级联
图中的红色箭头部分

处理过程:将上一个backbone 的输出,作为下一个backbone的输入。这个上一个backbone 的输出上采样四次后输入下一个backbone。

3. 子状态聚合
橙色箭头部分。不同backbone的相应状态聚合

对于第一个backbone,n=1n=1n=1,第iii个状态xinx_{i}^{n}xin​ 等于上一状态的输入和输出的和,当n>1n>1n>1时,xinx_{i}^{n}xin​ 等于上一状态(i−1i-1i−1)以及上一个网络(n−1n-1n−1)的当前状态(iii)的级联。iii – 状态,nnn – backbone

4. decoder
融合底层和高层的特征,没有使用中间层的特征。

三、实验细节

  1. 输入图像尺寸:1024x10241024 x 10241024x1024,512x1024512 x 1024512x1024
  2. 优化方法:SGD batch size 48, momentum 0.9 weight decay 1e − 5.
    3.损失函数:交叉熵损失
  3. 数据增强: 去均值(mean suntraction),随机垂直翻转,随机缩放,缩放因子:[0.75,1.75],随机裁剪

四、问题

当使用3个Backbone A时的mIoU比2个时小?2个Backbone A时的感受野已经比图像大,在增加一个Backbone,会引入噪声。

DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation(笔记)相关推荐

  1. 感知算法论文(七):DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation(2019)

    文章目录 摘要 1. 引言 2. 相关工作 3. 深层特征聚合网络 3.1 Observations 3.2 深层特征聚合 3.3 网络结构 4. 实验 4.1 DFA 结构的分析 4.1.1 轻量级 ...

  2. DFAnet:Deep Feature Aggregation for Real-time Semantic Segmentation自己翻译的

    DFAnet:Deep Feature Aggregation for Real-time Semantic Segmentation 原始论文Li H, Xiong P, Fan H, et al. ...

  3. 【论文阅读】Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation

    论文标题: Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation 作者信息: 代 ...

  4. 论文笔记:CVPR2022 Regional Semantic Contrast and Aggregation for Weakly Supervised Semantic Segmentation

    任务:image-level标签的弱监督分割 Motivation:numerous semantically similar but visually different instances; fo ...

  5. 【那些年我们一起看过的论文】之《ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation》

    /* 天下武功,唯快不破.要想在移动终端或者嵌入式系统上应用,小巧高速是很重要的.ENet在追求高效率的同时兼顾了精度,站在巨人的肩膀上,综合了很多特色的网络结构,并在输入端首先加以压缩达到加速的目的 ...

  6. Adaptive Feature Recombination and Recalibration for Semantic Segmentation: Application to Brain Tum

    MICCAI2018 摘要: 1.CNN的特征之间有空间相关性(指的是units in feature maps (FMs) at a given location and the correspon ...

  7. CVPR 2017 《Deep Feature Flow for Video Recognition》论文笔记

    本学弱喜欢在本子上记笔记,但字迹又丑. 望看不懂我的字的大佬不要喷我,看得懂的大佬批评指正.

  8. ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation

    ENet:一种实时语义分割的深度神经网络体系结构(解读)(原论文) 分割任务深度神经网络缺点 计算量大,具有需要大量浮点运算 运行时间长,具有阻碍其可用性的运行时间较长的缺点 网络体系结构 图中,do ...

  9. 《ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation》论文笔记

    1. 概述 导读:一般的分割网络需要大量的浮点运算以及较长的运算时间,这个妨碍了其在实时要求较高场合的使用,这篇文章提出了基于编解码器结构的实时分割网络ENT(Efficient Neural Net ...

最新文章

  1. Python 技术篇-利用pyperclip库实现读取写入剪切板,超简单
  2. ​【Python】Python中好用的命令行参数解析模块
  3. dotnet Blazor 用 C# 控制界面行为
  4. shell字符串长度
  5. java 构造方法_Java构造方法和子类构造方法
  6. GO程序设计语言学习笔记
  7. xshell5 的账号密码搬家
  8. c语言数据类型转换规律,c语言,数据类型转换
  9. vue vue-quill-editor 富文本 改变图片大小
  10. MATLAB:Radon正变换的理解
  11. sFlow监控OVS使用测试
  12. matlab中omega是什么意思_小鸡宝宝考考你南柯一梦中的南柯是什么意思?
  13. 【Gamma】Scrum Meeting 1 与助教谈话
  14. PageAdmin CMS网站制作教程:如何设置会员中心权限?
  15. 安装win10出现“计算机意外的重新启动或遇到错误。Windows安装无法继续。若要安装Windows,请单击“确定”重新启动计算机,然后安装系统。”
  16. 如何将html转成PDF文件
  17. java: 无法将类com.aaa.xxx中的构造器xxx应用到给定类型
  18. cyk的小学数学题 小学数学
  19. php获取优酷剧集方法,优酷获取剧集例程源码
  20. JPA和领域驱动的设计

热门文章

  1. activemq mysql集群配置_ActiveMQ专题--集群,高可用方案
  2. send()/recv()和write()/read():发送数据和接收数据
  3. 程序员的能力拓展模型
  4. php根据单词截取英文语句,php按单词截取字符串的方法
  5. linux服务器不能访问,无法在远程Linux服务器上访问tomcat
  6. win7 64位的调试符号表离线_手机群控系统安装调试中遇到的问题和解决方案
  7. 第四范式入选CB Insights首届中国金融科技榜单
  8. access开发精要(15)-货币与数字类型格式(3)
  9. PowerBI随笔(1)-类似vlookup的合并查询
  10. mxnet基础到提高(11)--循环