Backbone:深层聚合网络:Deep Layer Aggregation(DLA)
Backbone:Deep Layer Aggregation(深层聚合网络,DLA)
论文网址:https://arxiv.org/abs/1707.06484
论文代码(pytorch):https://github.com/ucbdrive/dla
参考博客:Deep Layer Aggregation----------论文理解
0. 摘要
- DLA是一种融合深层网络的backbone结构。
- 通过更深层次的融合可以更好的聚合不同层的信息。
- 深层聚合结构以迭代和分层方式合并特征层次结构,使网络具有更高的准确性和更少的参数。
1. 简介
- DLA2种结构:迭代聚合(IDA)和分层聚合(HDA)
- IDA集中融合分辨率和范围
- HDA集中融合所有模块和通道的特征
2.国内外现状
- Densely connected networks (DenseNets)是语义融合的代表,通过跳跃连接所有的层来获得更好的聚合特征和误差。
- Feature pyramid networks (FPNs) 是空间融合的代表,通过自上而下和侧边连接来补偿分辨率和标准化金字塔型的层级特征语义。
3. DLA:Deep Layer Aggregation
- 论文集中研究有效聚合深度、分辨率和尺寸的结构。
3.1 IDA:Iterative Deep Aggregation
- 深层阶段的语义信息很丰富但是空间上比较粗糙。将低层阶段通过跳跃连接到高层阶段来融合尺寸和分辨率。
- a与b是已存在的网络结构,c就是迭代层聚合,可以很直观的感受到它的网络结构中关于迭代的思想:聚合从最浅,最小的尺度开始,然后迭代地合并更深,更大的尺度。c借鉴了b中的跳层连接,但通过修改解决了b中最浅层的部分会对最终结果产生最深远影响的问题。
- IDA函数为I,各层为x1; …; xn,聚合结点为N,公式表示:
3.2 HDA:Hierarchical Deep Aggregation
- IDA仅仅通过融合阶段是远远不够的,因为它还是顺序的。
- HDA通过融合在树形中块和阶段来保存并且结合特征通道。通过HDA将较浅和较深的层组合在一起,以学习跨越更多特征层次结构的更丰富的组合。
- 通过将聚合节点的输出作为下一个子树的输入反馈到主干中,来代替仅将中间聚合路由到树的上方。
- 图2中d通过一种树状结构块分层次进行聚合,通过不同的深度更好的跨越了不同层级的特征。e和f通过改变d的中间聚合部分对于网络的影响以及在同样深度条件下结合比较成功的聚合方式来提高效率,f 就是作者提出的分层层聚合的结构。
- HDA函数Tn,深度是n,函数定义如下:
其中N是聚合结点,R和L定义为:
其中B代表一个卷积块(convolutional block)。
3.3 聚合元素
(1)聚合结点
- 聚合节点的作用是融合并压缩输入。聚合节点学着去选择并且处理重要的信息保证在输出中保持相同的维度。
- IDA一直都是二进制的,HDA节点具有可变数量的参数,具体取决于树的深度。
- 在分类网络中,我们使用1x1卷积作为聚合结点;在语义分割中,我们添加了更多级别的迭代深度聚合来插入特征,在这种情况下使用3×3卷积。
- 聚合结点N定义为:
其中σ是非线性激活,wi 和 b 是卷积的权值和偏置。 - 网络加入残差连接(residual connections),N公式为:
(2)块和阶段(Blocks and Stages)
- 深层融合是一个比较普遍的架构因为它可以和任何一个骨干网络兼容(如ResNet,ResNeXT,Densenet等)。
- 实验中我们使用到了三种不同的残差块:
a)Basic blocks(即ResNet)将堆叠卷积与恒等映射跳过连接相结合;
b)Bottleneck blocks通过1x1卷积降维;
c)Split blocks(即ResNeXT)通过将通道分组为多个单独的路径(称为拆分的基数)来使功能多样化。 - 将bottleneck和split neck的输出和中间通道数量之比减少一半,基数设置为32。
4 应用
4.1 分类网络
- 分类网络例如ResNet 和ResNeXT都是阶段性的网络,每一个阶段都有多个残差网络组成,阶段之间通过下采样获得特征图。整个网络有32倍的降采样,最后通过对输出进行softmax得分,进而分类。
- 本文中,在阶段之间用IDA,在每个阶段内部使用HDA。在各个阶段之间通过池化进行下采样。
4.2 密集预测网络(语义分割)
- 在语义分割中,我们需要通过聚合来融合局部和全局信息。在该部分中我们利用插值和IDA的进一步增强来达到任务的必要输出分辨率。
- 插值IDA通过投影和上采样增加深度和分辨率,如图4所示。在网络优化期间共同学习所有投影和上采样参数。
- 首先对3-6阶段的输出控制为32通道;然后对每个阶段都插值到与2阶段相同的分辨率;
- 最后迭代性的融合这些阶段的信息以便获得高级和低级更深层次的融合。
5 实验
Backbone:深层聚合网络:Deep Layer Aggregation(DLA)相关推荐
- 论文阅读《Deep Layer Aggregation(DLA)》
Background & Motivation 文章认为特征聚合的关键是语义和空间信息的聚合. Semantic fusion, or aggregating across channels ...
- 【图像分类】Deep Layer Aggregation论文理解
摘要 视觉识别: 视觉识别需要丰富的表征--跨度从低到高.尺度从小到大.分辨率从细粒度到粗粒度.即便在卷积网络中有深层的特征,但单独一层的特征是不够的:组合和聚合这些特征(表征)可以改进对&q ...
- DFAnet:Deep Feature Aggregation for Real-time Semantic Segmentation自己翻译的
DFAnet:Deep Feature Aggregation for Real-time Semantic Segmentation 原始论文Li H, Xiong P, Fan H, et al. ...
- ICCV 2019 | 旷视研究院提出文字检测新方法:像素聚合网络PAN
本文介绍ICCV 2019 旷视研究院提出任意形状文字检测模型:像素聚合网络 PAN,它考虑了任意文字识别过程中速度与精度的权衡,在大幅提升识别性能的同时也显著降低了计算量,成为当前该领域最佳方法. ...
- [Neck] 空间金字塔池化【池化策略】(Space Pyramid Pool, SPP)模块和路径聚合网络【增强】(Path Aggregation Network, PANet)的结构
文章目录 背景 yolo v4 中的空间金字塔池化(Space Pyramid Pool, SPP)模块和路径聚合网络(Path Aggregation Network, PANet)的结构 SPP ...
- Recurrence along Depth: Deep Convolutional Neural Networks with Recurrent Layer Aggregation阅读笔记
RLA阅读笔记 (一) Title (二) Summary (三) Research Object (四) Problem Statement (五) Method 5.1 Layer Aggrega ...
- 【Gated Context Aggregation Network for Image Dehazing and Deraining用于图像去雾和去雨的门控上下文聚合网络】,个人笔记,勿喷
摘要 图像去雾旨在从模糊图像中恢复未损坏的内容.我们没有利用传统的低级或手工图像先验作为恢复约束,例如暗通道和增加的对比度,而是提出了一个端到端的门控上下文聚合网络来直接恢复最终的无雾图像.在这个网络 ...
- 感知算法论文(七):DFANet: Deep Feature Aggregation for Real-Time Semantic Segmentation(2019)
文章目录 摘要 1. 引言 2. 相关工作 3. 深层特征聚合网络 3.1 Observations 3.2 深层特征聚合 3.3 网络结构 4. 实验 4.1 DFA 结构的分析 4.1.1 轻量级 ...
- CVPR 2020 | 自适应聚合网络AANet:更高效的立体匹配
©PaperWeekly 原创 · 作者|张承灏 单位|中科院自动化所硕士生 研究方向|双目深度估计 本文介绍的是中科大团队在 CVPR 2020 上提出的一种高效立体匹配网络--自适应聚合网络 ...
最新文章
- Ubuntu安装MongoDB
- Go 学习笔记(9)— 循环(for、for range访问数组、切片、字符串和通道、goto、continue、break)
- SGU 260.Puzzle (异或高斯消元)
- 通过FFT来计算螺旋线的匝数
- 人工智能写散文之错位时空
- XCTF-高手进阶区:lottery
- java string转decimal_java中string转bigdecimal的例子
- php curl ajax get请求,PHP的curl的get,post请求-Fun言
- mysql standalone模式_Boss7 Standalone模式开发配置
- 【今日CS 视觉论文速览】Fri, 18 Jan 2019
- 工厂模式(描述语言PHP)
- 阶段3 3.SpringMVC·_03.SpringMVC常用注解_7 ModelAttribute注解
- FPGA测试方法以Mentor工具为例
- Windows下实用工具汇总(更新……)
- 分析 | 高通骁龙845已发布,明年智能手机会变成什么样
- codeforces 574B 暴力+复杂度分析
- 测绘资质-导航电子地图制作
- 问题来了,大数据的特性究竟有多少个V?
- 计算机系统的环境变量,电脑path环境变量不见了怎么恢复_教你恢复电脑path环境变量的方法...
- 微软:欧洲美国Windows10安装率超Win7