论文基本情况

题目：Light-Weight RefineNet for Real-Time Semantic Segmentation
作者：
- Vladimir Nekrasov vladimir.nekrasov@adelaide.edu.au
- Chunhua Shen chunhua.shen@adelaide.edu.au
- Ian Reid ian.reid@adelaide.edu.au
出处：2018 BMVC ?
- Nekrasov, V., Shen, C., & Reid, I. (2018). Light-weight refinenet for real-time semantic segmentation. arXiv preprint arXiv:1810.03272.
代码地址：https://github.com/DrSleep/light-weight-refinenet
论文地址：http://bmvc2018.org/contents/papers/0494.pdf

内容

该文的目的很简单，在CVPR2017的RefineNet语义分割算法基础上减少模型参数和计算量。

摘要

我们认为有效和高效的语义图像分割是一项重要的任务。特别是，我们将一种功能强大的语义分段架构（称为RefineNet [46]）改编为更加紧凑的架构，甚至适用于需要在高分辨率输入上实现实时性能的任务。为此，我们在原始设置中确定了计算上昂贵的块，并提出了两种旨在减少参数数量和浮点运算的修改。通过这样做，我们实现了两倍以上的模型缩减，同时保持了几乎完整的性能水平。我们最快的模型在512×512输入的通用GPU卡上经历了从20 FPS到55 FPS的显着提升，在PASCAL VOC的测试装置上平均性能达到81：1％[18]，而最慢的模型具有32 FPS（来自原始的17 FPS）在同一数据集上显示的平均值为82：7％。另外，我们展示了我们的方法可以轻松地与轻量级分类网络混合：使用仅包含3：3M参数并且仅执行9：3B浮点运算的模型，PASCAL VOC的平均均值达到79：2％。

介绍

深度学习的经验成功数量不断增加，几乎每个月都有新的技术和架构突破可用。特别是，深度学习已成为计算机视觉，自然语言处理，机器人技术，音频处理等大多数领域的默认选择[21，22，24，37，40，44，57，61，65，67，69，70， 72、75]。然而，这些突破通常以昂贵的计算需求为代价，这阻碍了它们在需要实时处理的任务中的直接适用性。这个故事的优点在于，许多研究人员已根据经验证明，经常有很多冗余操作[1、16、17、27、31、36、68]，并且这种冗余可以（并且应该是）为了在保持性能不变的同时获得速度优势而进行开发。故事的坏处在于，在大多数情况下，还没有（通用的）通用方法来利用这种冗余。例如，诸如知识蒸馏[1、3、31、58]和修剪[26、27、29、42]之类的方法需要我们访问已经预先训练的大型模型，以便训练较小的模型。相同（或接近）的效果。显然，有时可能不可行。相比之下，为高分辨率输入的特定场景设计新颖的体系结构[54，76]限制了同一架构在具有完全不同的属性的数据集上的适用性，并且经常需要从头开始进行昂贵的训练。...

RefineNet的网络架构

RefineNet使用经典的编码器-解码器架构，CLF为3*3卷积，卷积核个数为语义类的个数，编码器的骨干网可以是任意图像分类特征提取网络，重点是解码器部分含有RCU、CRP、FUSION三种重要结构。

RCU即residual convolutional unit（残差卷积单元），为经典残差网络ResNet中的residual block去掉batch normalisation部分，由ReLU和卷积层构成。
CRP为链式残差池化（chained residual pooling），由一系列的池化层与卷积层构成，以残差的形式排列。
RCU与CRP中使用3*3卷积和5*5池化。
FUSION部分则是对两路数据分别执行3*3卷积并上采样后求和SUM。

Light-Weight RefineNet 改进方法

改进图示：

1）替换33卷积为11卷积

虽然理论3*3卷积理论上有更大的感受野有利于语义分割任务，但实际实验证明，对于RefineNet架构的网络其并不是必要的。

2）省略RCU模块

作者尝试去除RefineNet网络中部分及至所有RCU模块，发现并没有任何的精度下降，并进一步发现原来RCU blocks已经完全饱和。

表格中RefineNet-101为原始RefineNet网络，RefineNet-101-LW-WITH-RCU为使用了1）中的改进替换卷积，RefineNet-101-LW为使用了1）与2）中的改进替换卷积并省略RCU。
从上图表格中可知，1）的改进直接减少了2倍的参数量降低了3倍的浮点计算量，2）的改进则进一步使参数更少浮点计算量更小。

3）使用轻量级骨干网

作者发现即使使用轻量级NASNet-Mobile 、MobileNet-v2骨干网，网络依旧能够达到非常稳健的性能表现，性能不会大幅下降。

实验结果

软硬件平台：8GB RAM, Intel i5-7600 处理器, 一块GT1080Ti GPU，CUDA 9.0 ，CuDNN 7.0。

作者首先在NYUDv2 和 PASCAL Person-Part数据集上进行了实验，结果如下：

可以看到虽性能略有下降，但参数量和计算时间大幅降低。

同时作者也在PASCAL VOC数据库上进行了实验，并加入NASNet-Mobile 、MobileNet-v2骨干网，发现对比于使用相同骨干网路的目前几乎是最先进的语义分割架构DeepLab-v3，RefineNet-LW的性能表现更具优势。

语义分割结果对比图示：

总结

这篇文章的改进非常简单，几乎所有想法都来自于实验摸索出来的。原来通过实验发现现有模型中的计算冗余也很有价值啊！

参考

[30] Kaiming He, Xiangyu Zhang, Shaoqing Ren, and Jian Sun. Deep residual learning for image recognition. In CVPR, 2016.
[33] Gao Huang, Zhuang Liu, Laurens van der Maaten, and Kilian Q. Weinberger. Densely connected convolutional networks. In CVPR, 2017.
[46] Guosheng Lin, Anton Milan, Chunhua Shen, and Ian D. Reid. Refinenet: Multi-path refinement networks for high-resolution semantic segmentation. In CVPR, 2017
[82] Barret Zoph, Vijay Vasudevan, Jonathon Shlens, and Quoc V. Le. Learning transferable architectures for scalable image recognition. CoRR, abs/1707.07012, 2017.
新开源！实时语义分割算法Light-Weight RefineNet ： https://www.sohu.com/a/258282358_100279313

论文笔记_S2D.06-2018-BMVC-用于实时语义分割的轻量级精细网络RefineNet相关推荐

BiSeNet:用于实时语义分割的双边分割网络-7min精简论文阅读系列-Leon
BiSeNet: Bilateral Segmentation Network for Real-time Semantic Segmentation BiSeNet:用于实时语义分割的双边分割网络 ...
CFPNet：用于实时语义分割的通道特征金字塔
论文地址:CFPNet: Channel-wise Feature Pyramid for Real-Time Semantic Segmentation 代码地址: https://github.c ...
FEANet——基于 RGBT的实时语义分割特征增强注意力网络
Overview Title:FEANet: Feature-Enhanced Attention Network for RGB-Thermal Real-time Semantic Segment ...
BCPNet：用于实时语义分割的双向上下文传播网络
论文地址:https://arxiv.org/pdf/2005.11034.pdf 代码地址:暂无空间细节和上下文相关性是语义分割的两类关键信息.一般来说,空间细节最可能存在于浅层,而上下文关联最可 ...
ENet：一种用于实时语义分割的深层神经网络结构
摘要: 实时执行像素语义分割的能力在移动应用程序中至关重要.最近针对这一任务的深层神经网络的缺点是需要大量的浮点运算,并且运行时间长,这阻碍了其可用性.在本文中,我们提出了一种新的深度神经网络体系结构 ...
（脑肿瘤分割笔记：四十三）用于脑胶质瘤分割的上下文感知网络
Title:CANet: Context Aware Network for Brain Glioma Segmentation 摘要-Abstract 目前的一些脑肿瘤分割方法缺乏强有力的策略来整合 ...
实时语义分割算法大盘点
本文转载自计算机视觉工坊语义分割论文语义图像分割是计算机视觉中发展最快的领域之一,有着广泛的应用.在许多领域,如机器人和自动驾驶汽车,语义图像分割是至关重要的,因为它提供了必要的上下文,以采取行动 ...
【论文阅读--实时语义分割】BiSeNet V2: Bilateral Network with Guided Aggregation
摘要低层细节和高层语义对于语义分割任务都是必不可少的.然而,为了加快模型推理的速度,目前的方法几乎总是牺牲低级细节,这导致了相当大的精度下降.我们建议将这些空间细节和分类语义分开处理,以实现高精度和 ...
LRNNet：轻量级FCB SVN实时语义分割
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达公众号后台回复「LRNNet」,即可获得论文下载链接. 简介: 语义分割可以看作是一种按像素分类的任务 ...
轻量级实时语义分割：ICNet BiSeNet
轻量级实时语义分割:ICNet & BiSeNet ICNet 贡献 Image Cascade Network Cascade Label Guidance Structure Compar ...

论文笔记_S2D.06-2018-BMVC-用于实时语义分割的轻量级精细网络RefineNet

论文基本情况

内容

摘要

介绍

相关工作

语义分割 Semantic segmentation

实时分割 Real-Time Segmentation

其他领域的实时推断 Real-Time Inference in Other Domains

RefineNet的网络架构