点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

公众号后台回复「LRNNet」,即可获得论文下载链接。



简介:

语义分割可以看作是一种按像素分类的任务,它将特定的预定义类别分配给图像中的每个像素。该任务在自动驾驶和图像编辑等方面具有广泛的应用前景。近年来,轻量化神经网络的发展促进了资源约束的深度学习应用和移动应用。其中许多应用都需要使用轻量化网络对语义分割进行实时、高效的预测。为了实现高效、实时的分割,本文提出了一种基于精简非局部模块(LRNNet)的轻量级网络。为了实现更轻、更高效、更强大的特征提取,在resnet-style的编码器中提出了分解卷积块。同时,提出的非局部缩减模块利用空间区域的奇异向量来实现更有代表性的非局部特征缩减集成,计算量和存储成本都大大降低。实验证明了模型在轻量级、速度快、灵敏度和准确度之间的优势权衡。LRNNet在没有额外处理和预训练的情况下,仅使用精细标注的训练数据,在GTX 1080Ti卡上参数为0.68M和71FPS,在Cityscapes测试数据集上达到72.2%mIoU。

本文中最值得关注的是FCB块:

一个轻量级的分解卷积块(FCB)来建立一个特征提取网络(编码器),如下图所示。分别对长程特征和短程特征进行分解卷积处理,并提出了一种具有广义奇异向量的非局部模块来建模长程相关性和全局特征选择,从而实现分割结果的一致性。

本文主要贡献:

1)本文提出了一种分解卷积块(FCB),通过更恰当地处理长程和短程特征,建立了一种轻量级、功能强大、效率高的有限元分析提取网络。

2)提出非局部模块(SVN),利用区域奇异向量产生更有代表性的特征来建模远程依赖和全局特征选择。

3)在Cityscapes和Camvid数据集上的LRNNet的参数大小、速度、计算和精确度之间的权衡最好。

方法:

预备知识:奇异值分解SVD等。

LRNNet:

如上图所示为轻量级编码器,它是一个三阶段resnet-style网络并且带有分解卷积块。

分解卷积块:

分解卷积块是实现轻量化分割的常用方法。例如,扩张卷积增大感受野也是语义分割模型的重要组成部分。由于一维因子分解核函数更适合于空间信息特征。考虑到一个3×3卷积核被一个3×1和1×3卷积核取代,这样可以有相同的接收域和更少的参数。但是,如果忽略在两个1D卷积核之间交叉激活函数所造成的信息损失,它可能是3 - 3卷积核的秩近似1。假设空间语义不同区域具有不同的特性,如果卷积核的扩张率是1或小,卷积核可能不跨多个不同的空间语义区域,接受特征信息较少,因此秩近似可能更有效,反之亦然。

因此,大扩张的卷积核在空间上会接收到复杂且具有空间信息的远距离特征,在空间上需要更多的参数。同时,扩张小的卷积核在空间上会得到信息简单或信息较少的短期特征,空间上的参数也较少。如上图所示,FCB第一处理短程和空间信息特征分成两组1 d卷积通道连接,所以映像卷积减少了参数和计算。扩大接受域,与更大的扩张和FCB的利用2d核使用切除分离卷积来减少参数和计算。由于点卷积后有残差连接,最后设置了信道洗牌操作。总的来说,FCB对近距离特征采用一维低秩近似,对远距离特征采用深度空间二维扩张核,使得特征提取更加轻量级、更加丰富和强大。

SVN模块:

一个轻量级的模型很难实现强大的特征提取。生成精简的、鲁棒的、有代表性的特征并将其结合成非局部模块是探索高效的非局部轻权重语义分割机制的重要途径。如上图所示,采用Conv1和Conv2两种方法降低了代价,这两种方法形成了瓶颈:将非局部操作的简化通道和用其区域优势奇异向量替换键和值。提出的SVN包括两个分支:较低的分支是来自输入的残余连接。上层分支是简化非局部操作的瓶颈,将特征图划分为空间子区域。SVN模块通过瓶颈结构和约简并具有代表性的区域优势奇异向量形成了一个约简有效的非局部运算。区域优势奇异向量是特征图区域最具代表性的特征向量。

实验结果:

Cityscapes验证集的可视化结果:

对Cityscapes验证集进行评估,包括准确性、推理时间、参数大小和计算量:

在Cityscapes测试集上的评价:

总结:

本文提出了一种用于实时语义分割的LRNNet。提出的FCB单元探索了一种分解卷积块来处理近程和远程特征,为LRNNet编码器提供了轻量级、高效和强大的特征提取。SVN模块利用区域优势奇异向量构造有效的降低非局部运算,以非常低的代价来增强译码器。实验结果验证了模型在参数大小,速度,计算和精度之间

本文仅做学术分享,如有侵权,请联系删文。

推荐阅读:

  • 专辑|相机标定

  • 专辑|3D点云

  • 专辑|SLAM

  • 专辑|深度学习与自动驾驶

  • 专辑|结构光

  • 专辑|事件相机

  • 专辑|OpenCV学习

  • 专辑|学习资源汇总

  • 专辑|招聘与项目对接

  • 专辑|读书笔记

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流等微信群,请扫描下面微信号加群,备注:”研究方向+学校/公司+昵称“,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进去相关微信群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近1000+星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

LRNNet:轻量级FCB SVN实时语义分割相关推荐

  1. 轻量级实时语义分割:ENet ERFNet

    ENet: A Deep Neural Network Architecture for Real-Time Semantic Segmentation 发表在CVPR2016. ERFNet: Ef ...

  2. 轻量级实时语义分割:Guided Upsampling Network for Real-Time Semantic Segmentation

    轻量级实时语义分割:Guided Upsampling Network for Real-Time Semantic Segmentation 介绍 网络设计 Guided unsampling mo ...

  3. 轻量级实时语义分割:ICNet BiSeNet

    轻量级实时语义分割:ICNet & BiSeNet ICNet 贡献 Image Cascade Network Cascade Label Guidance Structure Compar ...

  4. 北航、旷视联合,打造最强实时语义分割网络

    来源:AI科技评论 编辑:Camel 导语:MSFNet在Cityscapes测试集上达到77.1%mIoU/41FPS(注意是1024*2048),在Camvid测试集上达到75.4 mIoU/97 ...

  5. concat特征融合_MSFNet:多重空间融合网络进行实时语义分割(北航和旷视联合提出)...

    作者:Tom Hardy Date:2020-02-01 来源:MSFNet:多重空间融合网络进行实时语义分割(北航和旷视联合提出) 原文链接:https://arxiv.org/abs/1911.0 ...

  6. 实时语义分割算法大盘点

    本文转载自计算机视觉工坊 语义分割论文 语义图像分割是计算机视觉中发展最快的领域之一,有着广泛的应用.在许多领域,如机器人和自动驾驶汽车,语义图像分割是至关重要的,因为它提供了必要的上下文,以采取行动 ...

  7. 新开源!实时语义分割算法Light-Weight RefineNet

    点击我爱计算机视觉标星,更快获取CVML新技术 前几日52CV君分享了论文<Real-Time Joint Semantic Segmentation and Depth Estimation ...

  8. 旷视科技提出双向网络BiSeNet:实现实时语义分割

    转于:https://zhuanlan.zhihu.com/p/41475332 全球计算机视觉三大顶会之一 ECCV 2018 (European Conference on Computer Vi ...

  9. 实时语义分割网络 BiSeNet(附代码解读)

    实时语义分割网络 BiSeNet BiSeNet Contributions BackGround BiSeNet 结构 Loss function Experimental Results 采用数据 ...

最新文章

  1. nginx源码分析--内存对齐处理
  2. 如何选择一线城市和二线城市?
  3. C++ link2005 error 错误 解决方法汇总(一般重复定义,如果都是不就是 函数定义和实现没有分离)...
  4. Markdown编辑器的使用方法
  5. 西安python工资怎么样-在西安为什么对Python编程需求这么大?工资这么高?
  6. Cracking The Coding Interview5.2
  7. 第6章 RTX 操作系统源码方式移植
  8. 小功能 获取一段汉字的拼音首字母
  9. 我发现我对人类活动的认识开始有一点点变化了
  10. Mybatis CRUD操作和多表查询
  11. us、ms、s 单位转换,不会的都是大傻子!!!
  12. 计算机msvcp100.dll,msvcp100.dll丢失的解决方法
  13. Portal for ArcGIS是什么东东
  14. 厦门理工学院OJ题解(1223:Rite与跳舞毯)
  15. 关于物联网进入元宇宙时代的基础与发展思考
  16. 使用Tycho构建OSGi插件项目
  17. Leetcode hot100题 个人整理版
  18. java中 continue outer, break inner 简解
  19. 怎么看计算机配件型号,如何看硬件参数
  20. aria2c rpc php,Aria2(aria2c)

热门文章

  1. django学习笔记1
  2. 《C++成员函数重载、覆盖与隐藏》
  3. 如何做好一场技术演讲-总结:3、如何把你的观点深深地刻在别人的脑海中?
  4. 快手数据中台建设实践
  5. 刚学会深拷贝一个对象,学妹却问我怎么深拷贝一个图
  6. 今天说的是必须要熟练掌握的归并排序
  7. java安全编码指南之:堆污染Heap pollution
  8. UML科普文,一篇文章掌握14种UML图
  9. 大型电商网站详情页是如何支撑亿级流量访问的?
  10. 领导者有3个要求,你做到了吗?