点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

小白导读

论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

语义分割是自动驾驶汽车了解周围场景的关键技术。对于实际的自动驾驶汽车来说,为了获得高精度的分割结果而花费大量的推理时间是不可取的。最近的方法使用轻量级架构(编码器、解码器或双通道)或对低分辨率图像进行推理,实现了非常快的场景解析,甚至在单个1080Ti GPU上运行超过100 FPS。然而,这些实时方法和基于膨胀骨架的模型在性能上仍然存在明显的差距。为了解决这一问题,作者提出了一种新型的深度双分辨率网络(DDRNets)用于道路场景的实时语义分割。此外,作者还设计了一种新的上下文信息提取器——深度聚合金字塔池模块(Deep Aggregation Pyramid Pooling Module, DAPPM),以扩大有效的接受域,融合多尺度上下文。作者的方法在城市景观和CamVid数据集的准确性和速度之间实现了最新的最先进的平衡。特别,在2080Ti GPU,DDRNet-23-slim收益率77.4% mIoU 109 FPS城市测试集和74.4%在230 FPS mIoU CamVid测试集,没有利用注意力机制,pretraining更大的语义分割数据集或推理加速度,DDRNet-39达到80.4%的测试mIoU在城市23 FPS。由于广泛使用的测试增强,作者的方法仍然优于大多数最先进的模型,需要更少的计算。守则和训练过的模型将向公众开放。

论文创新点

本文受HRNet的启发,提出了一种具有深度高分辨率表示能力的深度双分辨率网络,用于高分辨率图像的实时语义分割,特别是针对道路驾驶图像。作者的DDRNet从一个主干开始,然后分成两个不同分辨率的平行深分支。一个深度分支生成相对高分辨率的特征图,另一个通过多次下采样操作提取丰富的上下文信息。为了实现有效的信息融合,在两个分支之间建立了多个双边连接。此外,作者还提出了一种新的模块DAPPM,该模块比普通的PPM模块能更充分地增加接收域,提取上下文信息。在对语义分割数据集进行训练之前,首先在ImageNet上按照常见的范式对双分辨率网络进行训练。

根据在两个流行基准上的大量实验结果,DDRNet在分割精度和推理速度之间取得了很好的平衡,并且在训练过程中比HRNet占用更少的GPU内存。与其他实时算法相比,作者的方法在城市景观和CamVid上实现了新的最先进的mIoU,没有注意机制和任何额外的铃声或口哨。使用标准的测试增强技术,DDRNet可以与最先进的模型相媲美,但需要的计算资源要少得多。

其主要贡献总结如下:

  • 提出了一种新的深度双分辨率双边网络用于实时语义分割。作者的网络获得新的最先进的性能考虑推理速度没有任何额外的铃声或哨子。

  • 设计了一个新的模块,通过将特征聚合与金字塔池相结合来获取丰富的上下文信息。当它与低分辨率的特征映射集成时,推理时间几乎没有增加。

  • 通过简单的增加网络的宽度和深度,DDRNet在现有的方法中实现了mIoU和FPS之间的最大权衡,在cityscape测试集上,从77.4%的mIoU在109 FPS到80.4%的mIoU在23 FPS。

框架结构

双侧融合细节在DDRNet中。在ReLU之前实现了求和融合。

语义分割的DDRNets综述。RB表示顺序剩余基本块。RBB表示单个剩余瓶颈块。DAPPM表示深度聚合金字塔池化模块。赛格。Head表示分割头。黑色实线表示有数据处理的信息路径(包括上采样和下采样),黑色虚线表示没有数据处理的信息路径。sum表示逐点连接。虚线框表示在推理阶段被忽略的组件。

实验结果

cityscape val set上的可视化分割结果。从左到右的四列分别为输入图像、ground truth、DDRNet-23-slim的输出、DDRNet-23的输出。前四行显示了两种模型的性能,后两行表示了一些分割失败。

结论

本文提出了一种新的用于道路场景实时语义分割的深度双分辨率体系结构,并提出了一种新的多尺度上下文信息提取模块。据作者所知,作者是第一个将深度高分辨率表示引入实时语义分割的公司,作者的简单策略在两种流行基准上优于所有以前的模型,而不需要任何额外的附加功能。现有的实时网络大多是为ImageNet精心设计的或专门为ImageNet设计的高级骨干,这与广泛用于高精度方法的扩张骨干有很大不同。相比之下,DDRNet只利用了基本的残余模块和瓶颈模块,通过缩放模型的宽度和深度,可以提供更大范围的速度和精度权衡。由于作者的方法简单和高效,它可以被视为统一实时和高精度的语义分割的强大基线。

论文链接:https://arxiv.org/pdf/2101.06085.pdf

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

- END -

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

用于道路场景实时准确语义分割的深度双分辨率网络相关推荐

  1. BCPNet:用于实时语义分割的双向上下文传播网络

    论文地址:https://arxiv.org/pdf/2005.11034.pdf 代码地址:暂无 空间细节和上下文相关性是语义分割的两类关键信息.一般来说,空间细节最可能存在于浅层,而上下文关联最可 ...

  2. 汇总|实时性语义分割算法(全)

    我们在上篇--汇总|实时性语义分割算法(上篇)中,已经总结了[1]~[12],这里我们继续. [13]用于实时语义分割的双向分割网络 <BiSeNet: Bilateral Segmentati ...

  3. 17毫秒每帧!实时语义分割与深度估计

    点击我爱计算机视觉标星,更快获取CVML新技术 用更小更快的模型达到state-of-the-art效果的多任务学习 今天跟大家分享几天前arXiv上的一篇兼顾模型速度与性能的论文<Real-T ...

  4. 目标检测经典论文——R-CNN论文翻译(纯中文版):用于精确物体定位和语义分割的丰富特征层次结构(技术报告(第5版))

    目标检测经典论文翻译汇总:[翻译汇总] 翻译pdf文件下载:[下载地址] 此版为纯中文版,中英文对照版请稳步:[R-CNN中英文对照版] 用于精确物体定位和语义分割的丰富特征层次结构 技术报告(第5版 ...

  5. RGPNET: 复杂环境下实时通用语义分割网络

    作者:Tom Hardy Date:2020-02-09 来源:RGPNET: 复杂环境下实时通用语义分割网络

  6. 场景解析和语义分割区别_精准安防场景理解及语义分割

    原标题:精准安防场景理解及语义分割 前20位报名的朋友,可以立减200元学费 第21-50位报名的朋友,可以立减100元学费 课程简介: 继人脸识别之后,场景理解和语义分割正在成为人工智能的下一个风口 ...

  7. 图像语义分割:FCN全卷积网络概述

    图像语义分割:FCN全卷积网络概述 Why does FCN work? FCN网络的基本概念 FCN的计算原理 Feature map上采样 What is FCN? FCN网络的结构 FCN每层的 ...

  8. 场景解析和语义分割区别_语义分割概念及应用介绍

    摘要: 一份关于语义分割的基本概述,涵盖语义分割的特征和可能的用途,包括地质检测.自动驾驶.面部识别等. 近年来,以深度学习为中心的机器学习技术引起了人们的关注.比如自动驾驶汽车已经逐渐成为可能,但在 ...

  9. 用于RGB-D语义分割的全局-局部传播网络

    点击上方"小白学视觉",选择加"星标"或"置顶"重磅干货,第一时间送达 小白导读 论文是学术研究的精华和未来发展的明灯.小白决心每天为大家带 ...

最新文章

  1. 20181023-3 每周例行报告
  2. [LeetCode] Wildcard Matching 题解
  3. 查找有权限使用某个T-Code的所有用户列表
  4. 数学建模公选课Ch1.2020.4.4
  5. C#各版本新增加功能
  6. C++ 实现带权有向图的每对顶点之间的最短路径Floyd算法(完整代码)
  7. 数据库上云如何顺利进行?6位专家直播助你一臂之力
  8. python数据挖掘笔记】十八.线性回归及多项式回归分析四个案例分享
  9. python定时任务之cron_Python定时任务框架APScheduler 3.0.3 Cron示例
  10. iOS开发--Swift RAC响应式编程初探
  11. 001.Spark的日志配置
  12. 笔记--希尔伯特空间
  13. 2021-10-25 UI设计规范及动态海报
  14. jsp代码没有错,但是总是有红叉(一招解决)
  15. 用指针将字符串逆序输出
  16. 如何把word文档转换成jpg图片
  17. 另类网站版式设计欣赏
  18. 微软商店打不开怎么办,求助
  19. 计算机软件实习每日学习打卡(3)20201204
  20. matlab 图片倒影_ai怎么做水倒影效果?ai制作图案倒影水汶效果教程

热门文章

  1. 手机号码、验证码的处理
  2. GPT3.5 promt的两个编写原则之一 编写具体、清晰的指令
  3. 大模型LLM微调的方式:Instruction/Promt/Prefix/PET、
  4. 容斥原理·Gym101350G·Snake Rana
  5. Latex IEEE格式下引用文献排序问题
  6. 银行数字化转型导师坚鹏:金融科技助力普惠金融新成效
  7. matlab中的pause是什么意思,【Matlab学习笔记】【函数学习】一(延时函数pause)...
  8. 关于一款多平台的数据库管理工具
  9. TestNg之断言Assert
  10. 荣耀8怎样修改wifi服务器,华为荣耀路由设置教程【图解】