点击上方“深度学习爱好者”,选择加"星标"或“置顶

重磅干货,第一时间送达小白导读论文是学术研究的精华和未来发展的明灯。小白决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

学习捕捉空间位置之间的依赖关系对于许多视觉任务是至关重要的,特别是像场景解析这样的密集标记问题。现有的方法可以有效地利用自我注意机制捕获长期依赖,而通过局部卷积捕获短期依赖。然而,长期依赖与短期依赖之间仍存在很大的差距,这极大地降低了模型在复杂自然场景图像中适用于不同空间尺度和关系的灵活性。为了填补这一空白,作者开发了一个中程(MR)分支,通过将自己的注意力限制在局部补丁中来捕获中程依赖关系。此外,作者观察到,可以强调与其他区域有较大相关性的空间区域,从而更准确地利用长期依赖关系,从而提出一个重新权衡的远程(RLR)分支。在提出的MR和RLR分支的基础上,作者构建了一个能有效捕获短期、中期和长期依赖的全范围依赖网络(ornet)。作者的ORDNet能够提取更全面的上下文信息,并能很好地适应场景图像中复杂的空间方差。大量的实验表明,作者所提出的ORDNet在三个场景分析基准测试(包括PASCAL Context、COCO Stuff和ADE20K)上优于之前的最先进的方法,证明了在场景分析任务的深度模型中捕获全方位依赖关系的优越性

论文创新点

利用新提出的MR和RLR分支,作者构建了一个全方位依赖网络(ornet),其中短程依赖、中程依赖和重新评估的长期依赖无缝协作,实现了对自然场景图像中不同空间区域内容和关系的适应性。ORDNet是通用的,可以应用于任何FCN骨干,学习更多的判别特征表示。

作者的主要贡献总结如下:

  • 作者设计了一个中程分支来明确捕捉场景图像局部补丁中的中程依赖,填补了长期依赖和短期依赖之间的空白。

  • 作者还提出了一个重新权衡的远程(RLR)分支,以强调编码共同模式的位置特征,从而可以捕获更准确和适应性的远程依赖关系。

  • 利用上述两个分支,作者开发了一种新的全范围依赖网络(ornet),该网络有效地集成了近程、中程和重估的长程依赖,提取全面的上下文信息,以实现准确的场景解析。

  • 作者的ORDNet在PASCALContext、COCO Stuff和ADE20K数据集这三个流行的场景解析基准上优于之前的最先进的方法,这很好地证明了它的有效性。

框架结构

提出的全范围依赖网络(ornet)的结构。给定一幅输入图像,将提取的CNN骨干特征X输入到一个中程(MR)分支和一个重称重远程(RLR)分支中,分别捕捉中程依赖和重称重远程依赖。这两个分支的输出然后连接沿通道维数和融合一个11卷积。添加了X的标识跳过连接以简化优化。融合后的特征被送入FCN头部预测logit映射,然后更新8次得到最终的解析掩码。

拟建的中程(MR)管道分支。这个分支包含3个步骤。首先,将输入特征X2 RH W C划分为2个2个patch,即[X1, X2, X3, X4],按行排序。其次,每个patch分别通过一个自我注意模块进行增强,得到Ym 2 R4 H2 W2 C作为中间输出。第三,将Ym恢复到相同大小的输入特征,得到Zm作为最终输出。

实验结果

在PASCAL-Context测试集上与基线扩张FCN和基本SA定性比较。(a)原始图像。(b)真实mask。(c) FCN扩张结果。(d)基础SA结果。(e)作者订单网的结果。(f)语义范畴的联想。

注意图的可视化与自我注意方法和RLR分支的分析结果。(一)原始图像。(b)全局注意力权重贡献图的可视化。全局注意力权重贡献图是每个位置对其他位置的注意力权重之和。(c) Groundtruth标签地图。(d)基本自我注意的解析结果。(e)解析RLR分支的结果。从(d)中可以看出,大面积连续的背景通常对其他位置的注意力权重贡献更大,例如第二排的天空,第四排的墙壁。通过强调这些区域,作者的RLR分支可以纠正基本注意的预测错误,并为这些区域分配适当的标签。以彩色观看最佳

结论

在本文中,作者解决了需要模型分割整个场景而不是前景对象的场景解析问题。作者提出了一种新型的全域依赖网络(ornet),该网络将自我注意的范围限制在局部斑块上以捕获中程依赖,同时有选择性地强调对其他区域贡献显著注意权重的空间区域,以模拟更精确的长期依赖。通过将局部卷积捕获的中程、重新权衡的长程和近程依赖关系整合在一起,作者的ORDNet可以帮助模型适应复杂自然图像中的各种空间尺度和关系,从而加强局部和全局特征表示。在四个场景分析和分割基准上的大量实验证明了该算法的优异性能。此外,由于ORDNet的通用性和即插即用特性,作者的ORDNet可以应用于其他可视化任务,以捕获全范围依赖关系。在未来,作者希望将ORDNet应用于其他视觉任务,并研究如何进一步减少其计算预算。

论文链接:https://arxiv.org/pdf/2101.03929.pdf

每日坚持论文分享不易,如果喜欢我们的内容,希望可以推荐或者转发给周围的同学。

- END -

ORDNet:为场景分割捕获全范围依赖关系相关推荐

  1. 基于深度学习的场景分割算法研究综述

    基于深度学习的场景分割算法研究综述 人工智能技术与咨询 来自<计算机研究与发展> ,作者张 蕊等 摘 要 场景分割的目标是判断场景图像中每个像素的类别.场景分割是计算机视觉领域重要的基本问 ...

  2. bat文件注册为Windows服务与依赖关系设置

    文章目录 1. 批处理文件注册为服务 1.1 应用场景 1.2 操作步骤 1.2.1 编写批处理文件; 1.2.2 借助instsrv+srvany将批处理文件注册为服务: 1.2.3 设置服务之间的 ...

  3. Non-local:用于捕获长距离依赖关系

    论文地址:https://arxiv.org/pdf/1711.07971v1 目录 0.摘要 1.引言 2.相关工作 3.Non-local网络 3.1.基本公式 3.2.一个non-local的实 ...

  4. 深度学习(9)——无监督语义分割之全卷积域适应网络(译文)

    无监督语义分割之全卷积域适应网络 Fully Convolutional Adaptation Networks for Semantic Segmentation 摘要 深度神经网络的最新进展令人信 ...

  5. DriveSeg:动态驾驶场景分割数据集

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要5分钟 Follow小博主,每天更新前沿干货 [导读]麻省理工学院和丰田发布DriveSeg数据集以加速自动驾驶研究,DriveSeg包含许多 ...

  6. mit数据集_DriveSeg:动态驾驶场景分割数据集

    [导读]麻省理工学院和丰田发布DriveSeg数据集以加速自动驾驶研究,DriveSeg包含许多常见道路对象的精确像素级表示,并通过连续视频驾驶场景的镜头. 我们如何训练自动驾驶模型,以加深对周围世界 ...

  7. 从局部到全局的多模式电影场景分割

    从局部到全局的多模式电影场景分割 CVPR2020 个人总结 1.研究现状: 2.研究的意义: 3.提出的解决方案(局部到全局的场景分割模型): 4.电影场景数据集: 5.结论: 全文翻译 从局部到全 ...

  8. CVPR 2022 | 腾讯优图实验室30篇论文入选,含场景文本语义识别、3D人脸重建、目标检测、视频场景分割和视频插帧等领域...

    关注公众号,发现CV技术之美 本文转载自腾讯优图 近日,CVPR 2022官方公布了接收论文列表(CVPR 2022 接收论文公布! 总计2067篇!),来自腾讯优图实验室共计30篇论文被CVPR收录 ...

  9. 基于多特征地图和深度学习的实时交通场景分割

    https://www.toutiao.com/a6623529829402673667/ 2018-11-14 09:58:33 Ⅰ.介绍 交通场景分割是智能车辆在检测障碍物.规划路径和自主导航中的 ...

最新文章

  1. Node.js获取mac网卡地址
  2. Making Your Own iPhone Frameworks. In Xcode
  3. Spring boot 梳理 - 在bean中使用命令行参数-自动装配ApplicationArguments
  4. 115.什么是SHELL
  5. HDU 4291 A Short problem 矩阵快速幂 循环节
  6. Linux下判断cpu物理个数,几核,是超线程还是多核心
  7. 洛谷P2089 烤鸡 题解
  8. 洛谷P1634、P1888、P3954、P5660题解(Java语言描述)
  9. HTML图形映射技术
  10. 机器人布罩_机器人防护罩的主要作用是什么?
  11. 涉及金钱使用double的已经被公司开除了,要使用BigDecimal
  12. 《Microsoft SQL Server 2008 Internals》读书笔记--目录索引
  13. 冯诺依曼计算机主机,冯诺依曼计算机的基本思想是什么?
  14. 火狐浏览器扩展程序源代码的查看
  15. J-LINK驱动下载
  16. Cisco(61)——双出口策略路由PBR+NAT
  17. win10休眠_硬派玩家 | Win 10关机速度变慢?这还真不是错觉
  18. 汇编指令:使用汇编指令计算2的8次方
  19. 如何实现微信抢红包算法?
  20. KDZD606绝缘服试验装置

热门文章

  1. 教育部发文35所高校新增AI本科专业!想回去重新高考
  2. 独家 | 5大冠军出炉!李开复的AI挑战赛,冠军们聊到了这么些感受
  3. 2021 年技术 5 大趋势
  4. 美团二面:Redis与MySQL双写一致性如何保证?
  5. 深度对比Jackson和Fastjson,最终我还是选择了...
  6. 干掉 powerdesigner,设计数据库表用它就够了
  7. 一文彻底搞懂 zookeeper 核心知识点(修订版)
  8. redis五大数据类型使用场景
  9. 数据科学干货分享来了!
  10. 周志华:“深”为什么重要,以及还有什么深的网络