点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

论文是学术研究的精华和未来发展的明灯。小黑决心每天为大家带来经典或者最新论文的解读和分享,旨在帮助各位读者快速了解论文内容。个人能力有限,理解难免出现偏差,建议对文章内容感兴趣的读者,一定要下载原文,了解具体内容。

摘要

现有的RGB-D显著性对象检测(SOD)模型需要大量的计算和内存消耗才能准确检测显著性对象。这限制了这些RGB-D SOD模型的实际应用。为了解决这一问题,本文提出了一种新型的轻量级RGB-D SOD模型。不同于现有大多数模型通常采用双流或单流结构,作者提出采用中层融合结构设计轻型RGB-D SOD模型,由于中层融合结构可以同时利用双流结构的模态共享信息和模态特定信息,并且可以显著降低单流结构的网络参数。在此基础上,设计了一种新型的信息感知多模态特征融合模块,以有效地捕获交叉模态互补信息。然后,设计了一种轻量级特征级和决策级特征融合(LFDF)模块,以更少的参数聚集不同阶段的特征级和决策级显著性信息。在中层融合结构中加入了IMFF和LFDF模块,该模型只有3.9M参数,运行速度为33帧/秒。在多个基准数据集上的实验结果验证了该方法的有效性和优越性。

论文创新点

这项工作的主要贡献如下:

(1)通过对中级特征融合的回顾,提出了一种轻型RGB-D SOD模型,该模型效率高、精度好、模型尺寸小,有助于SOD的实际应用。

(2)设计了一种新的信息感知多模态特征融合(IMFF)模块,利用RGB图像和深度图像中所有的区分性显著性信息。与大多数现有模型采用简单的融合策略(例如,串联和元素级加)不同,作者提出的IMFF模块根据多模态特征所包含的信息量进行融合。

(3)提出了一种轻量级的特征级和决策级特征融合(LFDF)模块,以更少的参数有效地聚合不同阶段的特征级和决策级显著性信息,实现更好的显著性预测。

框架结构

大多数现有RGB-D SOD方法的架构。(a)二束结构。(b)及(c)单流结构。(d)作者提出的模型的中层融合结构。

提出的轻量级RGB-D SOD模型的框架。

作者提出的IMFF模块的架构。

实验结果

由不同模型生成的显著性地图的可视化。

结论

在本文中,作者提出了第一个基于中层融合结构的轻量级RGB-D SOD模型。通过重新访问中层融合结构,该模型显著降低了网络参数。此外,本文提出的IMFF模块利用RGB和深度图像中不同局部区域的信息量,可以有效地捕获参数较少的交叉模态互补信息。同时,所提出的LFDF模块通过特征层和决策层信息的交叉层联合融合,可以有效提取交叉层的互补信息。基于中层融合结构,该模型只有3.9M参数,运行速度为33帧/秒。此外,在多个基准上的实验结果表明,本文提出的IMFF和LFDF模块可以在一定程度上弥补由于减小参数引起的性能下降。

论文链接:https://arxiv.org/pdf/2104.11543.pdf

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、orb-slam3等视频课程)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

轻量级RGB-D显著目标检测的中层融合相关推荐

  1. 目标检测中特征融合技术(YOLO v4)(下)

    目标检测中特征融合技术(YOLO v4)(下) ASFF:自适应特征融合方式 ASFF来自论文:<Learning Spatial Fusion for Single-Shot Object D ...

  2. 目标检测中特征融合技术(YOLO v4)(上)

    目标检测中特征融合技术(YOLO v4)(上) 论文链接:https://arxiv.org/abs/1612.03144 Feature Pyramid Networks for Object De ...

  3. 自动驾驶软件工程之目标检测以及传感器融合

    1. 目标检测 2. 传感器融合部分

  4. 基于yolov5n的轻量级MSTAR遥感影像目标检测系统设计开发实战

    做过很多目标检测类的项目了,最近看到一个很早之前用过的数据集MSTAR,之前老师给的任务是基于这个数据集来搭建图像识别模型,殊不知他也是可以用来做目标检测的,今天正好有点时间就想着基于这个数据集来做一 ...

  5. 目标检测 Review

    转载自:https://blog.csdn.net/clover_my/article/details/92794719 Object Detection in 20 Years: A Survey ...

  6. 目标检测20年(Object Detection in 20 Years)

    Object Detection in 20 Years: A Survey Zhengxia Zou, Zhenwei Shi, Member, IEEE, Yuhong Guo, and Jiep ...

  7. CVPR2020论文介绍: 3D 目标检测高效算法

    CVPR2020论文介绍: 3D 目标检测高效算法 CVPR 2020: Structure Aware Single-Stage 3D Object Detection from Point Clo ...

  8. 从2D到3D的目标检测综述

    点云PCL免费知识星球,点云论文速读. 文章:An Overview Of 3D Object Detection 作者:Yilin Wang  Jiayi Ye 翻译:分享者 本文仅做学术分享,如有 ...

  9. 从数据集到2D和3D方法,一文概览目标检测领域进展

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自:深度学习这件小事 目标检测一直是计算机视觉领域中一大难题 ...

最新文章

  1. pyspider爬虫学习-文档翻译-About-Projects.md
  2. 《信息系统项目管理师软考辅导——3年真题详解与全真模拟》主要创新点、关注点...
  3. oracle-sql汇总
  4. 80%的人都混淆的BI和报表之不同
  5. 【JavaScript】jQuery Ajax 实例 全解析
  6. 摸透 Redis 主从复制、哨兵、Cluster 三种模式
  7. python脚本语言采用声音作为手段_python 利用pyttsx3文字转语音过程详解
  8. 全新的 Fragment 通信方式
  9. 手机号归属地 mysql脚本_示例演示手机号归属地查询功能
  10. ofo 回应海外部门集体解散;罗永浩将现身快如发布会;支付宝更名? | 极客头条...
  11. MVC中Action参数绑定的过程
  12. 省级面板数据(1990-2019):能源消费(煤炭、焦炭、石油、原油等)excel或stata版本
  13. 《统计数据会说谎》阅读总结
  14. System Exception:故障解决:端口已被占用 1080--->的处理方法
  15. 记录蓝屏问题FAULTY_HARDWARE_CORRUPTED_PAGE
  16. 高数 | 导数极限定理、分段点求导能不能用公式?导数和导数的极限?
  17. python 微信授权 昵称乱码解决
  18. php pdf数字签名,用PHP从PDF中检索数字签名信息
  19. 知物由学 | iOS AssetBundle资源保护
  20. 工作之余如何有效学习提升

热门文章

  1. 团队项目第一阶段冲刺站立会议11(4月28日)
  2. Linux下清空用户登录记录和命令历史的方法
  3. (转)一个as3写的减速效果
  4. Access快速连接SQL Server的方法(VB代码为例)
  5. 《Go语言从入门到实战》学习笔记(1)——Go语言学习路线图、简介
  6. 高效排序算法(希尔排序)
  7. 同样是持久化,竟然有这么大的差别!
  8. 《我想进大厂》之JVM夺命连环10问
  9. 某程序员毕业进UC,被阿里收购!跳去优酷土豆,又被阿里收购!再跳去饿了么,还被阿里收购!难道阿里想收购的是他?...
  10. HashMap 在并发下可能出现的问题分析!