任务:

调研室内场景下基于单帧图像的3D目标检测的研究情况。

思路:

首先了解相关数据集,benchmark,在数据集的基础上比较不同算法。

1. 室内场景的3D数据集

sunrgbd:室内场景,3D目标检测

scannet:室内场景,3D实例分割(3D实例标签在三个方向上取最小值和最大值,可以得出3D bounding box)

kitti: 道路场景,不是室内

Pix3D: 主要是物体3D模型重建,不是目标检测

ModelNet40: collection of 3D CAD models for objects, 不是真实环境

SUNCG: 用虚拟场景渲染单个视角的彩色深度和语义,主要拿来做基于单帧图像的语义场景修复

NYU Depth Dataset V2: 语义分割

S3DIS: 室内环境的3D扫描模型,偏向语义分割,可用来做目标检测

对比以上这些3D数据集,可直接用于室内3D目标检测的数据集为 sunrgbdscannet,所以用这两个数据集为标准,评价室内3D目标检测的模型性能。

参考文档:

数据集合集介绍:https://www.sohu.com/a/317394935_100007727

这篇文章里面有比较一些数据集:https://openaccess.thecvf.com/content_ICCV_2019/papers/Wald_RIO_3D_Object_Instance_Re-Localization_in_Changing_Indoor_Environments_ICCV_2019_paper.pdf

2. 一些论文网站

CVPR:https://dblp.uni-trier.de/db/conf/cvpr/index.html

CVPR2020:https://openaccess.thecvf.com/CVPR2020_search

ECCV2020:https://eccv2020.eu/accepted-papers/

ICCV2019:https://openaccess.thecvf.com/ICCV2019

3. 一些博客

https://blog.csdn.net/weixin_40805392/article/details/105618481  描述了CVPR2020 3D目标检测

https://blog.csdn.net/weixin_44125273/article/details/106420482 整理了CVPR2020部分论文

4. 比较模型

mAP@0.25

模型 代码是否开源 RGB

SUN RGB-D V1

ScanNet V2 作者,单位 来源
VoteNet without 57.7%  58.6% FaceBook, 斯坦福大学 ICCV2019
VoteNet with 56.3%   FaceBook, 斯坦福大学 ICCV2019
ImVoteNet with 63.4%   FaceBook, 斯坦福大学 CVPR2020
MLCVNet without 59.8% 64.5% 南京大学, 卡迪夫大学 CVPR2020
Density Based Clustering with 57.2%  

新加坡国立大学

CVPR2020

Multi-Scale EPN

(Edge-Aware PointNet)

with 64.9%  

新加坡国立大学

CVPR2020
HGNet without 61.6% 61.3% 浙江大学 CVPR2020
SESS without 61.1% 62.1%

新加坡国立大学

CVPR2020
Total3DUnderstanding  

26.38%

(标准不同

mAP@0.15)

  厦门大学, 深圳大数据研究所 CVPR2020
Transferable Semi-Supervised   40.6%   新加坡国立大学 ICCV2019
Generative Sparse Detection Networks     62.84% 斯坦福大学, NVIDIA ECCV2020
H3DNet without 60.1% 67.2% 德克萨斯大学奥斯汀分校 ECCV2020
3D Object Detection Using a Learned Loss     50.2% 伦敦大学 ECCV2020

3D-BoNet

   

68.7%(mAP@0.25)

43.9%(mAP@0.5)

牛津大学, DeepMind CVPR2019

室内环境下的3D 目标检测调研相关推荐

  1. 【雷达检测】基于复杂环境下的雷达目标检测技术(Matlab代码实现)

  2. 【雷达检测】基于复杂环境下的雷达目标检测技术附Matlab代码

    ✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信.

  3. 史上最全综述:3D目标检测算法汇总!

    来源:自动驾驶之心 本文约16000字,建议阅读10+分钟 本文将演示如何通过阈值调优来提高模型的性能.本文的结构安排如下:首先,第2节中介绍了3D目标检测问题的定义.数据集和评价指标.然后,我们回顾 ...

  4. 【点云3D目标检测】OpenPCDet下Spconv1.x与Spconv2.x的安装问题及解决方法

    目录 前言 一.spcon2.x版本的安装 1.安装spcon2.x版本所需要求 2.创建虚拟环境并安装相应的pytorch.torchvision 3.安装spcon2.x 4.测试spcon2.x ...

  5. MMdetection3d环境搭建、使用MMdetection3d做3D目标检测训练自己的数据集、测试、可视化,以及常见的错误

    MMdetection3d环境搭建.使用MMdetection3d做3D目标检测训练自己的数据集.测试.可视化,以及常见的错误 1 mmdetection3d环境搭建与测试 1.1 从docker开始 ...

  6. 3D目标检测算法调研FCOS/FCOS3D/FCOS3D++算法介绍

    一.综述 3D检测背景 二维目标检测算法能识别物体的类别.平面坐标以及边长,是计算机视觉中的一个基本问题.但是对于自动驾驶来说,二维信息还不足以让汽车充分感知三维立体的真实世界,当一辆智能汽车需要在道 ...

  7. CVPR 2022 | 华南理工提出VISTA:双跨视角空间注意力机制实现3D目标检测SOTA,即插即用...

    来源:机器之心 本文提出了 VISTA,一种新颖的即插即用多视角融合策略,用于准确的 3D 对象检测.为了使 VISTA 能够关注特定目标而不是一般点,研究者提出限制学习的注意力权重的方差.将分类和回 ...

  8. 基于激光雷达点云的3D目标检测算法—端到端多视图融合

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Rubicon007@知乎 来源丨https://zhuanlan.zhihu.com/p/44 ...

  9. DD3D:基于预训练的单目3D目标检测

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨CV研习社 作者丨元气满满的打工人 文章导读 导读:3D目标检测的主要应用场景就是自动驾驶,虽然 ...

最新文章

  1. RxPermissions的简单应用
  2. 下面有关java类加载器牛客网_下面有关java classloader说法错误的是?
  3. 2016/09/16面试资料汇总
  4. java this关键字的使用_老大:我去,你竟然还不会用 this 关键字
  5. 机器学习算法基础概念学习总结
  6. Number Sequence (KMP的应用)
  7. bzoj1085骑士精神(搜索)
  8. Leetcode: mimimum depth of tree, path sum, path sum II
  9. editthiscookie
  10. flex 常用正则验证举例
  11. Basic INFO: InstallShield 2012安装过程
  12. linux安装jdk详细步骤,需要有一定的语法基础
  13. 备战BAT面试-死磕mysql|mysql 是如何做到存储两千万数据毫无压力的?
  14. yuv422转rgb565
  15. 在部队当程序员是什么体验?
  16. webserver有哪些?
  17. 会议室预定小程序[叮当会议]
  18. 【案例】电影数据分析
  19. ロシア靑年無メンテナンス写真(図)に刺激を求めて
  20. Maven 项目使用开源中国镜像

热门文章

  1. java-php-python-中美医院病历管理系统计算机毕业设计
  2. revit管线插件:当前楼层怎么显示楼板以下的给排水管道?
  3. iOS即时通讯之CocoaAsyncSocket源码解析一
  4. 人工智能之语音机器人
  5. DRV8833真值表
  6. 注意: yyyy-MM-dd 与 YYYY-MM-dd
  7. [20071016]WindowsXP优化
  8. 中缀转后缀并分别计算
  9. 【科普】浅谈NB-IoT
  10. 系统调用recvfrom和recv区别