室内环境下的3D 目标检测调研
任务:
调研室内场景下基于单帧图像的3D目标检测的研究情况。
思路:
首先了解相关数据集,benchmark,在数据集的基础上比较不同算法。
1. 室内场景的3D数据集
sunrgbd:室内场景,3D目标检测
scannet:室内场景,3D实例分割(3D实例标签在三个方向上取最小值和最大值,可以得出3D bounding box)
kitti: 道路场景,不是室内
Pix3D: 主要是物体3D模型重建,不是目标检测
ModelNet40: collection of 3D CAD models for objects, 不是真实环境
SUNCG: 用虚拟场景渲染单个视角的彩色深度和语义,主要拿来做基于单帧图像的语义场景修复
NYU Depth Dataset V2: 语义分割
S3DIS: 室内环境的3D扫描模型,偏向语义分割,可用来做目标检测
对比以上这些3D数据集,可直接用于室内3D目标检测的数据集为 sunrgbd 和 scannet,所以用这两个数据集为标准,评价室内3D目标检测的模型性能。
参考文档:
数据集合集介绍:https://www.sohu.com/a/317394935_100007727
这篇文章里面有比较一些数据集:https://openaccess.thecvf.com/content_ICCV_2019/papers/Wald_RIO_3D_Object_Instance_Re-Localization_in_Changing_Indoor_Environments_ICCV_2019_paper.pdf
2. 一些论文网站
CVPR:https://dblp.uni-trier.de/db/conf/cvpr/index.html
CVPR2020:https://openaccess.thecvf.com/CVPR2020_search
ECCV2020:https://eccv2020.eu/accepted-papers/
ICCV2019:https://openaccess.thecvf.com/ICCV2019
3. 一些博客
https://blog.csdn.net/weixin_40805392/article/details/105618481 描述了CVPR2020 3D目标检测
https://blog.csdn.net/weixin_44125273/article/details/106420482 整理了CVPR2020部分论文
4. 比较模型
mAP@0.25
模型 | 代码是否开源 | RGB |
SUN RGB-D V1 |
ScanNet V2 | 作者,单位 | 来源 |
VoteNet | 是 | without | 57.7% | 58.6% | FaceBook, 斯坦福大学 | ICCV2019 |
VoteNet | 是 | with | 56.3% | FaceBook, 斯坦福大学 | ICCV2019 | |
ImVoteNet | 是 | with | 63.4% | FaceBook, 斯坦福大学 | CVPR2020 | |
MLCVNet | 是 | without | 59.8% | 64.5% | 南京大学, 卡迪夫大学 | CVPR2020 |
Density Based Clustering | 否 | with | 57.2% |
新加坡国立大学 |
CVPR2020 | |
Multi-Scale EPN (Edge-Aware PointNet) |
否 | with | 64.9% |
新加坡国立大学 |
CVPR2020 | |
HGNet | 否 | without | 61.6% | 61.3% | 浙江大学 | CVPR2020 |
SESS | 是 | without | 61.1% | 62.1% |
新加坡国立大学 |
CVPR2020 |
Total3DUnderstanding | 否 |
26.38% (标准不同 mAP@0.15) |
厦门大学, 深圳大数据研究所 | CVPR2020 | ||
Transferable Semi-Supervised | 否 | 40.6% | 新加坡国立大学 | ICCV2019 | ||
Generative Sparse Detection Networks | 否 | 62.84% | 斯坦福大学, NVIDIA | ECCV2020 | ||
H3DNet | 是 | without | 60.1% | 67.2% | 德克萨斯大学奥斯汀分校 | ECCV2020 |
3D Object Detection Using a Learned Loss | 否 | 50.2% | 伦敦大学 | ECCV2020 | ||
3D-BoNet |
是 |
68.7%(mAP@0.25) 43.9%(mAP@0.5) |
牛津大学, DeepMind | CVPR2019 |
室内环境下的3D 目标检测调研相关推荐
- 【雷达检测】基于复杂环境下的雷达目标检测技术(Matlab代码实现)
- 【雷达检测】基于复杂环境下的雷达目标检测技术附Matlab代码
✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信.
- 史上最全综述:3D目标检测算法汇总!
来源:自动驾驶之心 本文约16000字,建议阅读10+分钟 本文将演示如何通过阈值调优来提高模型的性能.本文的结构安排如下:首先,第2节中介绍了3D目标检测问题的定义.数据集和评价指标.然后,我们回顾 ...
- 【点云3D目标检测】OpenPCDet下Spconv1.x与Spconv2.x的安装问题及解决方法
目录 前言 一.spcon2.x版本的安装 1.安装spcon2.x版本所需要求 2.创建虚拟环境并安装相应的pytorch.torchvision 3.安装spcon2.x 4.测试spcon2.x ...
- MMdetection3d环境搭建、使用MMdetection3d做3D目标检测训练自己的数据集、测试、可视化,以及常见的错误
MMdetection3d环境搭建.使用MMdetection3d做3D目标检测训练自己的数据集.测试.可视化,以及常见的错误 1 mmdetection3d环境搭建与测试 1.1 从docker开始 ...
- 3D目标检测算法调研FCOS/FCOS3D/FCOS3D++算法介绍
一.综述 3D检测背景 二维目标检测算法能识别物体的类别.平面坐标以及边长,是计算机视觉中的一个基本问题.但是对于自动驾驶来说,二维信息还不足以让汽车充分感知三维立体的真实世界,当一辆智能汽车需要在道 ...
- CVPR 2022 | 华南理工提出VISTA:双跨视角空间注意力机制实现3D目标检测SOTA,即插即用...
来源:机器之心 本文提出了 VISTA,一种新颖的即插即用多视角融合策略,用于准确的 3D 对象检测.为了使 VISTA 能够关注特定目标而不是一般点,研究者提出限制学习的注意力权重的方差.将分类和回 ...
- 基于激光雷达点云的3D目标检测算法—端到端多视图融合
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Rubicon007@知乎 来源丨https://zhuanlan.zhihu.com/p/44 ...
- DD3D:基于预训练的单目3D目标检测
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨CV研习社 作者丨元气满满的打工人 文章导读 导读:3D目标检测的主要应用场景就是自动驾驶,虽然 ...
最新文章
- RxPermissions的简单应用
- 下面有关java类加载器牛客网_下面有关java classloader说法错误的是?
- 2016/09/16面试资料汇总
- java this关键字的使用_老大:我去,你竟然还不会用 this 关键字
- 机器学习算法基础概念学习总结
- Number Sequence (KMP的应用)
- bzoj1085骑士精神(搜索)
- Leetcode: mimimum depth of tree, path sum, path sum II
- editthiscookie
- flex 常用正则验证举例
- Basic INFO: InstallShield 2012安装过程
- linux安装jdk详细步骤,需要有一定的语法基础
- 备战BAT面试-死磕mysql|mysql 是如何做到存储两千万数据毫无压力的?
- yuv422转rgb565
- 在部队当程序员是什么体验?
- webserver有哪些?
- 会议室预定小程序[叮当会议]
- 【案例】电影数据分析
- ロシア靑年無メンテナンス写真(図)に刺激を求めて
- Maven 项目使用开源中国镜像