SDOD: Real-time Segmenting and Detecting 3D Objects by Depth(实时3D检测与分割)
作者:Tom Hardy
Date:2020-2-24
来源:SDOD:基于depth的实时3D检测与分割
主要思想与创新点
大多数现有的实例分割方法只关注2D对象,不适用于三维场景,如自动驾驶。本文提出了一种将实例分割和目标检测分为两个并行分支的模型,将对象深度离散为“深度类别”(背景设置为0,对象设置为[1,K]),将实例分割任务转化为像素级分类任务。mask分支预测像素级的“深度类别”,3D分支预测实例级的“深度类别”,通过给每个实例分配具有相同“深度类别”的像素来生成实例掩模。另外,为了解决KITTI数据集(200为mask,7481为3D)中mask标签与3D标签不平衡的问题,本文采用其它实例分割方法生成的unreal mask来训练mask分支。
尽管使用了不真实的mask labels,但在KITTI数据集上的实验结果仍然达到了车辆实例分割的最佳性能。
本文创新点主要包括三点:
- 通过离散深度将实例分割任务转化为语义分割任务
- 提出一个结合3D检测和实例分割的网络,并将其设置为并行分支以加快速度
- 结合unreal的mask和真实的深度来训练mask分支,以解决标签不平衡的问题
网络结构
SDOD框架的总体结构如下图所示,它由两个并行分支:3D分支和mask分支组成。
针对3D检测:本文参考了MonoGRNet的设计,将3D对象检测分解为四个子网:2D检测、实例级深度估计、3D位置估计和角点回归。2D检测采用类似于YOLO结构的方式,Instance Depth是从RGB图像中回归出来的离散深度图。
针对Mask分支:采用ASPP+FCN方式。FCN模块最终输出C个图像(C代表类别),每个图像是目标的像素级深度类别图,如上图所示。像素的颜色越深,像素的深度值就越大,像素离我们越远。这个分支完成了像素级别的分割+depth估计。
Mask分支完成了基于像素级别的深度和类别分割,3D分支完成了目标的3D检测,两者进行结合,完成实时检测和分割。
针对损失函数:主要包括2D Detection loss、实例级深度损失、像素级深度损失以及3D box的角度损失和位置损失。
实验结果
主要针对KITTI数据集进行试验分析,并和其它模型进行了性能对比:
实例检测分割效果:
SDOD: Real-time Segmenting and Detecting 3D Objects by Depth(实时3D检测与分割)相关推荐
- [NEHE Couse] 05.3D Objects
在这节课中终于从二维平面拓展到三维平面上来了,程序中绘制了两个3D物体,一个是四面体棱锥,一个是一个正方体,为了看起来效果好些,四棱锥每个顶点的颜色都不一样,然后颜色样式采用GL_SMOOTH来控制, ...
- [CVPR2020-best](unsup3d)Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Image
标题:Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild 链接:http ...
- Reconstruction and Representation of 3D Objects with Radial Basis Functions 阅读笔记
Reconstruction and Representation of 3D Objects with Radial Basis Functions 阅读笔记 紧接着上面的连篇blog,本篇学习如何 ...
- Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild
Abstract 提出了一种从原始单视图像中学习三维可变形物体的方法,该方法无需外部监督.该方法基于自动编码器,将输入图像分解为深度.反照率.视角和光照.为了在没有监督的情况下解耦(分解)这些组成部分 ...
- Autolabeling 3D Objects with Differentiable Rendering of SDF Shape Priors
[CVPR2020] Autolabeling 3D Objects with Differentiable Rendering of SDF Shape Priors 论文地址:https://ar ...
- 微小目标识别(3)——论文翻译 SCRDet++: Detecting Small Objects via Instance-Level Feature Denoising(放不下了,摘要全文名称)
文章目录 概述 补充说明 正文 Abstract Introduction 白酒杂质目标检测的作用 Related Work 2.1 Horizontal Region Object Detectio ...
- 谷歌最新论文:手机端的实时3-D目标检测
点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文由知乎作者黄浴授权转载,不得擅自二次转载.原文链接:https://zhuanlan.zhihu. ...
- Deep Learning for 3D Point Clouds: A Survey - 3D点云的深度学习:一项调查 (IEEE TPAMI 2020)
Deep Learning for 3D Point Clouds: A Survey - 3D点云的深度学习:一项调查(IEEE TPAMI 2020) 摘要 1. 引言 2. 背景 2.1 数据集 ...
- 数据重塑_借助实时3D重塑车载体验
数据重塑 Unity is teaming up with NXP Semiconductors, the world's largest provider of automotive semicon ...
- 哥本哈根经度_借助实时3D塑造世界:团结哥本哈根主题演讲集锦
哥本哈根经度 Unite Copenhagen is officially here, and we're thrilled that the action is taking place just ...
最新文章
- 使用Quartus建立第一个FPGA工程
- [转载]Java web应用中的常见字符编码问题的解决方法
- SAP WebIDE 里 UI5 应用的隐藏文件 project.json
- 《挑战程序设计竞赛》2.2 贪心法-其它 POJ3617 3069 3253 2393 1017 3040 1862 3262
- jetty 配置jndi_使用Jetty设置JNDI(嵌入式)
- crt中 新建的连接存储在哪_数字存储示波器的VPO技术
- setstate是同步还是异步_谈谈 IO模型:同步、异步、阻塞、非阻塞
- Snake模型综合介绍
- 地铁服务器的系统,地铁综合监控系统
- 智慧医疗整体解决方案(图文)
- NY--234 -- 吃土豆 [二维动态规划]
- Postgresql 之 数据库认证
- 【“计算机科学与技术”专业小白成长系列】计算机科学与技术主要学什么?
- 盗将行——微信群防骗指南
- Linux下载蓝奏云文件,蓝奏云CMD控制台
- html5是什么意思
- 蓝桥杯单片机led指示
- 云栖科技评论84期:英国零售商找错了“替罪羊”...
- App 瘦身最佳实践
- GBase项目管理实践总结——挣值管理学习