作者:Tom Hardy
Date:2020-2-24
来源:SDOD:基于depth的实时3D检测与分割

主要思想与创新点

大多数现有的实例分割方法只关注2D对象,不适用于三维场景,如自动驾驶。本文提出了一种将实例分割和目标检测分为两个并行分支的模型,将对象深度离散为“深度类别”(背景设置为0,对象设置为[1,K]),将实例分割任务转化为像素级分类任务。mask分支预测像素级的“深度类别”,3D分支预测实例级的“深度类别”,通过给每个实例分配具有相同“深度类别”的像素来生成实例掩模。另外,为了解决KITTI数据集(200为mask,7481为3D)中mask标签与3D标签不平衡的问题,本文采用其它实例分割方法生成的unreal mask来训练mask分支。
尽管使用了不真实的mask labels,但在KITTI数据集上的实验结果仍然达到了车辆实例分割的最佳性能。

本文创新点主要包括三点:

  1. 通过离散深度将实例分割任务转化为语义分割任务
  2. 提出一个结合3D检测和实例分割的网络,并将其设置为并行分支以加快速度
  3. 结合unreal的mask和真实的深度来训练mask分支,以解决标签不平衡的问题

网络结构

SDOD框架的总体结构如下图所示,它由两个并行分支:3D分支和mask分支组成。


针对3D检测:本文参考了MonoGRNet的设计,将3D对象检测分解为四个子网:2D检测、实例级深度估计、3D位置估计和角点回归。2D检测采用类似于YOLO结构的方式,Instance Depth是从RGB图像中回归出来的离散深度图。

针对Mask分支:采用ASPP+FCN方式。FCN模块最终输出C个图像(C代表类别),每个图像是目标的像素级深度类别图,如上图所示。像素的颜色越深,像素的深度值就越大,像素离我们越远。这个分支完成了像素级别的分割+depth估计。

Mask分支完成了基于像素级别的深度和类别分割,3D分支完成了目标的3D检测,两者进行结合,完成实时检测和分割。

针对损失函数:主要包括2D Detection loss、实例级深度损失、像素级深度损失以及3D box的角度损失和位置损失。

实验结果

主要针对KITTI数据集进行试验分析,并和其它模型进行了性能对比:



实例检测分割效果:

SDOD: Real-time Segmenting and Detecting 3D Objects by Depth(实时3D检测与分割)相关推荐

  1. [NEHE Couse] 05.3D Objects

    在这节课中终于从二维平面拓展到三维平面上来了,程序中绘制了两个3D物体,一个是四面体棱锥,一个是一个正方体,为了看起来效果好些,四棱锥每个顶点的颜色都不一样,然后颜色样式采用GL_SMOOTH来控制, ...

  2. [CVPR2020-best](unsup3d)Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Image

    标题:Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild 链接:http ...

  3. Reconstruction and Representation of 3D Objects with Radial Basis Functions 阅读笔记

    Reconstruction and Representation of 3D Objects with Radial Basis Functions 阅读笔记 紧接着上面的连篇blog,本篇学习如何 ...

  4. Unsupervised Learning of Probably Symmetric Deformable 3D Objects from Images in the Wild

    Abstract 提出了一种从原始单视图像中学习三维可变形物体的方法,该方法无需外部监督.该方法基于自动编码器,将输入图像分解为深度.反照率.视角和光照.为了在没有监督的情况下解耦(分解)这些组成部分 ...

  5. Autolabeling 3D Objects with Differentiable Rendering of SDF Shape Priors

    [CVPR2020] Autolabeling 3D Objects with Differentiable Rendering of SDF Shape Priors 论文地址:https://ar ...

  6. 微小目标识别(3)——论文翻译 SCRDet++: Detecting Small Objects via Instance-Level Feature Denoising(放不下了,摘要全文名称)

    文章目录 概述 补充说明 正文 Abstract Introduction 白酒杂质目标检测的作用 Related Work 2.1 Horizontal Region Object Detectio ...

  7. 谷歌最新论文:手机端的实时3-D目标检测

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 本文由知乎作者黄浴授权转载,不得擅自二次转载.原文链接:https://zhuanlan.zhihu. ...

  8. Deep Learning for 3D Point Clouds: A Survey - 3D点云的深度学习:一项调查 (IEEE TPAMI 2020)

    Deep Learning for 3D Point Clouds: A Survey - 3D点云的深度学习:一项调查(IEEE TPAMI 2020) 摘要 1. 引言 2. 背景 2.1 数据集 ...

  9. 数据重塑_借助实时3D重塑车载体验

    数据重塑 Unity is teaming up with NXP Semiconductors, the world's largest provider of automotive semicon ...

  10. 哥本哈根经度_借助实时3D塑造世界:团结哥本哈根主题演讲集锦

    哥本哈根经度 Unite Copenhagen is officially here, and we're thrilled that the action is taking place just ...

最新文章

  1. 使用Quartus建立第一个FPGA工程
  2. [转载]Java web应用中的常见字符编码问题的解决方法
  3. SAP WebIDE 里 UI5 应用的隐藏文件 project.json
  4. 《挑战程序设计竞赛》2.2 贪心法-其它 POJ3617 3069 3253 2393 1017 3040 1862 3262
  5. jetty 配置jndi_使用Jetty设置JNDI(嵌入式)
  6. crt中 新建的连接存储在哪_数字存储示波器的VPO技术
  7. setstate是同步还是异步_谈谈 IO模型:同步、异步、阻塞、非阻塞
  8. Snake模型综合介绍
  9. 地铁服务器的系统,地铁综合监控系统
  10. 智慧医疗整体解决方案(图文)
  11. NY--234 -- 吃土豆 [二维动态规划]
  12. Postgresql 之 数据库认证
  13. 【“计算机科学与技术”专业小白成长系列】计算机科学与技术主要学什么?
  14. 盗将行——微信群防骗指南
  15. Linux下载蓝奏云文件,蓝奏云CMD控制台
  16. html5是什么意思
  17. 蓝桥杯单片机led指示
  18. 云栖科技评论84期:英国零售商找错了“替罪羊”...
  19. App 瘦身最佳实践
  20. GBase项目管理实践总结——挣值管理学习

热门文章

  1. gulp教程之gulp-uglify(压缩javascript文件,减小文件大小)
  2. Java nextInt()函数
  3. script标签的for属性和event属性
  4. c# textbox和listbox多行显示
  5. 非关系型数据库和关系型数据库区别(转载)
  6. JavaWeb之得到web应用中的资源文件
  7. 前端js-angluar定时刷新器
  8. MapReduce学习要点
  9. zynq跑linux所需内存大小,Zynq-Linux移植学习笔记之33-CMA连续物理内存配置
  10. Html+Css打造一个精美的注册页面