主要思想与创新点

大多数最先进的三维目标检测器严重依赖激光雷达传感器。由于在三维场景中的预测不准确,基于图像的方法与基于激光雷达的方法在性能上仍有很大差距。本文提出了深度立体几何网络(DSGN)的方法,通过在可微的体积表示:三维几何体上检测三维物体,有效地编码了三维规则空间的三维几何结构,显著地减小了这一差距。通过这种表示,可以同时学习深度信息和语义线索。本文首次提供了一个简单有效的基于单级立体的3D检测流水线,它以端到端的学习方式联合估计深度和检测3D对象。该方法优于以前的基于立体的3D检测器(在AP方面大约高出10个),甚至达到了KITTI 3D目标检测排行榜上的几个基于LiDAR方法相当的性能,代码将在后期公开。

本文主要有以下创新点:

1. 为了弥补二维图像与三维空间之间的差距,在平面扫描体中建立立体对应约束,并将其转化为三维几何体,从而可以对三维几何体和语义线索进行编码,用于三维规则空间的预测;

2. 设计了一个单一的统一网络,用于提取用于立体匹配的像素级特征和用于目标识别的高级特征。本文的pipelines可以联合估计场景深度和检测三维世界中的3D Object,从而实现实际应用;

3. 提出的网络性能优于官方KITTI排行榜上所有其它基于立体的3D物体探测器(AP高出10个)

网络结构

有效三维表示的关键在于对三维空间的精确三维几何信息进行编码,立体相机为计算深度提供了明确的像素对应约束。为了设计一个统一的网络来利用这一约束,本文探索了能够同时提取立体对应的像素级特征和语义线索的高级特征的深层结构。假设像

DSGN:基于深度立体几何网络的3D目标检测(香港大学提出)相关推荐

  1. 基于激光雷达点云的3D目标检测算法论文总结

    作者丨eyesighting@知乎 来源丨https://zhuanlan.zhihu.com/p/508859024 编辑丨3D视觉工坊 前言  过去很多年激光雷达的车规标准和高昂价格是阻碍其量产落 ...

  2. MXNet的Faster R-CNN(基于区域提议网络的实时目标检测)《9》

    MXNet的Faster R-CNN(基于区域提议网络的实时目标检测)<1>:论文源地址,克隆MXNet版本的源码,安装环境与测试,以及对下载的源码的每个目录做什么用的,做个解释. MXN ...

  3. 目标检测YOLO实战应用案例100讲-基于深度学习的自动驾驶目标检测算法研究

    目录 基于深度学习的自动驾驶目标检测算法研究 相关理论基础 2.1  卷积神经网络基本原理

  4. DeepFusion:基于激光雷达和相机深度融合的多模态3D目标检测

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨安全与性能研究室 来源丨 同济智能汽车研究所 点击进入->3D视觉工坊学习交流群 编者按: ...

  5. 基于激光雷达点云的3D目标检测算法—端到端多视图融合

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨Rubicon007@知乎 来源丨https://zhuanlan.zhihu.com/p/44 ...

  6. 动手学无人驾驶(4):基于激光雷达点云数据3D目标检测

    上一篇文章<动手学无人驾驶(3):基于激光雷达3D多目标追踪>介绍了3D多目标追踪,多目标追踪里使用的传感器数据为激光雷达Lidar检测到的数据,本文就介绍如何基于激光雷达点云数据进行3D ...

  7. 基于深度学习的2D图像目标检测

    参见第一部分网址1,第二部分网址2 目前学术和工业界出现的目标检测算法分成3类:(参见一文读懂目标检测:R-CNN.Fast R-CNN.Faster R-CNN.YOLO.SSD) 1. 传统的目标 ...

  8. 3D-VID:基于LiDar Video信息的3D目标检测框架|CVPR20

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 Brief paper地址:https://arxiv.org/pdf/2004.01389.pdf ...

  9. 基于轻量级卷积网络的小目标检测--轻量级骨干网络部分

    基于thundernet框架+dlanet网络+shufflenetv2卷积模块的小目标检测--轻量级骨干网络 前言 1 骨干网络框架DSNet(dlanet网络+shufflenetv2) 1.1 ...

最新文章

  1. GCC 连接器、链接标准库 gcc -l、链接手动创建库(指定目录的库 gcc -L)
  2. 正则表达式模式修正符
  3. 非著名架构师告诉你,代码该如何写,才能自己写的容易别人看的也不痛苦
  4. python爬取下拉列表数据_Python怎么爬取下拉式的网页?
  5. XamarinAndroid组件教程设置动画的时长参数
  6. typedef BOOL(WINAPI *MYFUNC) (HWND,COLORREF,BYTE,DWORD);语句的理解
  7. lambda也是python_Python lambda介绍
  8. 使用OC进行iOS截屏,同时保证清晰度
  9. jedis mysql 数据结构_Redis的数据结构和内部编码
  10. PHP开发中涉及到emoji表情的几种处理方法
  11. 大前端时代下,如何成为一名优秀的程序员?
  12. 如何高效运作机器学习团队(机器学习入门第四篇)
  13. win10系统的快捷键
  14. shell编程之正则表达式与文本工具
  15. Atitit 软件运行环境平台的变迁 attilax大总结 1.1.Native os时代 1.2.Vm时代 java net php 1.3.Script时代 js node。js 1.4.B
  16. c语言中逻辑运算符中感叹号,某棋牌 -官网
  17. 再谈“学微积,用手机”
  18. 一篇文章搞懂BIM技术的要点和前景
  19. 如何使用Flutter开发web应用
  20. 独孤求败--之--InnoDB、MyISAM索引实现过程

热门文章

  1. jQuery.width()和jQuery.css('width')的区别
  2. linux下rpm,yum学习
  3. LINUX TOP,不是这样玩地!!!
  4. SilverlightMMORPG窝窝世界明天4月28日封测
  5. linux软件安装不完全傻瓜手册
  6. 丢掉虚拟机,在裸机上使用 Kubernetes 六大优势!
  7. 这本书,让我秒懂了微服务架构
  8. 那个专攻JVM的00后求职者,薪水比我的还高···
  9. 从数仓到数据中台,谈技术选型最优解
  10. 为什么分布式一定要有消息队列?