名字:Neighbor-Vote: Improving Monocular 3D Object Detection through Neighbor Distance Voting

链接:https://arxiv.org/pdf/2107.02493.pdf

摘要:随着摄像头在自动驾驶等新的应用领域的应用越来越广泛,对单目图像进行3D目标检测成为视觉场景理解的重要任务。单目3D目标检测的最新进展很多依赖于伪点云生成,即进行单目深度估计,将二维像素点提升为伪三维点。然而,单目图像的深度估计精度不高,必然会导致伪点云在目标内的位置发生偏移。因此,预测的边框可能存在不准确的位置和形状变形。在本文中,本文提出了一种新颖的邻居投票方法,该邻居预测有助于从严重变形的伪点云的改善目标检测。具体而言,每个特征点形成他们自己的预测,然后通过投票来构建“共识”。通过这种方式,本文可以有效地将邻居的预测与局部预测的预测相结合,实现更准确的3D检测。为了进一步放大ROI伪点和背景点之间的区别,本文还将2D前景像素点的ROI预测分数编码到相应的伪3D点上。本文在KITTI基准测试上验证本文提出的方法,在验证集上的鸟瞰检测结果优于目前的SOTA,特别是对于“困难”水平检测。

1.引言

3D目标检测是依赖于理解3D世界中的上下文的应用(例如自主驾驶)中最重要的任务之一。目前已出现很多基于点云的3D目标检测算法。尽管这些方法取得了优异的性能,然而,激光雷达仍然太昂贵,不能装备在每一辆车上。因此,廉价的替代品更受

Neighbor-Vote:使用邻近距离投票优化单目3D目标检测(ACM MM2021)相关推荐

  1. DD3D:基于预训练的单目3D目标检测

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 来源丨CV研习社 作者丨元气满满的打工人 文章导读 导读:3D目标检测的主要应用场景就是自动驾驶,虽然 ...

  2. 【单目3D目标检测】MonoDLE论文精读与代码解析

    文章目录 Preface Abstract Contributions Diagnostic Experiments Pipeline Revisiting Center Detection Trai ...

  3. 浅述单目3D目标检测

    作者丨慕弋云子@知乎 来源丨https://zhuanlan.zhihu.com/p/432135656 编辑丨3D视觉工坊 三维目标检测是一个相对上游.比较基础却又新兴的任务领域.得益于自动驾驶和2 ...

  4. 【单目3D目标检测】项目实战-道路车辆/行人3D目标检测

    [单目3D目标检测]项目实战-道路车辆/行人3D目标检测 任务定义 传统激光雷达3D检测模型 VS 单目3D检测模型 单目3D目标检测优点 单目3D目标检测难点 数据集 KITTI数据集标注及网络输出 ...

  5. MonoCon:使用辅助学习的单目3D目标检测框架(AAAI 2022)

    作者丨慕弋云子@知乎 来源丨https://zhuanlan.zhihu.com/p/455897310 编辑丨3D视觉工坊 本文已被收录在单目3D目标检测的综述文章中.如果你对单目3D目标检测的相关 ...

  6. ICCV2021|单目3D目标检测真的需要伪激光雷达吗?

    作者丨agent@知乎 来源丨https://zhuanlan.zhihu.com/p/406918022 编辑丨3D视觉工坊 Paper: arxiv.org/pdf/2108.0641 Code: ...

  7. 【单目3D目标检测】MonoFlex论文精读与代码解析

    文章目录 Preface Abstract Contributions Pipeline Problem Definition Decoupled Representations of Objects ...

  8. 登顶KITTI!Mix-Teaching:适用于单目3D目标检测的半监督方法【清华大学】

    点击上方"3D视觉工坊",选择"星标" 干货第一时间送达 作者丨汽车人 来源丨自动驾驶之心 论文标题:Mix-Teaching: A Simple, Unifi ...

  9. 【单目3D目标检测】FCOS3D + PGD论文解析与代码复现

    文章目录 前言 FCOS3D 概述 主要创新点 主要框架结构 回归目标 损失函数 推理过程 2D引导的多层3D预测 2D高斯分布的3D中心度 实验设置 源码复现 PGD 概述 主要创新点 深度估计 主 ...

最新文章

  1. Python:UTF-8编码转换成GBK编码
  2. python pandas筛选数据_Python pandas从字符串列的数据选择中筛选出nan
  3. VTK修炼之道11:基本数据结构_数据对象数据集
  4. format 转化时间格式不起作用
  5. 语音怎么进入滤波器matlab,基于Matlab的语音信号滤波器的设计与实现
  6. ASP.NET 打包多CSS或JS文件以加快页面加载速度的Handler
  7. java ora-12505_Oracle SQL Developer连接报错(ORA-12505)的解决方案(两种)
  8. Python数据分析:pandas玩转Excel(二)
  9. 项目管理:研发项目经理为何难做
  10. STM32 硬件IIC 锁死及复位问题
  11. C盘空间莫名丢失20G?
  12. 基于JAVA小区生活服务平台的设计与实现计算机毕业设计源码+系统+lw文档+部署
  13. 云:SD-WAN不断增长的驱动力
  14. phpstorm主题下载地址及安装
  15. div html 下边加横线_css字体下边横线 html超链接更改颜色和去掉下划线
  16. XCODE4.2 模拟器定位
  17. 【转】一个老程序员的心理话
  18. Access和VBA
  19. 在网页中调用摄像头实现拍照上传 - 高拍仪二次开发
  20. 魔兽8.0最新服务器人口普查,人口普查#8:血精灵增长第一 魔兽进入平缓期

热门文章

  1. 公众号群发文章支持添加小程序
  2. Spring中ThreadPoolTaskExecutor的线程调度及问题
  3. Angular2:从AngularJS 1.x 中学到的经验
  4. 正确配置Linux系统ulimit值的方法【转】
  5. 利用OnAnimatorove函数控制人物的移动
  6. ***产业链 安全新忧患
  7. 安全获取QueryString的值类库下载
  8. 京东物流基于Doris的亿级数据自助探索应用
  9. 为了追求更快,CPU、内存、I/O都做了哪些努力?
  10. 为什么不建议把数据库部署在Docker容器内