EPro-PnP: Generalized End-to-End Probabilistic Perspective-n-Points for Monocular Object Pose Estimation

CODE: tjiiv-cprg/EPro-PnP

参考解读:同济、阿里的CVPR 2022最佳学生论文奖

Author From

Abstract

【将不可导的最优位姿替换为了可导的概率密度】

通过PnP从单张RGB图像中定位3D目标是计算机视觉中长期存在的问题。受端到端深度学习的启发,近期的一些研究建议将PnP为解释为可微层,这样二维到三维点的对应关系就可以通过对物体位姿的梯度反向传播来部分学习。现有方法中,基于 PnP 几何优化的位姿估计方法往往通过深度网络提取 2D-3D 关联点,然而因为位姿最优解在反向传播时存在不可导的问题,难以实现以位姿误差作为损失对网络进行稳定的端到端训练,此时 2D-3D 关联点依赖其他代理损失的监督,这对于位姿估计而言不是最佳的训练目标。本文提出了EPro-PnP,一个用于 一般端到端位姿估计 的概率PnP层,它输出一个SE(3)流形上的位姿分布,基本把分类SoftMax代入了连续域。2D-3D坐标及相关权重作为中间变量,通过最小化预测和目标位姿分布的KL散度来学习。其基本原理统一了现有的方法,类似于注意力机制。EPro-PnP明显优于其他baseline,缩小了在LineMOD 6DoF位姿估计和nuScenes 3D目标检测基准方面基于PnP的方法和特定任务指向之间的鸿沟。

【论文笔记】EPro-PnP == Tongji U Alibaba DAMO ==CVPR‘2022 Best Student Paper相关推荐

  1. 论文笔记:Meta-attention for ViT-backed Continual Learning CVPR 2022

    论文笔记:Meta-attention for ViT-backed Continual Learning CVPR 2022 论文介绍 论文地址以及参考资料 Transformer 回顾 Self- ...

  2. 何恺明时隔2年再发一作论文:为视觉大模型开路,“CVPR 2022最佳论文候选预定”...

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 杨净 明敏 雷刚 发自 凹非寺 量子位 报道 | 公众号 QbitA ...

  3. 论文笔记:Densely Connected Convolutional Networks (2017 CVPR)

    [引用格式]:G. Huang, Z. Liu, L. Van Der Maaten and K. Q. Weinberger, "Densely Connected Convolution ...

  4. CVPR 2022 结果出炉,最全论文下载及分类汇总(更新中)

    CVPR 2022 已经放榜啦,本次一共有2067篇论文被接收,接收论文数量相比去年增长了24%. 由于每年的 CVPR 全部论文以及相关细节公布都需要等到六月会议正式召开,因此,在这之前,为了让大家 ...

  5. ORB-SLAM3 论文笔记

    ORB-SLAM3 论文笔记 这篇博客 ORB-SLAM3系统 相机模型的抽象(Camera Model) 重定位的问题 图片矫正的问题 视觉惯性SLAM的工作原理 相关公式 IMU初始化 跟踪和建图 ...

  6. 论文笔记(一):se(3)-TrackNet: Data-driven 6D Pose Tracking by ...... in Synthetic Domains

    se(3)- TrackNet:Data-driven 6D Pose Tracking by Calibrating Image Residuals in Synthetic Domains 文章概 ...

  7. CubeSLAM: Monocular 3D Object SLAM 论文笔记

    CubeSLAM: Monocular 3D Object SLAM 论文笔记 摘要 提出了一种静态和动态环境下单幅图像3D长方体目标检测和多视点目标SLAM的方法,并证明了这两个部分是相互促进的. ...

  8. 【时序】应用于时间序列的 Transformer 综述论文笔记

    论文名称:Transformers in Time Series: A Survey 论文下载:https://arxiv.org/abs/2202.07125 论文源码:https://github ...

  9. 【论文笔记】 LSTM-BASED DEEP LEARNING MODELS FOR NONFACTOID ANSWER SELECTION

    一.简介 这篇论文由IBM Watson发表在2016 ICLR,目前引用量92.这篇论文的研究主题是answer selection,作者在这篇论文基础上[Applying Deep Learnin ...

最新文章

  1. YOLOv3模型剪枝,瘦身80%,提速100%,精度基本不变
  2. Biopython-Chapter3.生物序列对象
  3. logistic回归和最大熵
  4. golang中的可见性
  5. SAP Spartacus organization unit list的实现Component
  6. [Cnoi2019]须臾幻境(LCT维护最大生成树+主席树/分块)
  7. 打包windows 和 linux caffe 版本的人脸识别 人脸年龄估计 人脸性别模型的总结
  8. 201521123106《java程序设计》第三周学习总结
  9. 第17讲 | 去中心化与区块链交易性能
  10. linux回到上次目录与历史命令查找快捷方式
  11. 【机械仿真】基于matlab GUI凸轮设计与仿真【含Matlab源码 153期】
  12. Ubuntu下使用Monaco字体
  13. GitHub 近两万 Star,无需编码,可一键生成前后端代码
  14. Linux面试题史上最全总结
  15. 计算机专业博士阶段研究方向,国内计算机专业博士研究方向
  16. 中国电信无线网服务器,如何使用路由器共享电信天翼无线网络?
  17. 如何分辨iphone 的冷屏与暖屏
  18. 如果忘记了 iPhone 密码
  19. 区块链的大问题有救了!
  20. Hadoop Yarn ResourceManager启动失败

热门文章

  1. 经济学人:人工智能正颠覆传统战争,一场新军备竞赛或将开启
  2. 俄罗斯鲍曼的计算机什么水平,俄罗斯莫斯科鲍曼国立技术大学专家建议在近地轨道上放置一台27吨重的超级计算机...
  3. Genymotion破解版AMD显卡,虚拟机安装
  4. matlab中fsolve初值,求助一个新手简答问题 关于FSOLVE
  5. 数的机器码表示(原码,反码,补码,移码)
  6. 凸优化笔记(1) —— 基本概念
  7. axure命令行_如何快速学习Axure工具?
  8. 学习英文和英语听力的网址
  9. xml python2.6_Python2.6 XML解析器断言
  10. emqx开启自定义权限认证