转载请注明作者和出处: http://blog.csdn.net/john_bh/

paper 地址:SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation
作者及团队: 季向阳 团队 & 清华大学 & 慕尼黑工业大学 & 谷歌
会议及时间:ICCV 2021
code:https://github.com/shangbuhuan13/SO-Pose

文章目录

  • 1. 主要贡献
  • 2. Related Works
  • 3. Methodology
    • 3.1. Selfocclusion for Robust Pose Estimation
    • 3.2. Crosslayer Consistency
    • 3.3. Overall Objective
  • 4. Evaluation
    • 4.1 Training Details
    • 4.2 Result
    • 4.3 Ablation Study
  • 5. Conclusion

1. 主要贡献

相比two-stage 方法,end-to-end 方法在预测效果上仍有一些差距,作者深入研究发现:当网络逼近最优时,由于无纹理物体表面固有的匹配模糊性,不可避免地会出现由噪声引起的错配误差,往往导致一个对应域对应多个拟合误差相似的6D位姿。 这导致训练过程收敛到次最优,阻碍了总体6D姿态估计性能。 由于消除噪声引起的误差不是一件简单的事情,解决这个问题的另一种解决方案是用更精确的三维物体表示代替对应场,从而减少噪声的影响。
受三维重建 [“3d scene reconstruction with multi-layer depth and epipolar transformers”–ICCV 2019] 中使用的多层模型的启发,专注于self-occlusion信息,以建立一个以观察者为中心的物体姿态的两层表示。

  • 第一层保留目标上可见点及其投影的对应场;
  • 第二层包含 self-occlution 信息。本质上,作者并没有直接识别每个 visible point 是否以及在哪里遮挡了物体,而是通过检查每个像素和物体坐标平面之间的 self-occlusion 来简化过程。

创新点以及主要贡献:

  1. 提出 SO-Pose,从3D object 的two-layer 表示中直接回归 6DoF pose;
  2. 利用self-occlution 和 2D-3D对应关系来为3D空间中的每个对象建立一个两层表示,可以用来加强两个跨层的一致性,可以进一步提高准确性和鲁棒性;
  3. SO-Pose在各种具有挑战性的数据集上始终超越所有其他end-to-end 方法。此外, SO-Pose与其他sota的两阶段方法相比,也可以达到相当的精度,同时速度更快。

2. Related Works

3. Methodology


大多数基于CNN方法的6DoF 方法只关注物体可见部分,忽略了遮挡部分的信息。因此,单层表示法不能完全准确地编码物体的几何特征,不能够准确的估计物体6D位姿。 SO-Pose方法,如图2 (d)和(e),将自遮挡与估计的2D-3D对应相结合,建立一种新的两层表示,用于描述三维空间中物体的姿态。

3.1. Selfocclusion for Robust Pose Estimation

想象一条光线从相机中心发出并穿过物体。这条射线与物体表面相交于多个不同的点,其中第一个点是可见的,而其他的都是自遮挡的。与[34]记录自遮挡点的坐标不同,作者记录的是每条射线与物体坐标平面之间的交点坐标。如图3所示,射线 OPOPOP 与物体坐标系 o−yz,o−xz,o−xyo-yz,o-xz,o-xyo−yz,o−xz,o−xy 的交点是 Qx,Qy,QzQ_x,Q_y,Q_zQx​,Qy​,Qz​。
对于单个物体,合并P,Q={Qx,Qy,Qz}P,Q=\{Q_x,Q_y,Q_z\}P,Q={Qx​,Qy​,Qz​} 到 two-layer model :

其中 VVV 表示当前视图 w.r.t.w.r.t.w.r.t.摄像机坐标系下的可见点。注意,QQQ 可以从PPP 的解析推导出来,已知旋转 RRR 和平移 ttt。将 PPP 投影到二维图像平面上,得到:

其中KKK 表示相机内参数矩阵,P=[XP,YP,ZP]TP=[X_P,Y_P,Z_P]^TP=[XP​,YP​,ZP​]T 表示可见的3D 点,相机坐标系下物体坐标平面表示为(有点没太明白):


其中 XXX 表示对应如下坐标平面上的3D 点:

从以上信息可以导出 QxQ_{x}Qx​,它位于射线 OPOPOP 和 平面 o−yzo-yzo−yz 的交点处:

同理,带入 ny,nzn_y, n_zny​,nz​ 可以得到 Qy,QzQ_y,Q_zQy​,Qz​。

由于PPP和QQQ是用摄像机坐标系表示的,它们对应的物体坐标系是用摄像机坐标系表示的:P0=RTP−RTt,Q0=RTQ−RTtP_0=R^{T} P - R^{T}t, Q_0=R^TQ-R^TtP0​=RTP−RTt,Q0​=RTQ−RTt。

为了优化的稳定定,P0,Q0P_0,Q_0P0​,Q0​ 是根据物体直径做了标准化处理。
值得注意的是,当光线通过摄像机中心 OOO 和一个可见点 PPP 时,可能会平行于物体的一个坐标平面,因此光线可能永远不会与这个平面相交。因此,为了规避这些情况并增强鲁棒性只考虑物体的最小边界长方体内的交点,如3所示。

3.2. Crosslayer Consistency


3.3. Overall Objective



4. Evaluation

4.1 Training Details

  1. Data
    LM,LMO,YCB-V
  2. Metrics
    ADD-S,BOP metrics

4.2 Result


在(d)钻机中,我们证明了由于强遮挡导致6D位姿预测错误。



  • Runtime Analysis
    在 Inter 3.30GHz CPU 和 TITAN X (12G) GPU的机器上,输入 640∗480640*480640∗480 图像是,处理当个物体大概需要30ms,处理整张图像需要50 ms,其中包括使用 YOLO-v3 进行2D localization 的15ms。如图5所示,YCB-V上的Speed-AR评分图。该方法取得了第二好的效果(AR: 0.715),进一步验证了该方法在实际应用中的巨大潜力。
  • Qualitative evaluation
    在图6中,显示了SO-Pose 的模型预测的YCB-V对象的规范化两层表示。对于(a)表示物体,在(b)中展示了其2D-3D点匹配,在(d), (e)和(f)中展示了其self-occlusion坐标。©、(g)、(h),(i) 是 (b), (d), (e), (f) 的 corresponding error map。

4.3 Ablation Study

5. Conclusion

在本文中,作者提出了一种新的两层模型,该模型结合了2D-3D点对应和self-occlusion信息来明确地封装三维物体的空间线索。在此基础上作者提出了 SO-Pose,一个end-to-end 的 6DoF pose 直接回归算法框架,在数据集上相比效果有很大提升。实验评估也表明,两层模型适用于广泛的6D姿态估计框架,并能持续提高性能。未来,作者计划将两层模型集成到 self-supervised 6D姿态估计和 category-level 未见物体分析中。

SO-Pose: Exploiting Self-Occlusion for Direct 6D Pose Estimation相关推荐

  1. 6D Pose Estimation各方法对应的经典论文

    单目RGB.传统方法 (1) D. G. Lowe. Object recognition from local scale-invariant features. In ICCV, 1999. (2 ...

  2. T-LESS: An RGB-D Dataset for 6D Pose Estimation of Texture-less Objects

    T-LESS: An RGB-D Dataset for 6D Pose Estimation of Texture-less Objects 如有错误,欢迎指正 摘要 1 介绍 2. Related ...

  3. SSD-6D: Making RGB-Based 3D Detection and 6D Pose Estimation Great Again—2017(笔记)

    SSD-6D: Making RGB-Based 3D Detection and 6D Pose Estimation Great Again-2017(笔记) SSD-6D让RGB图像的3D检测和 ...

  4. se(3)-TrackNet: Data-driven 6D Pose Tracking by Calibrating Image Residuals in Synthetic Domains

    转载请注明作者和出处: http://blog.csdn.net/john_bh/ Arxiv 地址:se(3)-TrackNet: Data-driven 6D Pose Tracking by C ...

  5. 论文笔记(一):se(3)-TrackNet: Data-driven 6D Pose Tracking by ...... in Synthetic Domains

    se(3)- TrackNet:Data-driven 6D Pose Tracking by Calibrating Image Residuals in Synthetic Domains 文章概 ...

  6. [论文阅读:姿态识别Transformer] TFPose: Direct Human Pose Estimation with Transformers

    [论文阅读:姿态识别&Transformer] TFPose: Direct Human Pose Estimation with Transformers 文章目录 [论文阅读:姿态识别&a ...

  7. 亚马逊采摘挑战赛APC:6D姿态估计的多视图自我监督深度学习6D Pose Estimation in the Amazon Picking Challenge—2017(笔记)

    Multi-view Self-supervised Deep Learning for 6D Pose Estimation in the Amazon Picking Challenge-2017 ...

  8. CosyPose: Consistent multi-view multi-object 6D pose estimation

    CosyPose: Consistent multi-view multi-object 6D pose estimation 摘要 我们介绍一种用于恢复场景中多个已知对象的6D姿势的方法,该场景由一 ...

  9. 论文笔记(二十)VisuoTactile 6D Pose Estimation of an In-Hand Object using Vision and Tactile Sensor Data

    VisuoTactile 6D Pose Estimation of an In-Hand Object using Vision and Tactile Sensor Data 文章概括 摘要 1. ...

  10. 6D姿态估计从0单排——看论文的小鸡篇——Learning Analysis-by-Synthesis for 6D Pose Estimation in RGB-D Images...

    迎来了第一篇使用CNN对姿态进行估计的文章了,哭了. 这篇文章是基于2014_Learning 6D Object Pose Estimation using 3D Object Coordinate ...

最新文章

  1. SAP MM 史上最偷懒的盘点事务代码MI10
  2. 门当户对真的很重要吗?
  3. 基于MSP430F413水果电池供电的低功耗时钟
  4. IOS开发笔记 - 关于导航标题栏的颜色问题
  5. 10.docker build
  6. 假设法求最大值和数组的优点
  7. html mysql留言板_【网页留言板制作】HTML + CSS + PHP + MySQL 实战
  8. Vue开发实例(01)之环境搭建nodejs与运行第一个Vue项目
  9. pandavan路由器升级php到7,中兴E8820S改spi刷Pandavan固件作为有线路由
  10. 郎文词根mdx_欧陆词典导入mdx_欧路词典导入音频
  11. 2022-2028全球运维安全管理行业调研及趋势分析报告
  12. KEIL MDK平台 S3C2440 C语言软件仿真
  13. gitlab同步代码时https证书错误
  14. Python便捷写法:[[0] * n for _ in range(n)]
  15. 对使用字符指针变量和字符数组的讨论
  16. 阿里云服务器ECS-Apollo搭建MQTT服务器(Windows环境)
  17. 监控Kafka(kafka_exporter)
  18. 路由器和调制解调器的区别_如何重新启动路由器和调制解调器
  19. C语言 有a,b,c,d4个数,要求按从大到小的顺序输出。
  20. 网络营销不是收费删帖:为网络营销正本清源

热门文章

  1. while循环语法结构
  2. 计算机组成.就是它在运算.处理器CPU
  3. w ndows热键,Window 10 优雅的快捷键
  4. Python的faker模块使用
  5. 小新700换主板_算不算诚意之作?——联想小新700笔记本到手拆升级+换系统
  6. echarts 地图自定义图标_Echarts3.0 地图自定义图标
  7. 微信小程序新版本后用户昵称变成了“微信用户“解决方法
  8. PyramidNet
  9. 对261个国家地区快速查找选择
  10. codeforces Dima and Trap Graph