性能SOTA，国防科技大学单张RGB-D图像预测物体对称性

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

本文转自|计算机视觉联盟

在这篇论文中，来自国防科技大学和普林斯顿大学的研究者提出了一种面向单张 RGB-D 图像的对称检测网络 SymmetryNet。实验结果表明，该检测网络显著优于其它已有方法，性能达到了 SOTA，尤其是在没有训练过的物体上优势明显。此外，SymmetryNet 能够准确地检测出多种不同物体的对称性，包括被遮挡的物体、包含多个对称面的物体等。

作为大多数物体的基本几何属性，对称性广泛存在于我们的生活中。理解物体的对称性是计算机理解真实世界以及机器人智能交互中的重要问题。因此，对称性检测在图像分割、物体检测以及机械臂抓取等任务中有着广泛的应用前景。

三维物体对称性检测是经典的几何问题，由于对称性具有明确的数学定义（即物体在进行对称变换后具有几何不变性），传统的三维对称检测方法往往首先检测对称对应点（symmetric counterpart），再通过聚类或投票算法得到物体的对称面 / 轴。但是，这类算法的使用范围通常仅限于几何完整的合成三维模型或者高质量的重建三维模型，无法处理物体观测缺失的情况，例如无法通过单张 RGB-D 图像判断物体的对称性。

近日，国防科技大学和普林斯顿大学的研究者提出面向单张 RGB-D 图像的对称检测网络 SymmetryNet，相关论文被 ACM Transactions on Graphics (SIGGRAPH Asia 2020) 收录。

论文链接：https://arxiv.org/abs/2008.00485
数据和代码链接：https://github.com/GodZarathustra/SymmetryNet

方法

不同于从观测数据中检测对称对应点的传统方法，SymmetryNet 从大量数据中学习总结物体对称性出现的规律，进而通过 RGB-D 图像直接预测物体的对称性。

图 1：SymmetryNet：输入 RGB-D 图像，输出物体对称面 / 轴。

其核心思想是在检测物体对称面 / 轴的同时预测输入点云的对称对应点，这样做的好处是能够提高对称检测的精度和泛化能力。SymmetryNet 能够检测物体的反射对称（reflectional symmetry）和旋转对称（rotational symmetry），并且能够自动判断物体对称面 / 轴的数量，实现动态多输出。

图 2：SymmetryNet 网络结构。

SymmetryNet 包括特征提取和对称性预测两个模块。RGB 图和点云首先分别经过一个卷积神经网络和点云处理网络，得到逐点特征，逐点特征随后通过 weighted average pooling 层计算得到全局特征。逐点特征和全局特征拼接之后被用来预测物体对称面 / 轴。

SymmetryNet 的创新点之一是将物体对称面 / 轴的预测和对称对应点预测结合起来，对这两个相互关联的任务同时训练，从而提升对称检测的精度和泛化能力。如下图 3 所示，对于当前点 P_i，网络不仅预测物体的对称面 / 轴参数 O_i 和 n_i，同时还预测点 P_i 的对称对应点。其中，反射对称物体的对称对应点为 Q_i，旋转对称物体的对称对应点则为一个围绕对称轴的圆环。

此外，为了处理具有多个对称面 / 轴的物体，SymmetryNet 每次输出多个对称面 / 轴，再利用分类器判断输出每一个输出的有效性。对于含有多个对称面 / 轴的物体，SymmetryNet 通过求解 optimal assignment 优化方程计算预测对称面 / 轴与真值的匹配关系，进而计算 loss 并进行回传。

图 3：SymmetryNet 同时预测对称面 / 轴（蓝色部分）以及对称对应点（橙色部分）。

实验

为了验证算法有效性，SymmetryNet 在多个数据集上进行了实验测试，实验选用 PR 曲线作为评价标准。其中，ShapeNet 数据集上的定量实验结果如下图 4 所示。从图中可以看出，SymmetryNet 显著优于其它已有方法，性能达到了 state-of-the-art，尤其是在没有训练过的物体（Holdout category）上优势明显。

图 4：SymmetryNet 在 ShapeNet 数据集上的测试结果。

下图 5 展示了若干个对称性检测结果，可以看出 SymmetryNet 能够准确地检测出多种不同物体的对称性，包括被遮挡的物体、包含多个对称面的物体等。

图 5：SymmetryNet 对称性检测结果。

对称性是连接几何和语义的桥廊，理解分析物体对称性是计算机感知真实世界的重要方式。因此，对称检测可以为计算机视觉、机器人学中的多种任务提供理论和信息支持，具有十分广阔的应用前景。将图像分割、形状补全、位姿估计、机器人抓取等任务与对称检测结合，有望实现精度更高并且更加鲁棒的算法。

此外，研究实现高效的对称数据标注方法，或者实现对称检测网络的自监督训练，对于该研究方向同样具有重要意义。

end

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

性能SOTA，国防科技大学单张RGB-D图像预测物体对称性相关推荐

性能SOTA、适用多种类型物体，国防科技大学单张RGB-D图像预测物体对称性
点击上方"3D视觉工坊",选择"星标" 来源:机器之心在这篇论文中,来自国防科技大学和普林斯顿大学的研究者提出了一种面向单张 RGB-D 图像的对称检测网络 ...
MoCo不适用于目标检测？MSRA提出对象级对比学习的目标检测预训练方法SoCo！性能SOTA！（NeurIPS 2021）...
关注公众号,发现CV技术之美本文分享 NeurIPS 2021 论文『Aligning Pretraining for Detection via Object-Level Contrastive ...
WE WANT U ┃中天微国防科技大学2017届硕士专场校园宣讲会
我们是谁?我们是阿里巴巴集团旗下重要核心战略合作伙伴,成立于2001年,来自素有"天堂硅谷"之称的杭州西湖区高新技术重点企业. 我们做什么?我们是当前在中国唯一拥有自主指令集系统与 ...
国防科技大学发布最新「3D点云深度学习」综述论文
点击上方"深度学习技术前沿",选择"星标"公众号资源干货,第一时间送达 3D点云学习( Point Clouds)作为近年来的研究热点之一,受到了广泛关注,每 ...
SimVLM：拒绝各种花里胡哨！CMUGoogle提出弱监督极简VLP模型，在多个多模态任务上性能SOTA...
关注公众号,发现CV技术之美本文介绍论文『SimVLM: Simple Visual Language Model Pretraining with Weak Supervision』,由 CMU& ...
ACMMM 2021《LSG》性能SOTA！用GNN和GAN的方式来强化Video Captioning的学习！
关注公众号,发现CV技术之美本文分享一篇 ACMMM 2021论文『Discriminative Latent Semantic Graph for Video Captioning』,性能SOTA ...
综述 | 国防科技大学发布最新「3D点云深度学习」综述论文
点上方蓝字计算机视觉联盟获取更多干货在右上方 ··· 设为星标 ★,与你不见不散编辑:Sophia 计算机视觉联盟报道 | 公众号 CVLianMeng 转载于 :专知 [人工智能资源(书籍 ...
国科大港中文提出带视觉语言验证和迭代推理的Visual Grounding框架，性能SOTA，代码已开源！（CVPR2022）...
关注公众号,发现CV技术之美本文分享 CVPR 2022 的一篇论文『Improving features Visual Grounding with Visual-Linguistic Veriﬁ ...
17届技术报告|国防科技大学-多车一师
学校:国防科技大学队伍名称:多车一师参赛队员:代宇翔,余皇志,杜肖,权与时,尚靖卓带队教师:李健,范一鸣 01 ...

性能SOTA，国防科技大学单张RGB-D图像预测物体对称性

性能SOTA，国防科技大学单张RGB-D图像预测物体对称性相关推荐

最新文章

热门文章