点击上方“小白学视觉”,选择加"星标"或“置顶

重磅干货,第一时间送达

本文转自|计算机视觉联盟

在这篇论文中,来自国防科技大学和普林斯顿大学的研究者提出了一种面向单张 RGB-D 图像的对称检测网络 SymmetryNet。实验结果表明,该检测网络显著优于其它已有方法,性能达到了 SOTA,尤其是在没有训练过的物体上优势明显。此外,SymmetryNet 能够准确地检测出多种不同物体的对称性,包括被遮挡的物体、包含多个对称面的物体等。

作为大多数物体的基本几何属性,对称性广泛存在于我们的生活中。理解物体的对称性是计算机理解真实世界以及机器人智能交互中的重要问题。因此,对称性检测在图像分割、物体检测以及机械臂抓取等任务中有着广泛的应用前景。

三维物体对称性检测是经典的几何问题,由于对称性具有明确的数学定义(即物体在进行对称变换后具有几何不变性),传统的三维对称检测方法往往首先检测对称对应点(symmetric counterpart),再通过聚类或投票算法得到物体的对称面 / 轴。但是,这类算法的使用范围通常仅限于几何完整的合成三维模型或者高质量的重建三维模型,无法处理物体观测缺失的情况,例如无法通过单张 RGB-D 图像判断物体的对称性。

近日,国防科技大学和普林斯顿大学的研究者提出面向单张 RGB-D 图像的对称检测网络 SymmetryNet,相关论文被 ACM Transactions on Graphics (SIGGRAPH Asia 2020) 收录。

  • 论文链接:https://arxiv.org/abs/2008.00485

  • 数据和代码链接:https://github.com/GodZarathustra/SymmetryNet

方法

不同于从观测数据中检测对称对应点的传统方法,SymmetryNet 从大量数据中学习总结物体对称性出现的规律,进而通过 RGB-D 图像直接预测物体的对称性。

图 1:SymmetryNet:输入 RGB-D 图像,输出物体对称面 / 轴。

其核心思想是在检测物体对称面 / 轴的同时预测输入点云的对称对应点,这样做的好处是能够提高对称检测的精度和泛化能力。SymmetryNet 能够检测物体的反射对称(reflectional symmetry)和旋转对称(rotational symmetry),并且能够自动判断物体对称面 / 轴的数量,实现动态多输出。

图 2:SymmetryNet 网络结构。

SymmetryNet 包括特征提取和对称性预测两个模块。RGB 图和点云首先分别经过一个卷积神经网络和点云处理网络,得到逐点特征,逐点特征随后通过 weighted average pooling 层计算得到全局特征。逐点特征和全局特征拼接之后被用来预测物体对称面 / 轴。

SymmetryNet 的创新点之一是将物体对称面 / 轴的预测和对称对应点预测结合起来,对这两个相互关联的任务同时训练,从而提升对称检测的精度和泛化能力。如下图 3 所示,对于当前点 P_i,网络不仅预测物体的对称面 / 轴参数 O_i 和 n_i,同时还预测点 P_i 的对称对应点。其中,反射对称物体的对称对应点为 Q_i,旋转对称物体的对称对应点则为一个围绕对称轴的圆环。

此外,为了处理具有多个对称面 / 轴的物体,SymmetryNet 每次输出多个对称面 / 轴,再利用分类器判断输出每一个输出的有效性。对于含有多个对称面 / 轴的物体,SymmetryNet 通过求解 optimal assignment 优化方程计算预测对称面 / 轴与真值的匹配关系,进而计算 loss 并进行回传。

图 3:SymmetryNet 同时预测对称面 / 轴(蓝色部分)以及对称对应点(橙色部分)。

实验

为了验证算法有效性,SymmetryNet 在多个数据集上进行了实验测试,实验选用 PR 曲线作为评价标准。其中,ShapeNet 数据集上的定量实验结果如下图 4 所示。从图中可以看出,SymmetryNet 显著优于其它已有方法,性能达到了 state-of-the-art,尤其是在没有训练过的物体(Holdout category)上优势明显。

图 4:SymmetryNet 在 ShapeNet 数据集上的测试结果。

下图 5 展示了若干个对称性检测结果,可以看出 SymmetryNet 能够准确地检测出多种不同物体的对称性,包括被遮挡的物体、包含多个对称面的物体等。

图 5:SymmetryNet 对称性检测结果。

对称性是连接几何和语义的桥廊,理解分析物体对称性是计算机感知真实世界的重要方式。因此,对称检测可以为计算机视觉、机器人学中的多种任务提供理论和信息支持,具有十分广阔的应用前景。将图像分割、形状补全、位姿估计、机器人抓取等任务与对称检测结合,有望实现精度更高并且更加鲁棒的算法。

此外,研究实现高效的对称数据标注方法,或者实现对称检测网络的自监督训练,对于该研究方向同样具有重要意义。

end

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2:Python视觉实战项目52讲

在「小白学视觉」公众号后台回复:Python视觉实战项目即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。

下载3:OpenCV实战项目20讲

在「小白学视觉」公众号后台回复:OpenCV实战项目20讲即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~

性能SOTA,国防科技大学单张RGB-D图像预测物体对称性相关推荐

  1. 性能SOTA、适用多种类型物体,国防科技大学单张RGB-D图像预测物体对称性

    点击上方"3D视觉工坊",选择"星标" 来源:机器之心 在这篇论文中,来自国防科技大学和普林斯顿大学的研究者提出了一种面向单张 RGB-D 图像的对称检测网络 ...

  2. MoCo不适用于目标检测?MSRA提出对象级对比学习的目标检测预训练方法SoCo!性能SOTA!(NeurIPS 2021)...

    关注公众号,发现CV技术之美 本文分享 NeurIPS 2021 论文『Aligning Pretraining for Detection via Object-Level Contrastive ...

  3. WE WANT U ┃中天微 国防科技大学2017届硕士专场校园宣讲会

    我们是谁?我们是阿里巴巴集团旗下重要核心战略合作伙伴,成立于2001年,来自素有"天堂硅谷"之称的杭州西湖区高新技术重点企业. 我们做什么?我们是当前在中国唯一拥有自主指令集系统与 ...

  4. 国防科技大学发布最新「3D点云深度学习」综述论文

    点击上方"深度学习技术前沿",选择"星标"公众号 资源干货,第一时间送达 3D点云学习( Point Clouds)作为近年来的研究热点之一,受到了广泛关注,每 ...

  5. SimVLM:拒绝各种花里胡哨!CMUGoogle提出弱监督极简VLP模型,在多个多模态任务上性能SOTA...

    关注公众号,发现CV技术之美 本文介绍论文『SimVLM: Simple Visual Language Model Pretraining with Weak Supervision』,由 CMU& ...

  6. ACMMM 2021《LSG》性能SOTA!用GNN和GAN的方式来强化Video Captioning的学习!

    关注公众号,发现CV技术之美 本文分享一篇 ACMMM 2021论文『Discriminative Latent Semantic Graph for Video Captioning』,性能SOTA ...

  7. 综述 | 国防科技大学发布最新「3D点云深度学习」综述论文

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :专知 [人工智能资源(书籍 ...

  8. 国科大港中文提出带视觉语言验证和迭代推理的Visual Grounding框架,性能SOTA,代码已开源!(CVPR2022)...

    关注公众号,发现CV技术之美 本文分享 CVPR 2022 的一篇论文『Improving features Visual Grounding with Visual-Linguistic Verifi ...

  9. 17届技术报告|国防科技大学-多车一师

    学 校:国防科技大学                队伍名称:多车一师               参赛队员:代宇翔,余皇志,杜肖,权与时,尚靖卓 带队教师:李健,范一鸣             01 ...

最新文章

  1. iOS下JS与OC互相调用(一)--UIWebView 拦截URL
  2. 【廖雪峰python进阶笔记】面向对象编程
  3. 基于链表实现队列(基于Java实现)
  4. 软件开发和产品经理到底是怎么回事
  5. openJDK之lambda——List的forEach如何实现的
  6. 洛谷 P1708 天然气井 题解
  7. 汇编解析(2)-内存寻址之实模型平面模式(real mode flat mode)(2)
  8. c语言中左右对齐的作用,c语言中右对齐的符号
  9. 【bzoj2521】[Shoi2010]最小生成树 网络流最小割
  10. 求最高、最低、平均分
  11. springMVC 相对于 Structs 的优势
  12. 苹果iPod设计及商业操作内幕
  13. adobe官方卸载工具:Creative Cloud Cleaner Tool Mac版
  14. 自平衡小车的原理和硬件设计
  15. jupyter notebook报错500 : Internal Server Error
  16. JVM-Cpu飙升排查及解决
  17. 详解VB对话框InputBox和MsgBox
  18. 「硬见小百科」电子器件封装缺陷和失效的形式
  19. 2019年河南省ACM大学生程序设计竞赛原题
  20. 计算机网络-9-局域网交换与VLAN

热门文章

  1. 大战三回合:XGBoost、LightGBM和Catboost一决高低 | 程序员硬核算法评测
  2. 高效读CV论文法则:先在GitHub上立Flag!| 资源
  3. 朴素贝叶斯分类器详解及中文文本舆情分析(附代码实践)
  4. 【活动】人工智能产学研生态建设研讨会报名
  5. AI一分钟 | 刚爆Python将进入高考,AI就已强势进入公务员国考试卷;报告称1/4男性更喜欢跟机器人谈恋爱,真的吗?
  6. 新手科普 | 探索机器学习模型,保障账户安全
  7. 注解+反射优雅的实现Excel导入导出(通用版)
  8. 面试官: 讲讲 Spring 事务有哪些坑?
  9. 四图,读懂 BIO、NIO、AIO、多路复用 IO 的区别
  10. SpringBoot+JWT+Shiro+MybatisPlus实现Restful快速开发后端脚手架