点击上方“3D视觉工坊”,选择“星标”

来源:机器之心

在这篇论文中,来自国防科技大学和普林斯顿大学的研究者提出了一种面向单张 RGB-D 图像的对称检测网络 SymmetryNet。实验结果表明,该检测网络显著优于其它已有方法,性能达到了 SOTA,尤其是在没有训练过的物体上优势明显。此外,SymmetryNet 能够准确地检测出多种不同物体的对称性,包括被遮挡的物体、包含多个对称面的物体等。

作为大多数物体的基本几何属性,对称性广泛存在于我们的生活中。理解物体的对称性是计算机理解真实世界以及机器人智能交互中的重要问题。因此,对称性检测在图像分割、物体检测以及机械臂抓取等任务中有着广泛的应用前景。

三维物体对称性检测是经典的几何问题,由于对称性具有明确的数学定义(即物体在进行对称变换后具有几何不变性),传统的三维对称检测方法往往首先检测对称对应点(symmetric counterpart),再通过聚类或投票算法得到物体的对称面 / 轴。但是,这类算法的使用范围通常仅限于几何完整的合成三维模型或者高质量的重建三维模型,无法处理物体观测缺失的情况,例如无法通过单张 RGB-D 图像判断物体的对称性。

近日,国防科技大学和普林斯顿大学的研究者提出面向单张 RGB-D 图像的对称检测网络 SymmetryNet,相关论文被 ACM Transactions on Graphics (SIGGRAPH Asia 2020) 收录。

  • 论文链接:https://arxiv.org/abs/2008.00485

  • 数据和代码链接:https://github.com/GodZarathustra/SymmetryNet

方法

不同于从观测数据中检测对称对应点的传统方法,SymmetryNet 从大量数据中学习总结物体对称性出现的规律,进而通过 RGB-D 图像直接预测物体的对称性。

图 1:SymmetryNet:输入 RGB-D 图像,输出物体对称面 / 轴。

其核心思想是在检测物体对称面 / 轴的同时预测输入点云的对称对应点,这样做的好处是能够提高对称检测的精度和泛化能力。SymmetryNet 能够检测物体的反射对称(reflectional symmetry)和旋转对称(rotational symmetry),并且能够自动判断物体对称面 / 轴的数量,实现动态多输出。

图 2:SymmetryNet 网络结构。

SymmetryNet 包括特征提取和对称性预测两个模块。RGB 图和点云首先分别经过一个卷积神经网络和点云处理网络,得到逐点特征,逐点特征随后通过 weighted average pooling 层计算得到全局特征。逐点特征和全局特征拼接之后被用来预测物体对称面 / 轴。

SymmetryNet 的创新点之一是将物体对称面 / 轴的预测和对称对应点预测结合起来,对这两个相互关联的任务同时训练,从而提升对称检测的精度和泛化能力。如下图 3 所示,对于当前点 P_i,网络不仅预测物体的对称面 / 轴参数 O_i 和 n_i,同时还预测点 P_i 的对称对应点。其中,反射对称物体的对称对应点为 Q_i,旋转对称物体的对称对应点则为一个围绕对称轴的圆环。

此外,为了处理具有多个对称面 / 轴的物体,SymmetryNet 每次输出多个对称面 / 轴,再利用分类器判断输出每一个输出的有效性。对于含有多个对称面 / 轴的物体,SymmetryNet 通过求解 optimal assignment 优化方程计算预测对称面 / 轴与真值的匹配关系,进而计算 loss 并进行回传。

图 3:SymmetryNet 同时预测对称面 / 轴(蓝色部分)以及对称对应点(橙色部分)。

实验

为了验证算法有效性,SymmetryNet 在多个数据集上进行了实验测试,实验选用 PR 曲线作为评价标准。其中,ShapeNet 数据集上的定量实验结果如下图 4 所示。从图中可以看出,SymmetryNet 显著优于其它已有方法,性能达到了 state-of-the-art,尤其是在没有训练过的物体(Holdout category)上优势明显。

图 4:SymmetryNet 在 ShapeNet 数据集上的测试结果。

下图 5 展示了若干个对称性检测结果,可以看出 SymmetryNet 能够准确地检测出多种不同物体的对称性,包括被遮挡的物体、包含多个对称面的物体等。

图 5:SymmetryNet 对称性检测结果。

对称性是连接几何和语义的桥廊,理解分析物体对称性是计算机感知真实世界的重要方式。因此,对称检测可以为计算机视觉、机器人学中的多种任务提供理论和信息支持,具有十分广阔的应用前景。将图像分割、形状补全、位姿估计、机器人抓取等任务与对称检测结合,有望实现精度更高并且更加鲁棒的算法。

此外,研究实现高效的对称数据标注方法,或者实现对称检测网络的自监督训练,对于该研究方向同样具有重要意义。

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

性能SOTA、适用多种类型物体,国防科技大学单张RGB-D图像预测物体对称性相关推荐

  1. 性能SOTA,国防科技大学单张RGB-D图像预测物体对称性

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文转自|计算机视觉联盟 在这篇论文中,来自国防科技大学和普林斯顿 ...

  2. 国防科技大学发布最新「3D点云深度学习」综述论文

    点击上方"深度学习技术前沿",选择"星标"公众号 资源干货,第一时间送达 3D点云学习( Point Clouds)作为近年来的研究热点之一,受到了广泛关注,每 ...

  3. ACMMM 2021《LSG》性能SOTA!用GNN和GAN的方式来强化Video Captioning的学习!

    关注公众号,发现CV技术之美 本文分享一篇 ACMMM 2021论文『Discriminative Latent Semantic Graph for Video Captioning』,性能SOTA ...

  4. 综述 | 国防科技大学发布最新「3D点云深度学习」综述论文

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 编辑:Sophia 计算机视觉联盟  报道  | 公众号 CVLianMeng 转载于 :专知 [人工智能资源(书籍 ...

  5. 三维可视化技术的多种类型

    可视化是将不可见的事物转化为可见图像的过程.三维可视化就是将最终的图像以三维的方式显示出来."三维"是一个数学概念,它表示我们生活的空间可以用三个数来描述,假设存在一个直角坐标系的 ...

  6. 17届技术报告|国防科技大学-多车一师

    学 校:国防科技大学                队伍名称:多车一师               参赛队员:代宇翔,余皇志,杜肖,权与时,尚靖卓 带队教师:李健,范一鸣             01 ...

  7. 基于张量分解和关系约束的多种类型的MicroRNA-疾病预测

    今天给大家介绍的文章是"Tensor Decomposition with Relational Constraints for Predicting Multiple Types of M ...

  8. 阿里云mysql写入性能_插入mysql类型

    MySQL的五种日期和时间类型 MySQl中有多种表示日期和时间的数据类型.其中YEAR表示年份,DATE表示日期,TIME表示时间,DATETIME和TIMESTAMP表示日期和实践.它们的对比如下 ...

  9. 2020计算机网络基础与应用,2020年国防科技大学硕士研究生考试F1107计算机网络基础考试大纲...

    全国各省市院校2020年硕士研究生考试大纲汇总(持续更新中)>>> 2020年全国硕士研究生入学考试命题标准大纲已于7月8日正式公布,接下来全国各研招院校将陆续发布2020考研专业课 ...

最新文章

  1. Google 深度学习笔记 - Limit of Linear Model
  2. HTML页面中点击按钮关闭页面几种方式与取消
  3. Openstack_通用模块_Oslo_vmware 创建 vSS PortGroup
  4. 一个不错的安全评估站点vulnerabilityassessment.co.uk
  5. USB转串口 FT232/PL2303/CH340 比较
  6. 原理+实战掌握SQL注入方法
  7. Java 中的线程安全的类
  8. 功能Java示例 第5部分–将I / O移到外部
  9. post修改服务器数据源,postgresql安装及配置超详细教程
  10. MySQL 基础 ———— 视图的应用与总结
  11. warning: mysql-community-libs-5.7.11-1.el7.x86_64.rpm: Header V3 DSA/SHA1 Signature, key ID 5072e1f5
  12. 【Linux】imx6ull Kernel 源码下载和编译环境配置
  13. 智齿客服网页端接入文档V2.3
  14. ROS——Gazebo仿真——全向轮小车——运动学模型分析
  15. unity3d+Android:v3签名问题,修改为v2
  16. miui android系统 流量,[Android] 小米云流量最新魔改领100G流量教程
  17. Dynamics 365 On-premises Field Service的安装试用问题
  18. 解决local variable 'has_fav_course' referenced before assignment(Python)
  19. r语言用行名称提取数据框信息显示na_R语言-05数据框创建,以及按条件取数据框数据...
  20. 三菱FX1N FX3U底层源码,PLC生产方案,定位源码

热门文章

  1. 公众号群发文章支持添加小程序
  2. 关于Tomcat性能监控的第三方工具Probe的简介
  3. SubVersion(SVN) 服务器Windows安装指南
  4. Ubuntu 组态 Tomcat而每天的错误解决
  5. TCP长连接与短链接
  6. [转] Java快速教程
  7. .NET读写Excel工具Spire.Xls使用(1)入门介绍
  8. Android Android应用开发实战 学习总结杂项
  9. Pinterest 谈实战经验:如何在两年内实现零到数百亿的月访问
  10. 宇宙条一面:十道经典面试题解析