「论文阅读」Rethinking Network Design and Local Geometry in Point Cloud:A Simple Residual MLP Framework
目录
ABSTRACT
方法
FRAMEWORK OF POINTMLP
GEOMETRIC AFFINE MODULE
ABSTRACT
在本文中,作者提出了一个新的视角来看待这个任务。注意到,详细的局部几何信息可能不是点云分析的关键——引入了一个纯粹的残差MLP network,称为PointMLP,它没有集成“复杂的”局部几何提取器,但性能仍然非常有竞争力。
方法
作者提出通过一个简单的前馈残差MLP网络(PointMLP)来学习点云表示,该网络分层地聚合由MLP提取的局部特征,并放弃使用复杂的的局部几何提取器。为了进一步提高鲁棒性和性能,只引入了一个轻量级的几何仿射模块,将局部点转化为正态分布。
图2:PointMLP中一个阶段的概述。给定一个输入点云,PointMLP使用残差点MLP块逐步提取局部特征。在每个阶段,首先使用几何仿射模块对局部点进行变换,然后分别在聚合操作之前和之后提取(MLP映射)它们。PointMLP通过重复多个阶段逐步扩大接收域和模型完整点云几何信息。(上图中的这个Geometric Affine Module画的并不直观,其实他只需要通过下文的公式就很容易理解了。)
FRAMEWORK OF POINTMLP
作者提出了一个简单但有效的基于MLP的点云理解网络,不引入复杂或沉重的操作。PointMLP的关键的操作可以表述为:
其中,Φpre(·)和Φpos(·)为残差MLP块,这俩都是共享权重的多层感知机,其中前者从局部区域中提取特征,后者从聚合之后的特征里面提取更深层次的特征。其中,映射函数可以写成一系列结构一致的残差MLP块,MLP (x) +x,其中mlp由线性层、归一化层和激活层(重复两次)组合而成。
将聚合函数A(·)看成是MAX操作(类似于PointNet里面的呐种哦)。
对于深层的网络,按照式(4)那种,不断重复这个操作就可以了。
尽管PointMLP的框架很简洁,但它显示了一些突出的优点:
1)由于PointMLP只利用了mlp,所以它对自然有排列不变性,这完全符合点云的特点。
2)通过残差连接,PointMLP可以很容易地扩展到几十个层,产生深层的特征表示。
3)此外,由于没有包含复杂的提取器,主要操作只有高度优化的前馈mlp,即使引入更多的层,pointMLP仍然执行高效。
除明确说明外,我们的实验网络连续叠加了四个式(4)那种的操作,每个Φpre(·)和Φpos(·)中又有两个残差块(ResP)。使用k近邻算法(kNN)来选择邻居,并设置数字邻居数量k=24。
GEOMETRIC AFFINE MODULE
另外作者注意到,一个单纯的深层MLP结构将降低精度和稳定性,模型的鲁棒性不高。这可能与局部区域稀疏、不规则的几何结构有关。不同局部区域之间不同的几何结构可能需要不同的提取器,但共享残差MLPs很难实现这一点。所以,开发了一个轻量级的几何仿射模块来解决这个问题,设{f_i,j},j=1,..,k ∈ R^k*d是由中心点f_i ∈ R^d采样并分组的邻居点集合,每个邻居点是一个d维的向量,我们把每个邻居点集合{f_i,j}通过如下公式进行映射:
其中α ∈ R^d 和 β ∈ R^d是可学的参数,Θ表示哈达玛积,ε=1e−5是数值稳定性的小数值(可能就是加一个极小数防止分母为0?),注意,σ是一个标量,描述了所有邻居点集之间的特征差别。通过这样做,我们将局部点转换为正态分布,同时保持原始的几何性质。
(以上就是整个论文方法和核心部分了,一些交融实验之类的请看原文)
如上图,每个方块下面的下标是当前输入的input矩阵的形状,如[512,24,32]表示「Npoints,Kneibor,Dim」。
「论文阅读」Rethinking Network Design and Local Geometry in Point Cloud:A Simple Residual MLP Framework相关推荐
- 随机邻域嵌入_「论文阅读」-学习用于通勤流嵌入的地理上下文嵌入
论文地址:https://ojs.aaai.org//index.php/AAAI/article/view/5425 0x00 引言 本文章题为"用于通勤流预测的地理上下文嵌入学习&quo ...
- 「论文阅读」SCF-Net:Learning Spatial Contextual Features for Large-Scale Point Cloud Segmentation
目录 局部极坐标表示块(LPR) 双距离注意力池块(DDAP) 全局上下文特征(GCF) SCF模块架构 SCF-Net总体架构 本文的骨干网络主要是基于RandLaNet的,所以,对比着RandLa ...
- 「论文阅读」PCT:Point Cloud Transformer
目录 PCT的点云处理 编码器(Encoder): 物体分类 语义分割 法线估计 Naive PCT SPCT 全PCT 受Transformer在视觉和nlp任务方面的成功启发,我们基于传统Tran ...
- 【论文阅读】Rethinking Spatiotemporal Feature Learning For Video Understanding
[论文阅读]Rethinking Spatiotemporal Feature Learning For Video Understanding 这是一篇google的论文,它和之前介绍的一篇face ...
- [论文阅读] Action Semantics Network: Considering the Effects of Actions in Multiagent System
[论文阅读] Action Semantics Network: Considering the Effects of Actions in Multiagent System 原文链接:https: ...
- 【论文阅读】7-Discovering Structural Regularity in 3D Geometry
[论文阅读]7-Discovering Structural Regularity in 3D Geometry 1.Input: 2.Processing pipeline 2.1.Transfor ...
- CMU发布船新「论文评审」Python程序,淘汰人工审核,自动给arXiv打分
晓查 发自 凹非寺 量子位 报道 | 公众号 QbitAI 什么?同行评审已经可以被AI程序取代了? 就在4月1日,CMU提出了最新的评审标准算法--State-Of-the-Art Review, ...
- 「论文翻译」Graph convolutional networks for computational drug development and discovery
briefings in Bioinformatics 2019 (B类) 文章目录 Abstract Introduction Principles of graph convolution App ...
- 论文阅读笔记(4):Local Convex Representation with Pruning for Manifold Clustering ,带剪枝的局部凸表达进行流形聚类
论文阅读笔记(4):带剪枝的局部凸表达进行流形聚类 介绍 文章主要贡献 理论上:局部凸表达(Local Convex Representation, **LCR**) 剪枝方法:估计流形的内在维数以剪 ...
- 「论文翻译」SATIN: A Secure and Trustworthy Asynchronous Introspection on Multi-Core ARM Processors阅读翻译与笔记
SATIN : 多核ARM处理器上的一种安全可信的异步自省理论 这篇论文是在以此 可靠系统和网络(Dependable Systems and Networks DSN) 会议上发表的 背景 现有技术 ...
最新文章
- 【radar】毫米波雷达相关开源项目代码汇总(工具箱、仿真、2D毫米波检测、融合、4D毫米波检测、分割、SLAM、跟踪)(6)
- es存在某个字段的查阅_ElasticSearch系列02:ES基础概念详解
- js 复制图片_不会做ppt?Reveal.js让你复制粘贴另类拉风,简洁优雅又低调
- 经典mysql数据库表案例_MySQL数据库的“十宗罪”(附10大经典错误案例)
- 程序员面对下列技术问题,如何做决策
- es2017 提供的针对字符串填充的函数:padStart、padEnd
- Spring4新特性——Web开发的增强
- 电脑二维码怎么扫描_扫描模组方案是如何满足多种应用场景需求?
- flask manage port_后端Python3+Flask结合Socket.io配合前端Vue2.0实现简单全双工在线客服系统...
- 跟我一起学习ASP.NET 4.5 MVC4.0(一)
- 3198元起!魅族16s开启预约:4月28日全渠道首发
- java struct 简单案列_spring与struts简单整合案例
- 查看DLL中导出的函数及参数
- 日志服务器文档,日志服务器的搭建.docx
- 如何利用信息差赚钱?分享二个案例给你!
- Exploiting Spatial Structure for Localizing Manipulated Image Regions
- 佛蒙特大学给机器人口述「形态学」,使其「理解」人类指令
- win10彻底永久关闭自动更新【亲测有效】
- math sub Java_java初学减法运算
- 做一个简单计算器(两个数的加减乘除)扣扣116119409
热门文章
- 互联网DSP广告系统架构及关键技术解析 | 广告行业资深架构师亲述
- 高精度整数算法总结,尤其是乘法,面向小白版
- 电脑桌面便签怎么修改便签字体颜色?
- linux cp omitting 复制,Linux中复制目录报错cp:omitting directory的解决办法
- Windows修改本地域名解析文件hosts
- Personalized Defect Prediction
- android 多渠道打包不同的包名、应用名、应用图标
- php 加密网页,PHP_解密七种html网页加密解密法,自己辛苦做出来的内容被别人 - phpStudy...
- Tomcat里 appBase和docBase的区别
- LAB3 PartA 用户环境与异常处理