PointNet解读
PointNet解决的问题:
如上图所示:
1.点云图像的分类(整片点云是什么物体)
2.点云图像的部件分割(整片点云所代表的物体能拆分的结构)
3.点云图像的语义分割(将三维点云环境中不同的物体用不同的颜色区分开)
论文中展示的输入输出效果:
1.部件分割的效果(左边是输入不完整的点云,右边是输入完整的点云)
2.语义分割的效果
论文中提到的点云的三个特性:
1.点的无序性:点云是无序的集合,点与点之间没有严格的顺序,如将两个点交换之后仍然表示同一个点云。
2.点之间的相互作用:虽然点云的点是离散的,但是却可以共同组成物体或者环境的轮廓。这意味着点之间不是孤立的,相邻点形成一个有意义的子集。因此,模型需要从点的附近的点捕捉局部结构,以及局部结构之间的相互作用。
3.变换不变性:点云进行刚性变换(旋转平移)后,再进行输入,输出的分类或者是分割结果不变。
要解决点云图像的分类和分割任务就是如何对点云数据进行特征提取:
如果不进行MLP神经网络进行升维直接进行池化操作提取特征,那么n个点才提取到1个3个维度的特征(2,3,4),然后在进行K分类,似乎很不合理 ,损失特征太多了。所以在进行池化操作前要进行升维,让特征足够多。
如上图公式所示,h函数相当于升维操作,g函数为池化提取特征操作,y函数为分类操作。
经过上面的讲解那么PointNet架构就很好理解了。PointNet由分类网络和分割网络两部分组成。分类网络以n个点作为输入,应用输入和特征转换,然后通过最大池化来聚合点特征。输出是K个类的 分类分数。分割网络是分类网络的扩展。它连接全局和局部特征,并输出每个点的分数。多层感知器 (MLP)由5个隐藏层组成,神经元大小分别为64,64,64, 128,1024,所有点共享一个MLP副本。分类和分割网络中靠近输出的MLP由大小为512,256的两层组成。
PointNet解读相关推荐
- 三维点云网络——PointNet论文解读
PointNet1 是斯坦福大学研究人员提出的一个点云处理网络,与先前工作的不同在于这一网络可以直接输入无序点云进行处理,而无序将数据处理成规则的3Dvoxel形式进行处理.输入点云顺序对于网络的输出 ...
- PointNet和PointNet++论文解读
一.PointNet 论文题目:PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation (CVPR 2 ...
- PointNet源码解读
本次源码解读的地址为:https://github.com/yanx27/Pointnet_Pointnet2_pytorch,这一版本的源码易读性高,主要是封装程度较低,注释较全,安装额外的库也比较 ...
- PointNet论文解读和代码解析
目录 一.论文动机 现有的问题: 作者的思路及面临的问题: 二.论文方法 如何解决点云无序性问题?作者提出了三种想法. 针对点云的刚体运动不变性 三.网络结构 四.代码阅读 五.Reference(两 ...
- PointNet++论文解读和代码解析
目录 一.论文动机 二.论文方法 三.网络结构 Set Abstraction 非均匀采样密度下的鲁棒性学习 上采样 四.代码阅读 论文地址:https://arxiv.org/pdf/1706.02 ...
- 论文解读PointNet(用于点云处理的深度学习框架)
随着最近几年神经网络在CV.NPL等领域取得重大的成果,因此就有学者希望将神经网络应用于3D任务中.在这篇文章(PointNet: Deep Learning on Point Sets for 3D ...
- PointNet系列论文解读
1 简介 此系列论文首先提出了一种新型的处理点云数据的深度学习模型-PointNet,并验证了它能够用于点云数据的多种认知任务,如分类.语义分割和目标识别.不同于图像数据在计算机中的表示通常编码了像素 ...
- 点云配准的端到端深度神经网络:ICCV2019论文解读
点云配准的端到端深度神经网络:ICCV2019论文解读 DeepVCP: An End-to-End Deep Neural Network for Point Cloud Registration ...
- CVPR2020论文解读:3D Object Detection三维目标检测
CVPR2020论文解读:3D Object Detection三维目标检测 PV-RCNN:Point-Voxel Feature Se tAbstraction for 3D Object Det ...
- CVPR2020论文解读:三维语义分割3D Semantic Segmentation
CVPR2020论文解读:三维语义分割3D Semantic Segmentation xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3D ...
最新文章
- 败家玩意儿!Redis 竟然浪费了这么多内存!
- 小学教师计算机国培培训总结,小学教师国培个人研修总结
- Linux安装jupyter debugger+Conda设置proxy代理
- 三级火箭力助搜狗快速盈利
- Fashion-MNIST数据集发布一周年,论文引用量超250篇
- 和大家探讨一下“虚拟光驱”原理
- SQL Server使用 LEFT JOIN ON LIKE进行数据关联查询
- 阿里腾讯都在做的可视化大屏,我用这工具里的100个模板实现了
- js数组去重的4个方法
- 8-9 实现原理-1
- linux取反格式,linux基本命令总结(二)
- java-开发环境切换不同版本Java-jdk的步骤
- java常见反编译工具
- 聊天机器人与自动问答技术
- 如何封禁大量恶意IP?
- html中form表单的使用方法和介绍
- 批量分类导出语雀知识库下所有文章
- 数字时代的“文艺复兴”?起底数字藏品,让人欢喜让人愁
- 云计算:SaaS、PaaS、IaaS、CaaS并不神秘
- FTP服务器的上传与下载