0. 简介

对于激光雷达数据而言,虽然与2D图像相比,可以提供精确的物体深度信息,但也存在数据量大的问题,不便于数据存储或传输。在拿到离线数据分析的时候会发现我们很难拿到较长一段时间的激光数据,这就给我们问题的重现增加了困难。而本文《R-PCC: A Baseline for Range Image-based Point Cloud Compression》就提出了一种基于距离图像的点云压缩方法R-PCC,该方法可以重建具有均匀或非均匀精度损失的点云。我们将原始大尺度点云分割成小而紧凑的区域,以实现空间冗余和显著区域分类。与其他基于体素或基于图像的压缩方法相比,该方法可以在重构点云中保留并对齐原始点云中的所有点。它还可以通过量化模块控制每个点的最大重构误差。在实验中,我们证明了我们更简单的基于FPS的分割方法可以获得比基于实例的分割方法(如DBSCAN)更好的性能。相对应的代码已经在Github上完成了开源。

1. 文章贡献

在本文中,我们提出了一种使用最远点采样(FPS)的基于区域的方法。在第IV-C节中,我们比较了基于实例和基于区域的分割方法的压缩比和重构质量,结果表明,语义和准确的分割不能提高整体压缩性能,而我们的统一压缩框架可以在2cm倒角距离误差的情况下实现30倍的压缩比。将大规模点云分割为小区域的另一个原因是,我们可以在不影响下游任务的情况下,通过在重要区域保持高压缩精度而降低不重要区域的压缩精度来减小压缩的比特流大小。下面是主要贡献:

  • 我们评估了不同范围和分布与压缩比率之间的关系,结果表明,我们的最远点采样分割和点-平面混合建模方法比基于群集的压缩方法在效率和效果上更好。
  • 我们为不同需求提出了一个统一和非统一的压缩框架。具有更多关键点的群集作为后续任务的显着区域保持高的重建质量。
  • 我们将我们的压缩框架与其他最先进的算法进行比较,在重建质量和后续任务性能方面都取得了卓越的表现。我们的实时框架R-PCC是开源的,易于扩展到多个下游任务,并可以成为一个新的基于范围图像的点云压缩基准。

2. 点云压缩基础

点云数据很大要压缩。压缩点云的平台国际上有MPEG的基于几何的点云压缩(Geometry Point Cloud Compression,G-PCC) 和基于视频的点云压缩 (Video Point Cloud Compression, V-PCC) 两个平台;国内有AVS的AVS-PCC平台。V-PCC旨在为需要实时解码的应用提供低复杂度的解码能力,如虚拟/增强现实、沉浸式通信等。G-PCC可为自主驾驶、3D地图和其他利用激光雷达生成的点云(或类似内容)的应用程序的部署提供高效的无损和有损压缩。

V-PCC的整体框架如下图所示,类似于传统的三维视频,整体编码过程可分为四个步骤:补丁生成、几何/纹理图像生成、附加数据压缩和视频压缩。视频压缩过程可以采用已发布的视频编码标准H.265/HEVC、H.266/VVC进行压缩。

2.1 压缩方法分类

传统方法:先去除一部分冗余,再使用变换与量化将空间域的点云变换到频域并压缩变换系数,再经过熵编码进一步压缩比特流。优点:简单直观易理解、可控易debug;缺点:语义难建模,用户不友好

深度方法:通过卷积神经网络将点云数据编码为隐藏表示,再量化隐藏特征,基于学习熵模型和熵编码将上下文输入的情况下每个符号出现的概率压缩并产生比特流。优点:简单高效、数据驱动;缺点:不可解释、黑盒不可控、需要硬件支持(GPU/FPGA etc.)、因为门槛低所以难找工作

3. 系统总览

我们提出的统一或非统一点云压缩框架R-PCC如图1所示。我们的框架的解压部分使用与压缩框架相同的基本压缩器,以解压分割和建模信息数据(信息数据)和量化残差数据。信息数据可以像压缩框架一样预测粗略点云,而残差由反量化模块恢复。在非统一框架中,每个簇的精度对应于压缩中的量化模块。

我们提出的基于激光雷达采集范围图像的压缩框架如图1所示。该框架的解压部分使用与压缩框架中相同的基本压缩器,以解压分割和建模信息数据(info.data)和量化残差数据。info.data可以像压缩框架中一样预测粗略的点云,而残差则通过逆量化模块恢复。在非均匀框架中,每个聚类的准确度对应于压缩中的量化模块。

这样的误差损失包括两个部分:

  1. 从点云到范围图像的投影;
  2. 均匀或非均匀量化精度。

4. 距离图像

现在,大多数激光雷达的单帧点云可以从三维投影到二维。激光雷达具有不同的激光束(例如,Velodyne HDL-64E具有64束激光,而32E具有32束激光),所有激光束在方位角方向(水平视场)上都具有 360 ° 360° 360°的全旋转。这里我们以Velodyne HDL-64E为例。在高度方向(垂直视场),距离图像由64行组成,这些行的角度分布在最低角度 ϕ m i n ϕmin ϕmin和最高角度 ϕ m a x ϕmax ϕmax之间。每个扫描在距离图像中代表一个固定的角度。如果激光雷达具有 H H H束激光,水平角分辨率为 ρ ρ ρ,则激光雷达收集的距离图像的形状应为 [ H , W ] = [ H , ⌊ 360 / ρ ⌉ ] [H,W]=[H,\lfloor360/ρ\rceil] [H,W]=[H,⌊360/ρ⌉],其中 ⌊ ⌉ \lfloor \rceil ⌊⌉表示四舍五入操作。

我们可以将3D点 P = ( x , y , z ) P=(x,y,z) P=(x,y,z)投影到对应的2D像素 I = ( w , h , r ) I=(w,h,r) I=(w,h,r)上,其中 w w w和 h h h是垂直索引和水平索引, r r r是点到LiDAR原点的欧几里得距离。 p ( w , h , r ) p(w,h,r) p(w,h,r)的值按照计算。 r = x 2 + y 2 + z 2 r = \sqrt{x^2 + y^2 + z^2} r=x2+y2+z2 ​, h = ⌊ θ / ρ ⌉ h = \lfloorθ/ρ\rceil h=⌊θ/ρ⌉,以及 w = ⌊ ( ϕ − ϕ m i n ) / σ ⌉ w = \lfloor(ϕ−ϕmin)/σ\rceil w=⌊(ϕ−ϕmin)/σ⌉,其中 θ = a r c t a n ( y / x ) θ=arctan(y/x) θ=arctan(y/x)和 ϕ = a r c t a n ( z / r ) ϕ=arctan(z/r) ϕ=arctan(z/r)分别是水平角和垂直角, ϕ m i n ϕ_{min} ϕmin​是最小的垂直角, σ = W / ( ϕ m a x − ϕ m i n ) σ=W/(ϕ_{max}−ϕ_{min}) σ=W/(ϕmax​−ϕmin​)。

5. 压缩框架

地面提取模块: 地面点具有很强的规律性,因为地面点可以拟合到一个大平面上。我们使用像[8]中的RANSAC平面拟合方法来估计地面模型。

分割模块: 该模块将点云分割成几个更密集的点云子集。与[7]和[8]中的实例分割方法相比,我们选择FPS方法来找到每个聚类的中心作为基于区域的分割方法。聚类的数量等于FPS设置中采样点的数量。在Sec. IV-C中,我们将DBSCAN作为基线与我们的分割方法进行比较,结果表明我们的方法在压缩和效率方面表现更好。

模型模块: 在获得小点云集群之后,我们使用两种方法,点和平面,来建模每个集群中的点。点建模方法使用点深度的平均值,平面建模方法使用通过RANSAC估计的平面来表示每个集群中的点。当集群中的点数小于30或该集群中平面法向量和LiDAR扫描之间的最大角度大于 75 ° 75° 75°时,我们将选择点建模方法。对于集群中的点集 { P i = ( x i , y i , z i ) } i = 1 k \{P_i =(x_i,y_i,zi)\}^k_{i=1} {Pi​=(xi​,yi​,zi)}i=1k​,点模型: r = 1 k ∑ ∣ ∣ P i ∣ ∣ 2 r = \frac{1}{k}∑||Pi||^2 r=k1​∑∣∣Pi∣∣2,平面模型 a x + b y + c y + d = 0 ax + by + cy + d = 0 ax+by+cy+d=0,其中 { r } \{r\} {r}和 { a , b , c , d } \{a,b,c,d\} {a,b,c,d}是模型参数。

…详情请参照古月居

经典文献阅读之--R-PCC(基于距离图像的点云压缩方法)相关推荐

  1. 经典文献阅读之--Swin Transformer

    0. 简介 Transfomer最近几年已经霸榜了各个领域,之前我们在<经典文献阅读之–Deformable DETR>这篇博客中对DETR这个系列进行了梳理,但是想着既然写了图像处理领域 ...

  2. 经典文献阅读之--NICE-SLAM(SLAM的神经隐含可扩展编码)

    0. 简介 对于深度学习而言,NeRF一定是最近两年最火的工作之一了,**NeRF(Neural Radiance Fields)**是最早在2020年ECCV会议上的Best Paper,其将隐式表 ...

  3. 货运服务网络设计:经典文献阅读笔记(3)复现Netplan

    **货运服务网络设计:经典文献阅读笔记(2)**提到说要把Crainic T G(1984年)文献使用的模型复现一下,但是文章给出的通用框架还是太笼统,在尝试后决定使用Jacques Roy & ...

  4. 肺结节目标检测_一种基于CT图像的肺结节检测方法及系统与流程

    本发明属于医学图像分析和计算机辅助诊断等技术领域,更具体地,涉及一种基于CT图像的肺结节检测方法及系统. 背景技术: 肺癌是导致患癌死亡的最危险的疾病之一,其发病率占所有癌症的三分之二,且5年存活率为 ...

  5. 视频+课件| PointDSC:基于特征匹配的点云配准方法(CVPR2021)

    写在前面 感谢「3D视觉从入门到精通」知识星球嘉宾白旭阳博士为我们带来的主题为PointDSC:基于特征匹配的点云配准方法(CVPR2021)视频讲解,星球成员可免费观看学习.备注:白旭阳,香港科技大 ...

  6. 文献阅读09期:基于ADMM方法的柔性负载实时定价

    [ 文献阅读·能源 ] Load shifting of a supplier-based demand response of multi-class subscribers in smart gr ...

  7. 文献阅读06期:基于Logistic效用函数智能电网定价

    [ 文献阅读·能源 ] The real-time pricing optimization model of smart grid based on the utility function of ...

  8. 经典文献阅读之--SuMa++

    0. 简介 作为一名技术博主,最主要的还是需要不断地学习新的知识,而最好的学习就是不断地阅读新的文章,并不断地学习和总结前人的思路和方法.所以博主打算开一个新的系列来介绍.这里主要来介绍一下<S ...

  9. 经典文献阅读之--Lifelong SLAM(变化环境中Lifelong定位建图)

    0. 简介 商场.超市等大多数现实场景的环境随时都在变化.不考虑这些变化的预建地图很容易变得过时.因此,有必要拥有一个最新的环境模型,以促进机器人的长期运行.为此<A General Frame ...

最新文章

  1. 选择排序算法流程图_C#实现——十大排序算法之选择排序
  2. BRCM5.02编译十:cmake: command not found
  3. 【通俗解释】余弦相似度
  4. 一个servlet跳到另一个servlet_另一个太阳下的天与地
  5. FIFO分枝_限界算法
  6. PyQt5 Python主对话框创建关于对话框源代码
  7. atlas 力矩计算_Atlas Copco基本拧紧技术
  8. java基础回顾(一)—— sleep和wait的区别
  9. 密码库LibTomCrypt学习记录——(2.2)分组密码算法的工作模式——ECB模式
  10. The proxy server is refusing connections 怎么解决呢?
  11. java求两个数的最小公倍数的方法_Java程序查找两个数字的最小公倍数
  12. 量化基金投资之Alpha策略简介
  13. 安装windows XP或者2003时提示找不到硬盘驱动器的解决办法(总结)转载
  14. 小程序 全屏滑动【亲测有效】
  15. 读吴军博士新浪微博(2012.09-2014.12)信息整理
  16. 全球PM25实时可视化
  17. 亚马逊违反受限商品申诉模板,亚马逊二手产品申诉
  18. Linux网络编程 - 域名(DNS)及网络地址
  19. 计算机动漫与游戏制作初体验,《无尽远征》隐藏动画大师 启动“游漫双系统”之约...
  20. 笔记本搞双系统-安装Ubuntu过程没有出现选择试用-安装、没有选择“安装类型”页面、安装类型页面为空等问题解决

热门文章

  1. 服务全球近 9 亿人后,蚂蚁金服的技术开放进入 3.0 时代
  2. 【ArcGIS】ArcGIS Pro和ArcMap的简单对比
  3. 微软出品优秀软件推荐
  4. lol不能显示聊天服务器是怎么回事,关于LOL无法连接聊天服务器的解决方法!
  5. SqlServer触发器计算年休假天数
  6. flutter ios 插件开发 appcode 加快索引速度
  7. node.js安装以及vue安装
  8. 使用CloseableHttpClient 模拟发送HttpGet和HttpPost请求
  9. 2022杭电多校(二)
  10. Nmap端口扫描指南之Idle Scan