LISA: A Learned Index Structure for Spatial Data
摘要:在空间查询处理中,目前流行的索引r树可能会造成较大的存储消耗和IO成本。受最近学习的索引[17]用机器学习模型取代b树的启发,我们研究了一个空间数据的类比问题。我们提出了一种新的空间数据学习索引结构(LISA)。其核心思想是使用机器学习模型,通过几个步骤,为任意空间数据集在磁盘页面中生成可搜索的数据布局。具体来说,LISA包含一个映射函数(将空间键(点)映射到一维映射值)、一个学习分片预测函数(将映射空间划分到分片)和一系列本地模型(将分片组织到页面)。在LISA的基础上,设计了一个范围查询算法,并通过格回归模型将KNN查询转换为范围查询。算法也为LISA设计来处理数据更新。大量的实验表明,在查询的存储消耗和IO成本方面,LISA明显优于R-tree和其他替代方法。此外,LISA可以高效地处理数据的插入和删除。
背景:
1)最近递归模型索引(RMI)取代了b -树索引1维数据,RMI由许多分阶段进入层次结构的机器学习模型组成。RMI的想法在空间数据的背景下是行不通的。首先,空间数据使RMI所要求的一维数据假设失效。
2)最近的z阶模型(ZM)[29]结合了z阶空间填充曲线[25]和RMI来索引空间数据。然而,它需要检查许多不相关的键范围查询和不支持KNN查询或数据更新。
方法:
它的核心思想是使用机器学习模型,通过几个精心设计的步骤,为任意空间数据集在磁盘页面中生成可搜索的数据布局。它采用了一种简单而有效的策略,即根据数据沿一系列轴的分布情况将空间划分为一系列网格单元,并沿这些轴对单元进行编号。LISA根据cell的边界构造一个部分单调函数M,将D维空间的数据映射到一维中。根据键的映射值,LISA学习由一系列分段线性函数组成的单调函数SP,为每个映射值分配一个shard id。通过调优SP的参数,每个分片包含相似数量的键。通过构建一个本地模型来管理每个分片的键,属于同一个分片的键存储在一个或多个连续的磁盘页面中,两个具有不同分片id的键存储在两个不同的页面中。通常,本地模型负责分配页面以存储键,并拆分或合并页面以更新数据。因此,我们的LISA也能够处理数据更新,包括插入和删除。与RMI[17]首先修复数据布局,然后学习模型来近似布局不同,LISA使用学习的模型来生成数据布局(分片)。
框架:
LISA: A Learned Index Structure for Spatial Data相关推荐
- 经典 Learned Index 结构设计及其应用
引言 学习索引是一种新型的索引结构,可以帮助数据库更快地查找数据.学习索引的诞生可以追溯到 2017 年,由 Google Brain 团队的 Kraska 等人在论文[1]中首次提出,探讨了使用神经 ...
- 论文阅读——Updatable Learned Index with Precise Positions(VLDB‘21)
1.介绍: 索引在现代数据库引擎中起着至关重要的作用,可以加速查询处理."学习索引"的新模式显著改变了DBMS中索引结构的设计方式.关键的想法是,learned index把索引结 ...
- Geocomputation (3)Spatial data operations
Geocomputation (3)Spatial data operations 来源:https://github.com/geocompx/geocompy 1.准备 #| echo: fals ...
- D435i:control_transfer returned error, index: 768, error: No data available, number: 61
control_transfer returned error, index: 768, error: No data available, number: 61 参考 If control_tran ...
- [论文阅读] The Case for Learned Index Structures
文章目录 Intro 2 RANGE INDEX 2.3 A First, Naïve Learned Index 3 THE RM-INDEX 3.2 递归模型索引 3.3 Hybrid Index ...
- 【论文阅读】SIGMOD‘19 FITing-Tree: A Data-aware Index Structure
[论文阅读]SIGMOD'19 FITing-Tree: A Data-aware Index Structure 介绍 传统的索引结构(比如B+tree),需要消耗大量的空间,在一些OLTP负载下, ...
- 【MDM ‘19】Learned Index for Spatial Queries
摘要 随着基于位置的服务(LBS)的普及,空间数据处理在数据库系统管理的研究中受到了广泛的关注.在各种空间查询技术中,索引结构在数据访问和查询处理中起着关键作用.然而,现有的空间索引结构(例如,R-t ...
- Learned Index for Spatial Queries(MDM2019)
随着基于位置服务(LBS)的普及,空间数据处理在数据库系统管理研究中受到了广泛关注.在各种空间查询技术中,索引结构在数据访问和查询处理中起着关键作用.然而,现有的空间索引结构(如R-tree)主要集中 ...
- FITing-Tree: A Data-aware Index Structure
++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 1 论文摘要(包括论文动机.创新点或者贡献,论文的结论等 ...
- MySQL Spatial Data Types
空间 参考: https://dev.mysql.com/doc/refman/8.0/en/spatial-types.html
最新文章
- php网页添加图片的代码,天天查询-PHP版的kindeditor编辑器加图片上传水印功能
- JVM经常使用的调优參数
- JOGL java调用openGL
- Entity Framework Core 2.0的突破性变更
- 【转载】SOA面向服务架构简述
- mysql的配置实现远程访问_MySQL 远程连接配置的正确实现 | 学步园
- 2天后mysql_mysql 学习笔记 第二天
- 针对文字加密的简单 JS 加密算法 --进制乱序法改良版
- 105_Power Pivot财务科目(层级深度筛选深度)
- 这些标点符号你真的会输入吗
- 监控IIS的运行状态
- java字符串转字符串数组_Java字符串数组到字符串
- CentOS 7 / RHEL 7 上安装 LAMP + phpMyAdmin
- add p4 多个文件_Python实例:对文件夹图片批量添加logo操作
- LaTeX 技巧 802:国内期刊 CCT 模板编译经验
- 装IDT声卡时总是说检测到的硬件不受此IDT软件程序包支持安装将终止
- 并联串联混合的电压和电流_并联电阻的计算公式(附各种并联电阻网络图解)...
- 等保之——等级保护2.0要求及所需设备清单
- python编码器用什么_用于ceasar-ciph的python构建编码器
- arm64的prefetch/prefetchw/spin_lock_prefetch