摘要:在空间查询处理中,目前流行的索引r树可能会造成较大的存储消耗和IO成本。受最近学习的索引[17]用机器学习模型取代b树的启发,我们研究了一个空间数据的类比问题。我们提出了一种新的空间数据学习索引结构(LISA)。其核心思想是使用机器学习模型,通过几个步骤,为任意空间数据集在磁盘页面中生成可搜索的数据布局。具体来说,LISA包含一个映射函数(将空间键(点)映射到一维映射值)、一个学习分片预测函数(将映射空间划分到分片)和一系列本地模型(将分片组织到页面)。在LISA的基础上,设计了一个范围查询算法,并通过格回归模型将KNN查询转换为范围查询。算法也为LISA设计来处理数据更新。大量的实验表明,在查询的存储消耗和IO成本方面,LISA明显优于R-tree和其他替代方法。此外,LISA可以高效地处理数据的插入和删除。

背景:

1)最近递归模型索引(RMI)取代了b -树索引1维数据,RMI由许多分阶段进入层次结构的机器学习模型组成。RMI的想法在空间数据的背景下是行不通的。首先,空间数据使RMI所要求的一维数据假设失效。

2)最近的z阶模型(ZM)[29]结合了z阶空间填充曲线[25]和RMI来索引空间数据。然而,它需要检查许多不相关的键范围查询和不支持KNN查询或数据更新。

方法:

它的核心思想是使用机器学习模型,通过几个精心设计的步骤,为任意空间数据集在磁盘页面中生成可搜索的数据布局。它采用了一种简单而有效的策略,即根据数据沿一系列轴的分布情况将空间划分为一系列网格单元,并沿这些轴对单元进行编号。LISA根据cell的边界构造一个部分单调函数M,将D维空间的数据映射到一维中。根据键的映射值,LISA学习由一系列分段线性函数组成的单调函数SP,为每个映射值分配一个shard id。通过调优SP的参数,每个分片包含相似数量的键。通过构建一个本地模型来管理每个分片的键,属于同一个分片的键存储在一个或多个连续的磁盘页面中,两个具有不同分片id的键存储在两个不同的页面中。通常,本地模型负责分配页面以存储键,并拆分或合并页面以更新数据。因此,我们的LISA也能够处理数据更新,包括插入和删除。与RMI[17]首先修复数据布局,然后学习模型来近似布局不同,LISA使用学习的模型来生成数据布局(分片)。

框架:

LISA: A Learned Index Structure for Spatial Data相关推荐

  1. 经典 Learned Index 结构设计及其应用

    引言 学习索引是一种新型的索引结构,可以帮助数据库更快地查找数据.学习索引的诞生可以追溯到 2017 年,由 Google Brain 团队的 Kraska 等人在论文[1]中首次提出,探讨了使用神经 ...

  2. 论文阅读——Updatable Learned Index with Precise Positions(VLDB‘21)

    1.介绍: 索引在现代数据库引擎中起着至关重要的作用,可以加速查询处理."学习索引"的新模式显著改变了DBMS中索引结构的设计方式.关键的想法是,learned index把索引结 ...

  3. Geocomputation (3)Spatial data operations

    Geocomputation (3)Spatial data operations 来源:https://github.com/geocompx/geocompy 1.准备 #| echo: fals ...

  4. D435i:control_transfer returned error, index: 768, error: No data available, number: 61

    control_transfer returned error, index: 768, error: No data available, number: 61 参考 If control_tran ...

  5. [论文阅读] The Case for Learned Index Structures

    文章目录 Intro 2 RANGE INDEX 2.3 A First, Naïve Learned Index 3 THE RM-INDEX 3.2 递归模型索引 3.3 Hybrid Index ...

  6. 【论文阅读】SIGMOD‘19 FITing-Tree: A Data-aware Index Structure

    [论文阅读]SIGMOD'19 FITing-Tree: A Data-aware Index Structure 介绍 传统的索引结构(比如B+tree),需要消耗大量的空间,在一些OLTP负载下, ...

  7. 【MDM ‘19】Learned Index for Spatial Queries

    摘要 随着基于位置的服务(LBS)的普及,空间数据处理在数据库系统管理的研究中受到了广泛的关注.在各种空间查询技术中,索引结构在数据访问和查询处理中起着关键作用.然而,现有的空间索引结构(例如,R-t ...

  8. Learned Index for Spatial Queries(MDM2019)

    随着基于位置服务(LBS)的普及,空间数据处理在数据库系统管理研究中受到了广泛关注.在各种空间查询技术中,索引结构在数据访问和查询处理中起着关键作用.然而,现有的空间索引结构(如R-tree)主要集中 ...

  9. FITing-Tree: A Data-aware Index Structure

    ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++ 1  论文摘要(包括论文动机.创新点或者贡献,论文的结论等 ...

  10. MySQL Spatial Data Types

    空间 参考: https://dev.mysql.com/doc/refman/8.0/en/spatial-types.html

最新文章

  1. php网页添加图片的代码,天天查询-PHP版的kindeditor编辑器加图片上传水印功能
  2. JVM经常使用的调优參数
  3. JOGL   java调用openGL
  4. Entity Framework Core 2.0的突破性变更
  5. 【转载】SOA面向服务架构简述
  6. mysql的配置实现远程访问_MySQL 远程连接配置的正确实现 | 学步园
  7. 2天后mysql_mysql 学习笔记 第二天
  8. 针对文字加密的简单 JS 加密算法 --进制乱序法改良版
  9. 105_Power Pivot财务科目(层级深度筛选深度)
  10. 这些标点符号你真的会输入吗
  11. 监控IIS的运行状态
  12. java字符串转字符串数组_Java字符串数组到字符串
  13. CentOS 7 / RHEL 7 上安装 LAMP + phpMyAdmin
  14. add p4 多个文件_Python实例:对文件夹图片批量添加logo操作
  15. LaTeX 技巧 802:国内期刊 CCT 模板编译经验
  16. 装IDT声卡时总是说检测到的硬件不受此IDT软件程序包支持安装将终止
  17. 并联串联混合的电压和电流_并联电阻的计算公式(附各种并联电阻网络图解)...
  18. 等保之——等级保护2.0要求及所需设备清单
  19. python编码器用什么_用于ceasar-ciph的python构建编码器
  20. arm64的prefetch/prefetchw/spin_lock_prefetch

热门文章

  1. BootStrap4内容系列之文字排版
  2. sql之分组TOPN
  3. java 加背景颜色_Java 给PPT幻灯片添加背景颜色和背景图片
  4. 项目采购管理和干系人管理
  5. 定制Hexo-NexT的个性化博客
  6. String格式问题:将String格式请求方法时,String格式突然转化为对象的问题
  7. Python编程从入门到实践(第2版)个人学习笔记
  8. 目标检测之RFB Net
  9. 000001 Kick off
  10. wxpython使用_wxpython的demo使用