文章目录

  • ABSTRACT
  • CCS CONCEPTS
  • KEYWORDS
  • 1 INTRODUCTION
  • 2 OUTLINE OF THE TUTORIAL
    • 2.1 Part 1: Learned Index Structures
    • 2.2 Part 2: Learned Multi-dimensional Indexes
  • 3 RELATED TUTORIALS
  • 4 PRIOR TUTORIALS
  • 5 BIOGRAPHIES
  • 6 ACKNOWLEDGEMENTS
  • REFERENCES

论文地址

ABSTRACT

近年来,机器学习(简称ML)已成功应用于数据库索引。对学习索引的初步实验表明,与传统数据库相比,其搜索性能更好,空间需求更低。为了将学习到的索引扩展到多维空间,已经进行了许多尝试。这使得学习的索引可能适用于空间数据库。本教程的目标是在单维和多维空间中提供学习索引的最新内容。本教程涵盖了25个学习过的索引。本教程通过分类法浏览学习索引的空间,该分类法有助于在一维和多维空间中对所涵盖的学习索引进行分类。

CCS CONCEPTS

• Database Systems → Indexing; • Machine Learning → ML for Systems.

KEYWORDS

Learned Indexes, Spatial, Multi-dimensional

1 INTRODUCTION

由于机器学习领域最近取得的成功,系统社区出现了两种研究趋势:面向机器学习的系统和面向系统的机器学习。ML系统旨在为高效ML工作负载构建大规模系统。相反,系统ML旨在使用基于ML的方法来替换系统的核心组件,以获得更好的性能和更少的空间需求。本教程属于系统ML的大类。更具体地说,本教程解决了以下问题:可以使用ML技术来指导数据索引吗?ML技术可以代替多维索引吗?
        数据库管理系统(DBMS)设计为通用型。现代数据库管理系统的这种通用性并不考虑特定应用程序和用户数据的具体情况。在大多数DBMS中,为了高效地访问数据,使用了索引结构,例如B+树。因此,这些索引结构得到了高度优化,但属于通用数据结构。换句话说,它们在索引的优化过程中没有利用底层数据分布的知识。为了进行说明,假设我们有1到5M个连续整数键。现在,为了搜索特定的键,我们可以使用键本身(而不是B+树)作为偏移量。因此,搜索操作的对数复杂度可以降低到

A Tutorial on Learned Multi-dimensional Indexes相关推荐

  1. PHP 多维数组搜索 PHP multi dimensional array search

    array_column() 返回input数组中键值为column_key的列, 如果指定了可选参数index_key,那么input数组中的这一列的值将作为返回数组中对应值的键. 参数 input ...

  2. 一维(多维)高斯模型(One(Multi)-dimensional Gaussian Model) 高斯混合模型GMM(Gaussian Mixture Model)

    一维高斯模型(One-dimensional Gaussian Model) 若随机变量X服从一个数学期望为,标准方差为的高斯分布,记为: x~N(,). 则概率密度函数为: 高斯分布的期望值决定了其 ...

  3. 【MDM ‘19】Learned Index for Spatial Queries

    摘要 随着基于位置的服务(LBS)的普及,空间数据处理在数据库系统管理的研究中受到了广泛的关注.在各种空间查询技术中,索引结构在数据访问和查询处理中起着关键作用.然而,现有的空间索引结构(例如,R-t ...

  4. mongodb更新语句_MongoDB更新

    mongodb更新语句 MongoDB update is used to update document in a collection. In last tutorial, we learned ...

  5. 15支持哪些数据库版本 tfs_版本和支持的功能 - SQL Server 2016 | Microsoft Docs

    SQL Server 2016 的各版本和支持的功能Editions and supported features of SQL Server 2016 07/22/2020 本文内容 适用于:App ...

  6. ClickHouse快速的开源OLAP(联机分析处理)数据库管理系统

    OLAP:联机分析处理OLAP是一种软件技术,它使分析人员能够迅速.一致.交互地从各个方面观察信息,以达到深入理解数据的目的.它具有FASMI(Fast Analysis of Shared Mult ...

  7. oracle saiku_有了 Kylin+Saiku,妈妈再也不用担心我的多维 OLAP 平台

    随着数据量的激增,传统的 OLTP 平台已无法满足用户的分析需求.OLAP 平台应运而生,OLAP 平台通常由 OLAP Engine 与用户操作分析页面组成.本文将会以 Saiku + Kylin ...

  8. c 语言 函数返回数组_如何在C ++函数中返回数组

    c 语言 函数返回数组 介绍 (Introduction) In this tutorial, we are going to understand how we can return an arra ...

  9. 快排递归非递归python_Python递归神经网络终极指南

    快排递归非递归python Recurrent neural networks are deep learning models that are typically used to solve ti ...

最新文章

  1. 将Model对象转换成json文本或者json二进制文件
  2. tfjob的一篇文章,跟公司内使用方式类似
  3. h5封装去底部_干货分享 | 一步一步教你在SpringBoot中集成微信支付H5支付
  4. 地理信息系统软件测试培训,地理信息系统软件测试方法技术方案
  5. python数组的使用方法_使用Python记录数组的正确方法是什么
  6. SecurityManager篇
  7. GRE 隧道配置案例(静态、动态路由)
  8. popoupwindow 点击背景消失_两种去除背景音乐保留原声的高效方法
  9. 【.NET开发之美】使用ComponentOne提高.NET DataMap中的加载速度
  10. 【优化算法】粒子群优化多目标搜索算法【含Matlab源码 1124期】
  11. Raspberry PI 上手记
  12. 无法访问 请与这台计算机,我们办公室两台电脑想连接一个共享的打印机,但是连接的时候,总是显示无法访问,请与这台计算机的管理员联系,应该怎么设置啊...
  13. 51单片机LCD1602程序详解
  14. 51单片机秒表设计c语言版,51单片机秒表系统的设计
  15. CrackMe-001
  16. 2021年山东省安全员A证考试内容及山东省安全员A证新版试题
  17. L1-7 机工士姆斯塔迪奥【C语言】
  18. IOS TableViewCell分割线设置和隐藏多余cell
  19. Superpro5000的使用经验小结
  20. CAD建筑室内图纸素材

热门文章

  1. Entrust Datacard新一代再转印证卡打印机系列喜获蓝盾杯创新奖
  2. 上线切换 - 如何导入在制品
  3. Photoshop滤镜巧制超级美女插画效果(转)
  4. 【数据结构】带动画显示过程的递归求解迷宫问题
  5. 使用C++模拟动态密码验证
  6. 炫龙T50热键功能键
  7. 改进后的速算小游戏(2011211909 苟玲、2011211933 郝怡然)
  8. Join condition is missing or trivial.Use the CROSS JOIN syntax to allow cartesian products between t
  9. 国人“急功近利”的理由和无奈
  10. Db2数据分布不均匀导致的select ... fetch first n rows only性能问题