索引结构是DBA利用的最重要的工具之一,以提高分析和交易工作负载的性能。然而,在大型数据集上建立几个索引往往会变得令人望而却步,并消耗宝贵的系统资源。事实上,最近的一项研究表明,作为TPC-C基准的一部分而创建的索引可以占到现代DBMS中总内存的55%。这种开销消耗了宝贵而昂贵的主内存,并限制了可用于存储新数据或处理现有数据的空间数量。

在本文中,我们提出了FITing-Tree,这是一种新型的学习索引形式,它使用片断线性函数,在构建时指定了一个有界的误差。这个误差旋钮提供了一个可调整的参数,允许DBA通过平衡查找性能和空间消耗来使索引适应数据集和工作负载。为了引导这种权衡,我们提供了一个成本模型,帮助确定一个适当的误差参数,给定(1)一个查询延迟要求(如500ns)或(2)一个存储预算(如100MB)。通过使用各种真实世界的数据集,我们表明我们的索引能够提供与完整索引结构相媲美的性能,同时将存储空间的占用减少了几个数量级。

[论文阅读] FITing-Tree: A Data-aware Index Structure相关推荐

  1. GPT-2隐私泄露论文阅读:Extracting Training Data from Large Language Models

    文章目录 论文地址: 原文阐释: 渔樵问对: 原理梗概 预防策略 隐私策略 这个新颖的攻击方式是什么? 三种典型采样策略: 隐私风险 文章第5页第二段中提到的 memorized training e ...

  2. 论文阅读笔记: Modeling Relational Data with Graph Convolutional Networks

    arXiv:1703.06103v4 文章目录 1.Introduction 2.神经关系建模(Neural relational modeling) 2.1 关系图卷积网络(Relational g ...

  3. 【论文阅读】Cleanits: A Data Cleaning System for Industrial Time Series

    论文来源 标题: Cleanits (Xiaoou Ding,2019) 作者: Xiaoou Ding, Hongzhi Wang, Jiaxuan Su, Zijue Li, Jianzhong ...

  4. 【论文阅读】CAFE: Catastrophic Data Leakage in Vertical Federated Learning

    本文主要讲述了 恶意server 如何在VFL环境下根据数据索引来还原完整的训练数据. 这里写目录标题 现有工作的不足 主要贡献 实现 assumption & target 为什么大批量数据 ...

  5. 【论文阅读-HGP-SL】Hierarchical Graph Pooling with Structure Learning

    论文地址:https://arxiv.org/pdf/1911.05954 代码地址:https://github.com/cszhangzhen/HGP-SL 这篇论文提出了一种新的基于TopK的图 ...

  6. CDR 论文阅读 1

    CDR 论文阅读 ALL-DIGITAL CLOCK AND DATA RECOVERY 1 研究背景 2 系统架构 Phase Detectors XOR phase detector Tri-St ...

  7. 【论文阅读】SIGMOD‘19 FITing-Tree: A Data-aware Index Structure

    [论文阅读]SIGMOD'19 FITing-Tree: A Data-aware Index Structure 介绍 传统的索引结构(比如B+tree),需要消耗大量的空间,在一些OLTP负载下, ...

  8. 【论文阅读】Gait Quality Aware Network: Toward the Interpretability of Silhouette-Based Gait Recognition

    Gait Quality Aware Network: Toward the Interpretability of Silhouette-Based Gait Recognition 摘要 Intr ...

  9. 论文阅读-虚假信息检测综述 - Fake News Detection on Social Media: A Data Mining Perspective

    论文链接:https://arxiv.org/pdf/1708.01967.pdf 目录 摘要 1 引言 2. 假新闻定义 2.1 假新闻的定义 2.2 传统新闻媒体上的假新闻 2.3社交媒体上的假新 ...

  10. [论文阅读] (03) 清华张超老师 - GreyOne: Discover Vulnerabilities with Data Flow Sensitive Fuzzing

    数据流敏感的漏洞挖掘方法 Discover Vulnerabilities with Flow Sensitive Fuzzing Chao Zhang 清华大学 2nd International ...

最新文章

  1. 恢复快速启动中的“显示桌面”按钮
  2. sqlserver ssms ctrl+e快捷键问题
  3. style 放入css文件失效_React中使用CSS的7种方式
  4. maven+jenkins+sonar集成搭建
  5. web字体设置成平方字体_探索免费和开放的Web字体
  6. 湖州机器人上课时间_【倒计时5天】燃到炸!湖州吾悦广场10月30日开业狂欢指南,请收下...
  7. 图解WebGLThree.js工作原理
  8. 第一章 ASP.NET MVC简介(1.1)
  9. [NOIP2013 普及组 T1] 计数问题
  10. offer oracle svp_SVP - Uncyclopedia
  11. 整理的一些java基础知识点,欢迎补充指正
  12. 报错UnicodeDecodeError ‘gbk‘ codec can‘t decode byte 0x93 in position 7104 illegal multibyte sequence
  13. RT-Thread柿饼控件(2)-- Button
  14. 注意到函数preg_replace_callback和preg_replace
  15. 英语CET6救命作文通用模板
  16. 直播预约|FFA 2022 主会场,11月26日正式上线
  17. 0x66 Tarjan算法与无向图联通性
  18. 修真院教学模式三大阶段之任务体系 1
  19. Qt日期操作(QDateTime)
  20. 项目实训 : Solr 使用中遇到的问题

热门文章

  1. 2022西邮linux兴趣小组纳新题解
  2. 【毕业设计】银行营销数据分析系统 - 机器学习
  3. 轻松将多个竖屏视频改为横屏,格式转为TS
  4. js引用python里面的变量,在Javascript和Python之间传递变量
  5. (转载)前端表格制作教程
  6. 马斯克也爱 “天才少年”!14 岁神童,年薪百万,SpaceX 史上最年轻工程师
  7. PS缺失msvcp120.dll,msvcp140.dll和VCRUNTIME140.dll
  8. 企微SCRM系统助力在线教育行业做好社群SOP运营
  9. 行业首发:响应式优酷快速适配新Mac
  10. Oracle 数据导入