分布式存储引擎(B树、LSM树)原理

B+树结构 Update-in-place

常见于传统关系型数据库(MySQL、Oracle),按key维护B+树,数据存放在叶子结点(每个页对应的节点可以有更高的度,减小树的深度),且叶子结点之间有指针相连,可以实现高效的key-value查询和区间查询。

底层的存储以页(4K)为基本单位,可以利用操作系统的磁盘预读机制,将节点的size设置为页的大小,这样每个节点只需要一次IO就可以完全载入。

局限性在于,随着数据不断插入,叶子结点会不断分裂,

  • 写入的方式如果是覆盖写,插入的数据后的数据都重新刷写,如果正好跨页,会导致更大的写放大问题;
  • 如果是追加写,就会导致逻辑上原本连续的数据实际上存放在不同的物理磁盘块的位置上(导致更多的随机写操作),在做范围查询的时候会出现比较高的磁盘IO。

总的来说,B+/B-树更适合短范围查询和给定值查询的应用场景。此外,由于B+树可以做到原地更新和删除,对数据库事务支持更加友好;相比较之下,LSM只能在Compaction时才真正的更新和删除,Segment间存在重叠,事务支持较差。

LSM树结构 Log-Structed Merged Tree

常见于LevelDB、HBase、BigTable(让LSM结构声名鹊起的契机)等NoSQL数据库,使用memtable(存储在内存,通常使用自平衡的二叉排序树——红黑树)来接收新的数据插入、更新以及读请求,并直接在内存中对数据进行排序;在内存中达到上限设置的Size后,刷入磁盘,使用SSTable格式(Sorted String Table,由多个Segment组成,每个Segement都是按key有序存储key-value数据对的string结构)将数据存储到磁盘,主要提供读操作,保持有序且不可被更改。

【写操作/更新操作/删除】

  • 遵循WAL(Write Ahead Log)原则,数据会先写入日志文件(如HBase的HLog,当memtable出问题(如系统重启或宕机等),可以根据日志文件和SSTable恢复memetable的数据),然后再写入Memtable;
  • 当内存中的Memtable达到一定条件时(如强制Flush,或数据量到达某个阈值时)数据会从memtable刷写到SSTable中(Minor Compaction),注意,为了避免刷写过程阻塞用户的写操作,会新建一个Memtable;
  • 当磁盘中SSTable的数量超过某个阈值时,或者是周期性地进行合并(Major Compaction),清除无效数据,缩短读取路径。这个阶段才会真正得清除掉被标记为删除的数据,以及多版本数据的合并,避免空间的浪费。(注意,考虑到性能,尽量只在系统低峰期定期触发Major Compaction)

【读操作】

查询Memtable,如果查询不到再查询SSTable,效率低下。可以有几种策略进行优化:

  • 正常情况下,一个读操作是需要读取所有的 SSTable, 将结果合并后返回的,但是对于某些 key 而言,有些 SSTable 是根本不包含对应数据的,因此,我们可以对每一个 SSTable 添加 Bloom Filter,因为布隆过滤器在判断一个SSTable不存在某个key的时候,那么就一定不会存在,利用这个特性可以减少不必要的磁盘扫描。
  • 在SSTable中扫描每个Segement直到数据匹配为止,这个过程可以通过建立稀疏索引来提高效率(直观举例:每个Segement第一个key : offset,那么可以通过二分查找定位到目标数据在哪个Segment内)

总的来说,LSM牺牲了部分读操作的性能,通过批量顺序写来换取高吞吐的写操作性能,更适用于高并发写入的场景。

分布式存储引擎(B树、LSM树)原理相关推荐

  1. B树、B+树、LSM树以及其典型应用场景

    前言 动态查找树主要有:二叉查找树.平衡二叉树.红黑树.B树.B+树.前面三种是典型的二叉查找树,查找的时间复杂度是O(log2N)与树的深度有关系,那么降低树的深度也就可以提升查找效率.这时就提出了 ...

  2. 最容易理解的LSM树--以示例讲解合并查找过程

    关于LSM树 LSM树,即日志结构合并树(Log-Structured Merge-Tree).其实它并不属于一个具体的数据结构,它更多是一种数据结构的设计思想.大多NoSQL数据库核心思想都是基于L ...

  3. LSM树(日志结构合并树)总结-java版

    目录 为什么要有LSM树 数据库存储引擎索引的底层结构 BTree的随机写特点 LSM树的诞生背景 简介 LSM树与B树的差异 LSM树优化 LSM树基本原理 LevelDB中的LSM HBase中的 ...

  4. 3层b+树索引访问磁盘次数_从B+树到LSM树,及LSM树在HBase中的应用

    点击上方蓝色字体,选择"设为星标" 回复"资源"获取更多资源 大数据技术与架构点击右侧关注,大数据开发领域最强公众号! 暴走大数据点击右侧关注,暴走大数据! 前 ...

  5. 从B+树到LSM树,及LSM树在HBase中的应用

    前言 在有代表性的关系型数据库如MySQL.SQL Server.Oracle中,数据存储与索引的基本结构就是我们耳熟能详的B树和B+树.而在一些主流的NoSQL数据库如HBase.Cassandra ...

  6. 数据库关于B树、B+树、LSM树的简介

    B树 在计算机科学中,B树(英语:B-tree)是一种自平衡的树,能够保持数据有序.这种数据结构能够让查找数据.顺序访问.插入数据及删除的动作,都在对数时间内完成.B树,概括来说是一个一般化的二叉查找 ...

  7. LSM树 与B+树比较

    现在假设有 1000 个节点的key.对于磁盘,一定是将这1000个节点依次写入磁盘的速度最快.但是这样读很糟糕,因为key在磁盘中完全乱了,每次读都得扫描. 那么,为了使读取性能尽可能高,磁盘中的数 ...

  8. B+树 VS LSM树

    目录 B+树 LSM树 比较 总结 B+树 简介:为了改善数据访问特性,文件系统或数据库系统通常会对数据排序后存储,加快数据检索速度.传统关系数据库的做法是使用B+树,保证数据在不断更新.插入.删除后 ...

  9. 二、HBase的核心数据结构 跳跃表、LSM树、布隆过滤器

    文章目录 HBase的核心数据结构 跳跃表(SkipList) LSM树 布隆过滤器 布隆过滤器算法示例 HBase与布隆过滤器 HBase的核心数据结构 HBase的一个列簇(Column Fami ...

最新文章

  1. webstorm的使用技巧——1
  2. Sublime text 2/3 中 Package Control 的安装与使用方法
  3. python教学网站-python学习网站整理
  4. 远程唤醒_Python黑科技:在家远程遥控公司电脑,python+微信一键连接!
  5. mysql无法导入函数和存储过程解决方法
  6. 纵横免root框架打不开应用怎么办_很好用的软件多开神奇安卓欧皇十框架!!!...
  7. vue的实例属性$options
  8. php webservice 上传大文件,JS和WebService大文件上传代码分享
  9. labview技巧——自定义 5位数码管字体 显示控件
  10. 【Latex学习】Latex中插入超链接/网址
  11. Win7自带的壁纸路径
  12. 【Google Chrome】reCAPTCHA did not get loaded.
  13. org.apache.catalina.LifecycleException: Failed to start component [Connector[HTTP/1.1-8082]]解决办法
  14. Shell脚本语法3.21
  15. 大数据分析在病毒疫苗研究中的应用
  16. 智慧电网是什么?如何理解智慧?
  17. 天行健,君子以自强不息.
  18. IAM 策略文档学习笔记
  19. stable diffusion prompts
  20. lol桌面图标在计算机哪找,win7系统英雄联盟桌面快捷方式不见了的解决方法

热门文章

  1. 微信注册验证成功之后不跳转_2分钟快速注册公众号,零基础小白也能轻松学会...
  2. Nubia Z9 mini使用体验
  3. 准备学python用什么电脑_准的解释|准的意思|汉典“准”字的基本解释
  4. Hexo-首页不显示全文的方法
  5. BUUCTF——异性相吸 题解
  6. 百分比,只保留整数部分
  7. Laravel 5.5 视图 - 创建视图和数据传递
  8. Vue指令-禁止输入特殊字符
  9. vue3 样式绑定class绑定
  10. 【数学-三角函数】Atcoder——ABC144——Water Bottle