B树

B树又叫做二叉搜索树,倒状的树形结构。如下图所示

特点:

  • 所有的非子夜节点最多拥有两个子节点树(左子树和右子树)。

  • 所有结点存储一个关键字。

  • 节点的左右儿子,左边是比该节点小的,右边是比该节点大的。

缺点:

因为二叉搜索树不存在平衡算法,所以在某些特殊的情况下,二叉搜索树等同于线性,出现蹩脚的情况,设计者们发现降低树的高度自然就可以提高查找效率。那么如何解决降低树的高度的问题?在这种基础上设计者给二叉树加入了平衡算法,出现了平衡树。

二叉树搜索树的查询原理,先从根节点开始,和根节点匹配,若是比根节点小就进入左子节点,若是比根节点大进行右子节点,依次按照这样的逻辑进行,找到就返回。

另一方面树的高度也会影响查询的效率,设计者又是怎么解决的呢?
假设大规模数据存储中,实现索引查询这样一个实际背景下,树节点存储的元素数量是有限的,即使存储在平衡二叉树中,在大量数据的储存情况下,这样导致二叉平衡查找树结构由于树的深度过大而造成磁盘I/O读写过于频繁,进而导致查询效率低下,那么如何减少树的深度(当然是不能减少查询的数据量),一个基本的想法就是:采用多叉树结构(由于树节点元素数量是有限的,自然该节点的子树数量也就是有限的)。在这种前提下,B-、B+、B*也就是这样的数据结构,多路搜索树,不再是只有二路。

所谓的平衡就是加上平衡算法,在B树在经过多次插入与删除后,有可能导致不同的结构,极端一点就是出现线性的蹩脚树,通过平衡算法(左旋和右旋),使树的节点分布均匀,是树的查找算法等同于二分查找。所以对于树而言要提高查找的效率,一个是保存平衡;另一个是减少树的高度。

B-树

基于减少树的高度上,B-树是一种多路搜索树,并不是二叉的。如下图所示:

特点:

  • 所有的非叶子结点最多有M个儿子(且M>2)。

  • 根结点的儿子数为[2, M],其它非叶子结点的儿子数为[M/2, M]。

  • 每个结点存放至少M/2-1(取上整)和至多M-1个关键字;(至少2个关键字)。

  • 非叶子结点的关键字个数=指向儿子的指针个数-1。

  • 非叶子结点的关键字中从左到右由大到小排序。即A[1]<A[2]<A[3],…,A[k-1]<A[k]。

  • 非叶子结点的指针:P[1], P[2], …, P[M];其中P[1]指向关键字小于K[1]的子树,其它P[i]指向关键字属于(K[i-1], K[i])范围的子树,最后一个指针P[M]指向大于随后一个关键字A[M-1]范围的值。

  • 关键字集合分布在整颗树中,并且只会在节点中出现一次。

  • 搜索可能在非子叶节点或者子叶节点结束,即非子叶节点也存储数据的身,这个与B+树有根本区别。

  • 所有叶子结点位于同一层。

缺点:

  • 当数据量大的时候不是依然会查询到最底层的叶子节点。这就是B-树的缺点,但是相比B树而言已经优化了很多。

B-树的性能总是等价于二分查找(与M值无关),也就没有B树平衡的问题。由于M/2的限制,在插入结点时,如果结点已满,需要将结点分裂为两个各占M/2的结点;删除结点时,需将两个不足M/2的兄弟结点合并。

B+树

B+树是B-树的变体,也是一种多路搜索树。如下图所示:

B+基本与B-树同,以下是与B-树的区别:

  • 非叶子结点的指针与关键字个数相等,而B-树的关键字=指针个数-1;

  • 指针P[i],指向关键字值属于[K[i], K[i+1])范围的子树,而在B-树是开区间。

  • 所有叶子结点增加一个指针,指向下一个的兄弟叶子节点。

  • 所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的,搜索只会在叶子节点结束,叶子节点存储所有关键字的值。

  • 不可能在非叶子结点命中;非叶子结点相当于是叶子结点的索引(稀疏索引),叶子结点相当于是存储。

B树与B+树的区别:

  • 所有的叶子节点包含了全部关键子信息,及指向含有这些关键字记录的指针,且叶子结点本身依关键字的大小自小而大的顺序链接。(而B树的叶子节点并没有包括全部需要查找的信息)。

  • 所有的非终端结点可以看成是索引部分,结点中仅含有其子树根结点中最大(或最小)关键字。(而B树的非终节点也包含需要查找的有效信息)。

这些链指针在链表中是有序存储的,在搜索中能省大量的时间。那这些链指针可不可以加在所有的节点中呢,答案是可以的,除了根节点,所有的节点都可以加上链指针。这就是B*树索引。

B*树

B*树是在B+树的基础上,在B+树的非根和非叶子结点增加指向兄弟的指针,将结点的最低利用率从1/2提高到2/3。

特点:

  • B*树定义了非叶子结点关键字个数至少为(2/3)M,即块的最低使用率为2/3(代替B+树的1/2)

  • 在非根和非叶子结点增加指向兄弟的指针。

B+树与B*树的区别:
(1)B+树的分裂:当一个结点满时,分配一个新的结点,并将原结点中1/2的数据复制到新结点,最后在父结点中增加新结点的指针;B+树的分裂只影响原结点和父结点,而不会影响兄弟结点,所以它不需要指向兄弟的指针。
(2)B*树的分裂:当一个结点满时,如果它的下一个兄弟结点未满,那么将一部分数据移到兄弟结点中,再在原结点插入关键字,最后修改父结点中兄弟结点的关键字(因为兄弟结点的关键字范围改变了);如果兄弟也满了,则在原结点与兄弟结点之间增加新结点,并各复制1/3的数据到新结点,最后在父结点增加新结点的指针。
结论:
所以,B*树分配新结点的概率比B+树要低,空间使用率更高。

关于回表查询:
比如select name from table where id=?,如果name没有索引,那在查询的时候先得得到的是id对应这条数据所在的行数。拿着这个行数,再去表中查询这条数据,得到name字段。而拿着这个行数去得到name字段的动作,就是回表查询。

我们如何避免回表查询呢,首先就是不要用 ” * “ 查询,因为这时候会默认查询的字段没有索引,必定进行回表查询。

B树、B-树、B+树、B*树图文详解相关推荐

  1. 目录树 删除 数据结构_数据结构:B树和B+树的插入、删除图文详解

    B树 1.1B树的定义 B树也称B-树,它是一颗多路平衡查找树.我们描述一颗B树时需要指定它的阶数,阶数表示了一个结点最多有多少个孩子结点,一般用字母m表示阶数.当m取2时,就是我们常见的二叉搜索树. ...

  2. 数据结构:B树和B+树的插入、删除图文详解

    目录 B树 1.1B树的定义 1.2B树的插入操作 1.3B树的删除操作 B+树 2.1 B+树的定义 2.2 B+树的插入操作 2.3 B+树的删除操作 B树 1.1B树的定义 B树也称B-树,它是 ...

  3. 【图文详解】一文全面彻底搞懂HBase、LevelDB、RocksDB等NoSQL背后的存储原理:LSM-tree日志结构合并树...

    LSM 树广泛用于数据存储,例如 RocksDB.Apache AsterixDB.Bigtable.HBase.LevelDB.Apache Accumulo.SQLite4.Tarantool.W ...

  4. AVL树的实现(图文详解)

    AVL树的实现 AVL树定义 AVL树其实就是一棵特殊的二叉树,为什么会出现AVL树,AVL树比普通二叉树优势在什么地方呢? 我们知道,一棵普通的二叉搜索树,以其特殊的性质(左<根<右), ...

  5. 二叉树合集(二):霍夫曼树(图文详解)

    合集地址 二叉树合集(一):二叉树基础(含四种遍历,图文详解) 二叉树合集(二):霍夫曼树(图文详解) 二叉树合集(三):线索二叉树(图文详解) 二叉树合集(四):对称二叉树(递归和迭代实现) 二叉树 ...

  6. 树和二叉树(四种遍历,建树)详解+二叉排序树(包含图像和相关习题)

    目录 树和二叉树 一.树 2.有序树和无序树 3.森林 4.树的基本性质 二.二叉树的概念 (1)二叉树的编号 1.二叉树和度为2的有序树的区别: 2.满二叉树 3.完全二叉树: 4.平衡二叉树: 5 ...

  7. 307. Range Sum Query - Mutable | 307. 区域和检索 - 数组可修改(数据结构:线段树,图文详解)

    题目 https://leetcode.com/problems/range-sum-query-mutable/ 吐槽官方题解 这题的 英文版官方题解,配图和代码不一致,而且描述不清:力扣国内版题解 ...

  8. b树与b+树的区别_面试必考:B树、B树、B+树、B*树图文详解

    B树 B树又叫做二叉搜索树,倒状的树形结构.如下图所示 特点: 所有的非子夜节点最多拥有两个子节点树(左子树和右子树). 所有结点存储一个关键字. 节点的左右儿子,左边是比该节点小的,右边是比该节点大 ...

  9. 树堆(Treap)图文详解与实现

    1.Treap的定义 树堆(Treap)是二叉排序树(Binary Sort Tree)与堆(Heap)结合产生的一种拥有堆性质的二叉排序树. 但是这里要注意两点,第一点是Treap和二叉堆有一点不同 ...

  10. 【图文详解】一文全面彻底搞懂HBase、LevelDB、RocksDB等NoSQL背后的存储原理:LSM-tree 日志结构合并树...

    LSM 树广泛用于数据存储,例如 RocksDB.Apache AsterixDB.Bigtable.HBase.LevelDB.Apache Accumulo.SQLite4.Tarantool.W ...

最新文章

  1. 声音信标发出白噪声和发出chirp信号的对比测距说明
  2. mysql 5.6 emoji_让MySQL支持Emoji表情 mysql 5.6
  3. linux 批量删除
  4. SEO关键之密:自己创造一个关键词!
  5. 用PHP写一个最简单的解释器Part1
  6. matlab find
  7. VS2015解决方案资源管理器空白,不显示内容
  8. 小苏的Shell编程笔记之六--Shell中的函数
  9. IOS KVO与NSNotificationCenter简单使用
  10. KeyBlaze for mac(专业打字练习软件)激活版
  11. Zoj 3511 线段树
  12. JAVA 编程 练习题
  13. layer.open中使用时间控件laydate失败不显示的解决方案
  14. 无刷直流电机常用计算公式
  15. 2014计算机科学与技术学科国际学术会议ei检索目录,2014年Ei核心期刊源目录(Ei Compendex)...
  16. 隐藏APP图标并通过代码启动
  17. windows内核情景分析--窗口消息
  18. 酷睿i5 1235u参数 i5 1235u处理器怎么样
  19. Linux系统清空回收站
  20. 5GHz超频教程:技嘉Z390 AORUS MASTER主板+酷睿i9

热门文章

  1. c语言中 x20是什么意思,转义字符的问题,\ x00- \ x20是什么意思
  2. 头条python后台一面凉经
  3. 「短篇小说」灵囚 540 天
  4. 软件测试常见分辨率测试,兼容测试:常见的显示器分辨率
  5. 简洁桌面(使用Windows自带的桌面整理功能)
  6. 怎样搭建serveru ftp个人服务器
  7. r52500u学计算机,r52500u相当于i几
  8. 深度学习中优化方法——momentum、Nesterov Momentum、AdaGrad、Adadelta、RMSprop、Adam
  9. C++写入并追加内容到txt中
  10. 转贴:ubuntu Rhythmbox歌曲名乱码问题