1.1 树的概念

1、树的特性

1)一棵树中的任意两个结点有且仅有唯一的一条路径连通;

2)一棵树如果有n个结点,则它一定有n−1条边;

3)在一棵树中加一条边将会构成一个回路。

2、二叉树

1)二叉树是一种特殊的树,二叉树的特点是每个结点最多有两个儿子。

2)二叉树使用范围最广,一颗多叉树也可以转化为二叉树。

3、满二叉树

1)二叉树中每个内部节点都有两个儿子,满二叉树所有的叶节点都有相同的深度。

2)满二叉树是一棵深度为h且有2h−1个结点的二叉树。

4、完全二叉树

1)若设二叉树的高度为h,除了第h层外,其他层的结点数都达到最大个数,第h层从右向左连续 缺若干个结点,则为完全二叉树。

5、树的特点

  1. 如果一棵完全二叉树的父节点编号为K,则其左儿子的编号是2K,右儿子的结点编号为2K+1

    已知完全二叉树的总节点数为n求叶子节点个数:
            当n为奇数时:(n+1)/2
            当n为偶数时 : (n)/2

    1. 已知完全二叉树的总节点数为n求父节点个数:为:n/2

      已知完全二叉树的总节点数为n求叶子节点为2的父节点个数:
              当n为奇数时:n/2
              当n为偶数时 : n/2-1

5、如果一棵完全二叉树有N个结点,那么这棵二叉树的深度为【log2(N+1)log2(N+1)】(向上取整)

1.2 二叉树基本操作 返回顶部

参考博客: https://www.cnblogs.com/freeman818/p/7252041.html

1、生成树结构

1. 前序遍历: DBACEGF(根节点排最先,然后同级先左后右)
      2. 中序遍历: ABCDEFG (先左后根最后右)
      3. 后序遍历: ACBFGED (先左后右最后根)

#! /usr/bin/env python
# -*- coding: utf-8 -*-
class Node:def __init__(self,value=None,left=None,right=None):self.value=valueself.left=left    #左子树self.right=right  #右子树if __name__=='__main__':root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))
#! /usr/bin/env python
# -*- coding: utf-8 -*-
class Node:def __init__(self,value=None,left=None,right=None):self.value=valueself.left=left    #左子树self.right=right  #右子树def preTraverse(root):'''前序遍历'''if root==None:returnprint(root.value)preTraverse(root.left)preTraverse(root.right)if __name__=='__main__':root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))print('前序遍历:')preTraverse(root)   #  DBACEGF
#! /usr/bin/env python
# -*- coding: utf-8 -*-
class Node:def __init__(self,value=None,left=None,right=None):self.value=valueself.left=left    #左子树self.right=right  #右子树def midTraverse(root):'''中序遍历'''if root == None:returnmidTraverse(root.left)print(root.value)midTraverse(root.right)if __name__=='__main__':root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))print('中序遍历:')midTraverse(root)   #  ACBFGED
#! /usr/bin/env python
# -*- coding: utf-8 -*-
class Node:def __init__(self,value=None,left=None,right=None):self.value=valueself.left=left    #左子树self.right=right  #右子树def afterTraverse(root):'''后序遍历'''if root == None:returnafterTraverse(root.left)afterTraverse(root.right)print(root.value)if __name__=='__main__':root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))print('后序遍历:')afterTraverse(root)   #  ACBFGED

  • 前序遍历步骤推演

    前序排列原理:
    #####此时执行preTraverse(root.left) 函数
    '''
    1、第一步 root=Node(D) print D,D入栈[D]
    2、第二步 root=Node(D).left=Node(B) print B, B入栈[D,B]
    3、第三步 root=Node(B).left=Node(A) print A, A入栈[D,B,A]
    4、第四步 root=Node(A).left=None,没有进入递归,顺序执行preTraverse(root.right)
    5、第五步 Node(A).right==None,也没有进入递归,此时preTraverse(A) 函数才会正真返回,A出栈[D,B]
    6、第六步 A的上级调用函数为:preTraverse(B.left),所以接着会顺序执行preTraverse(B.right),B的左右节点访问后B出栈[D]
    7、第七步 Node(B).right==Node(C) print C,C入栈[D,C]
    8、第八步 Node(C).left==None, Node(C).right==None,访问完C的左右节点后函数返回C出栈,返回上级调用[D]
    9、第九步 此时返回上级调用执行preTraverse(D.right)=Node(E) print E,D出栈,E入栈[E]
    ''''''此时输出结果:DBACE'''
    
  • 分层打印二叉树

    #! /usr/bin/env python
    # -*- coding: utf-8 -*-
    class Node:def __init__(self,value=None,left=None,right=None):self.value=valueself.left=left    #左子树self.right=right  #右子树def layered_print( root):if not root:return []curLayer = [root]                           # 当前层的所有节点while curLayer:layerValue = []                         # 当前层的值nextLayer = []                          # 下一层的所有节点for node in curLayer:                   # 循环当前层所有节点并并获取所有value值layerValue.append(node.value)if node.left:nextLayer.append(node.left)        # 将当前层的左节点加入列表if node.right:nextLayer.append(node.right)        # 将当前层的右节点加入列表print layerValue                           # 打印当前层的值curLayer = nextLayer                      # 将循环下移一层'''
    ['D']
    ['B', 'E']
    ['A', 'C', 'G']
    ['F']
    '''if __name__=='__main__':root=Node('D',Node('B',Node('A'),Node('C')),Node('E',right=Node('G',Node('F'))))layered_print(root)
    

1.3 hash树

1、hash树描述(就是散列树)

  1. 散列树选择从2开始的连续质数来建立一个十层的哈希树。

    第一层结点为根结点,根结点下有2个结点;

    1. 第二层的每个结点下有3个结点;

      依此类推,即每层结点的子节点数目为连续的质数。

2、hash树特点

**注:**关系型数据库中,索引大多采用B/B+树来作为存储结构,而全文搜索引擎的索引则主要采用hash的存储结构,这两种数据结构有什么区别?

  1. 如果是等值查询,那么哈希索引明显有绝对优势,因为只需要经过一次算法即可找到相应的键值;
    2. 当然了,这个前提是,键值都是唯一的,如果键值不是唯一的,就需要先找到该键所在位置,然后再根据链表往后扫描,直到找到相应的数据;

​ 3. 如果是范围查询检索,这时候哈希索引就毫无用武之地了,因为原先是有序的键值,经过哈希算法后,可能变成不连续的了,就没办法再利用索引完成范围查询检索;

  1. 同理,哈希索引也没办法利用索引完成排序,以及like ‘xxx%’ 这样的部分模糊查询(这种部分模糊查询,其实本质上也是范围查询);

3、建立hash树

  1. 选择从2开始的连续质数来建立一个十层的哈希树。
    第一层结点为根结点,根结点下有2个结点;第二层的每个结点下有3个结点;

    1. 依此类推,即每层结点的子节点数目为连续的质数。到第十层,每个结点下有29个结点。

      同一结点中的子结点,从左到右代表不同的余数结果。
              例如:第二层结点下有三个子节点。那么从左到右分别代表:除3余0,除3余1,除3余2.对质数进行取余操作得到的余数决定了处理的路径。

      1. 以随机的10个数的插入为例,来图解HashTree的插入过程。

  1. 其实也可以把所有的键-值节点放在哈希树的第10层叶节点处,这第10层的满节点数就包含了所有的整数个数, 但是如果这样处理的话,所有的非叶子节点作为键-值节点的索引,这样使树结构庞大,浪费空间。

4、查找编辑

  1. 哈希树的节点查找过程和节点插入过程类似,就是对关键字用质数序列取余,根据余数确定下一节点的分叉路径,直到找到目标节点。

    如上图,最小”哈希树(HashTree)在从4G个对象中找出所匹配的对象,比较次数不超过10次,也就是说:最多属于O(10)。

    1. 在实际应用中,调整了质数的范围,使得比较次数一般不超过5次。

      也就是说:最多属于O(5),因此可以根据自身需要在时间和空间上寻求一个平衡点。

5、删除编辑

  1. 哈希树的节点删除过程也很简单,哈希树在删除的时候,并不做任何结构调整。

    只是先查到到要删除的节点,然后把此节点的“占位标记”置为false即可(即表示此节点为空节点,但并不进行物理删除)。

6、hash树优点

1)结构简单

  1. 从哈希树的结构来说,非常的简单,每层节点的子节点个数为连续的质数。
    节点可以随时创建,因此哈希树的结构是动态的,也不像某些哈希算法那样需要长时间的初始化过程。
    3. 哈希树也没有必要为不存在的关键字提前分配空间。

2)查找迅速

  1. 从算法过程我们可以看出,对于整数,哈希树层级最多能增加到10。
    此最多只需要十次取余和比较操作,就可以知道这个对象是否存在,这个在算法逻辑上决定了哈希树的优越性。

3)结构不变

  1. 从删除算法中可以看出,哈希树在删除的时候,并不做任何结构调整。

    规树结构在增加元素和删除元素的时候都要做一定的结构调整,否则他们将可能退化为链表结构,而导致查找效率的降低。

    1. 哈希树采取的是一种“见缝插针”的算法,从来不用担心退化的问题,也不必为优化结构而采取额外的操作,因此大大节约了操作时间。

7、缺点编辑

  1. 哈希树不支持排序,没有顺序特性。

    如果在此基础上不做任何改进的话并试图通过遍历来实现排序,那么操作效率将远远低于其他类型的数据结构。

8、hash索引使用范围

**总结:**哈希适用在小范围的精确查找,在列数据很大,又不需要排序,不需要模糊查询,范围查询时有用

1、hash索引仅满足“=”、“IN”和“<=>”查询,不能使用范围查询因为hash索引比较的是经常hash运算之后的hash值,因此只能进行等值的过滤,不能基于范围的查找,因为经过hash算法处理后的hash值的大小关系,并不能保证与处理前的hash大小关系对应。

2、hash索引无法被用来进行数据的排序操作由于hash索引中存放的都是经过hash计算之后的值,而hash值的大小关系不一定与hash计算之前的值一样,所以数据库无法利用hash索引中的值进行排序操作。

3、对于组合索引,Hash 索引在计算 Hash 值的时候是组合索引键合并后再一起计算 Hash 值,而不是单独计算 Hash 值,所以通过组合索引的前面一个或几个索引键进行查询的时候,Hash 索引也无法被利用。

4、Hash 索引遇到大量Hash值相等的情况后性能并不一定就会比B-Tree索引高。对于选择性比较低的索引键,如果创建 Hash 索引,那么将会存在大量记录指针信息存于同一个 Hash 值相关联。这样要定位某一条记录时就会非常麻烦,会浪费多次表数据的访问,而造成整体性能低下。

1.4 B-tree 和 B+tree 返回顶部

参考博客: https://blog.csdn.net/chuixue24/article/details/80027689

1、一棵m阶的B-Tree有如下特性

  1. 每个节点最多有m个孩子。 
    除了根节点和叶子节点外,其它每个节点至少有Ceil(m/2)个孩子(Ceil返回大于或者等于指定表达式的最小整数)。 
    3. 若根节点不是叶子节点,则至少有2个孩子 
    所有叶子节点都在同一层,且不包含其它关键字信息 
    5. 每个非终端节点包含n个关键字信息(P0,P1,…Pn, k1,…kn) 
    关键字的个数n满足:ceil(m/2)-1 <= n <= m-1 
    7. ki(i=1,…n)为关键字,且关键字升序排序。 
    Pi(i=1,…n)为指向子树根节点的指针。P(i-1)指向的子树的所有节点关键字均小于ki,但都大于k(i-1)

2、以一个3阶的B-Tree举例

  1. 每个节点占用一个盘块的磁盘空间,一个节点上有两个升序排序的关键字和三个指向子树根节点的指针,指针存储的是子节点所在磁盘块的地址。

    两个关键词划分成的三个范围域对应三个指针指向的子树的数据的范围域。

    1. 以根节点为例,关键字为17和35,P1指针指向的子树的数据范围为小于17,P2指针指向的子树的数据范围为17~35,P3指针指向的子树的数据范围为大于35。

'''模拟查找关键字29的过程:'''
# 根据根节点找到磁盘块1,读入内存。【磁盘I/O操作第1次】
# 比较关键字29在区间(17,35),找到磁盘块1的指针P2。
# 根据P2指针找到磁盘块3,读入内存。【磁盘I/O操作第2次】
# 比较关键字29在区间(26,30),找到磁盘块3的指针P2。
# 根据P2指针找到磁盘块8,读入内存。【磁盘I/O操作第3次】
# 在磁盘块8中的关键字列表中找到关键字29。

3、B+tree特点

  1. B+Tree是在B-Tree基础上的一种优化,使其更适合实现外存储索引结构,InnoDB存储引擎就是用B+Tree实现其索引结构。

    从上一节中的B-Tree结构图中可以看到每个节点中不仅包含数据的key值,还有data值。

    1. 而每一个页的存储空间是有限的,如果data数据较大时将会导致每个节点(即一个页)能存储的key的数量很小

      当存储的数据量很大时同样会导致B-Tree的深度较大,增大查询时的磁盘I/O次数,进而影响查询效率。

      1. 在B+Tree中,所有数据记录节点都是按照键值大小顺序存放在同一层的叶子节点上,而非叶子节点上只存储key值信息,这样可以大大加大每个节点存储的key值数量,降低B+Tree的高度。

6. B+Tree相对于B-Tree有几点不同:

1)非叶子节点只存储键值信息。
          2)所有叶子节点之间都有一个链指针。
          3)数据记录都存放在叶子节点中。

4、B+tree(以每个节点可存4个建值及指针信息为例)

  1. B+Tree的非叶子节点只存储键值信息,假设每个磁盘块能存储4个键值及指针信息

    在B+Tree上有两个头指针,一个指向根节点,另一个指向关键字最小的叶子节点,而且所有叶子节点(即数据节点)之间是一种链式环结构。

    1. 因此可以对B+Tree进行两种查找运算:一种是对于主键的范围查找和分页查找,另一种是从根节点开始,进行随机查找。

5、B+Tree优点

  1. InnoDB存储引擎中页的大小为16KB,一般表的主键类型为INT(占用4个字节)或BIGINT(占用8个字节),指针类型也一般为4或8个字节

    也就是说一个页(B+Tree中的一个节点)中大概存储16KB/(8B+8B)=1K个键值(这里的K取值为〖10〗^3)。

    1. 也就是说一个深度为3的B+Tree索引可以维护10^3 * 10^3 * 10^3 = 10亿 条记录。

说明:

实际情况中每个节点可能不能填充满,因此在数据库中,B+Tree的高度一般都在2~4层。

mysql的InnoDB存储引擎在设计时是将根节点常驻内存的,也就是说查找某一键值的行记录时最多只需要1~3次磁盘I/O操作。

6、B-tree与哈希索引的区别

1)B-tree的索引:

是按照顺序存储的,所以,如果按照B-tree索引,可以直接返回,带顺序的数据,但这个数据只是该索引列含有的信息。因此是顺序I/O

适用于: 精确匹配 、范围匹配 、最左匹配

2)Hash索引:

索引列值的哈希值+数据行指针:因此找到后还需要根据指针去找数据,造成随机I/O

适合: 精确匹配

不适合: 模糊匹配 、范围匹配 、不能排序

树结构的所有特性(二叉树 完全二叉树 红黑树 btree b+tree)相关推荐

  1. 真c++ 从二叉树到红黑树(6)之红黑树RedBlack

      此文章为从二叉树到红黑树系列文章的第六节,主要介绍介绍红黑树,相信,有了之前BST,AVL和B树的铺垫,你会很快地理解红黑树.但红黑树的情况也十分复杂,因此,推荐分两天来看红黑树.一天看插入,一天 ...

  2. 二叉树 平衡二叉树 红黑树_迅捷树,二叉树

    二叉树 平衡二叉树 红黑树 In this tutorial, we'll be discussing the Data Structure Trees and implement it using ...

  3. 【Mysql索引】二叉树、红黑树、B树、B+树

    [Mysql索引]二叉树.红黑树.B树.B+树 (1)哈希表 (2)二叉树的弊端的演示: (3)红黑树的插入演示: (4)B树的演示 (5)B+树的演示(叶子加指针:支持范围查找) (5.1)借着学习 ...

  4. 真c++ 从二叉树到红黑树(4)之二叉平衡搜索树AVL

      此文章为从二叉树到红黑树系列文章的第四节,主要介绍介绍二叉平衡搜索树AVL,当你理解了AVL,红黑树你就理解了一半了! 文章目录 一.前面文章链接~(点击右边波浪线可以返回目录) 二.由BST引入 ...

  5. 真c++ 从二叉树到红黑树(1)之二叉树节点类及遍历详解

      此文章为从二叉树到红黑树系列文章的第一节,主要介绍写这系列文章的起因,致谢邓老师,解释二叉树节点类和二叉树的四种遍历写法(包括递归和迭代写法) 文章目录 一.前言与致谢~(点击右边波浪线可以返回目 ...

  6. 算法笔记:二叉树,红黑树

    目录 <树>知识点: 二叉查找,搜索,排序树BST: 平衡二叉树:AVL树: 平衡二叉树的目的: 平衡二叉树的常用方法: 红黑树:RB Tree 红黑树性质: 旋转和颜色变化的规律: 红黑 ...

  7. MySQL索引数据结构二叉树、红黑树、B-Tree、B+Tree、Hash

    索引:帮助MySQL高效获取数据的有序的数据结构. 假设我们有一张表table,包含Clo1和Clo2两个字段 内存地址 Clo1 Clo2 0x07 1 36 0x5A 2 20 0x7A 3 80 ...

  8. 真c++ 从二叉树到红黑树(3)之二叉搜索树BST

      此文章为从二叉树到红黑树系列文章的第三节,主要介绍介绍二叉搜索树BST,为AVL和RedBlack打下基础 文章目录 一.前面文章链接~(点击右边波浪线可以返回目录) 二.二叉搜索树BST的定义~ ...

  9. 真c++ 从二叉树到红黑树(2)之二叉树基类

      此文章为从二叉树到红黑树系列文章的第二节,主要介绍介绍二叉树抽象基类的基本组成.为后续BST,AVL和RedBlack做好铺垫 文章目录 一.前面文章链接~(点击右边波浪线可以返回目录) 二.二叉 ...

最新文章

  1. java基础系列:集合总结(4)
  2. js 正则是否包含某些字符串_我从Vue源码中学到的一些JS编程技巧
  3. Iframe难点备忘
  4. java应用程序的执行起点是什么方法_Java应用程序的执行起点是____________方法。(3.0分)_学小易找答案...
  5. linux系统安装xhprof,LNMP部署laravel与xhprof安装使用
  6. linux系统下树莓派拍照,如何在树莓派上使用图片特效
  7. linux standby模式,搭建11g 单机 linux standby 操作文档
  8. python和java选择哪个-Java、Python你会选择哪个?老男孩python
  9. [转载] numpy.bincount介绍以及巧妙计算分类结果中每一类预测正确的个数
  10. mysql key键_mysql KEY是什么键?有什么作用?
  11. 仿站和模板建站的区别_快速仿站工具,全能扒站助手
  12. 扩增子图表解读2散点图:组间整体差异分析(Beta多样性)
  13. 求圆周长,圆面积,圆球表面积、圆球体积,圆柱体积
  14. U盘系统、格式化等问题的解决办法
  15. 海贼王(pirate)(LCA)
  16. 匿名发脉脉的拼多多员工,是如何被发现的?背后真相令人发指...
  17. jQuery拖拽图片拼图验证插件
  18. 开发一个app,需要申请哪些,费用是多少?
  19. Chrome 谷歌游览器快捷键(Shortcut)
  20. UMLChina建模答题赛第二赛季最终排行榜-刘京城、第五元素、龙龙

热门文章

  1. python3计算行列式的值(运用拉普拉斯展开法递归实现)
  2. 机器学习 scikit-learn GridSearchCV scoring 参数设置
  3. 操作系统实验二——时间片轮转调度算法(RR算法)(新进程放队首和队尾两种C++实现)
  4. Ps经典实例教程3000例
  5. 用 Swift、Foursquare API 和 Realm 創建一個咖啡屋 App
  6. 2021-基于深度学习的人脸检测综述文献-摘要
  7. 【Lesson 12】中古风五声音阶——和弦使用技巧
  8. 将JSON数组转化为List集合
  9. Python学习,用python-webdriver实现自动填表
  10. java微信摇一摇_微信摇一摇功能实现