为什么要有红黑树

想必大家对二叉树搜索树都不陌生,首先看一下二叉搜索树的定义:

二叉搜索树(Binary Search Tree),或者是一棵空树,或者是具有下列性质的二叉树: 若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值; 若它的右子树不空,则右子树上所有结点的值均大于它的根结点的值; 它的左、右子树也分别为二叉排序树。

从理论上来说,二叉搜索树的查询、插入和删除一个节点的时间复杂度均为O(log(n)),已经完全可以满足我们的要求了,那么为什么还要有红黑树呢?

我们来看一个例子,向二叉搜索树中依次插入(1,2,3,4,5,6),插入之后是这样的

可以看到,在这种情况下,二叉搜索树退化成了链表!!!这时候查询、插入和删除一个元素的时候,时间复杂度变成了O(n),显然这是不能接受的。出现这种情况情况的原因是二叉搜索树没有自平衡的机制,所以就有了平衡二叉树的概念。

平衡二叉树(Balanced Binary Tree)具有以下性质:它是一棵空树或它的左右两个子树的高度差的绝对值不超过1,并且左右两个子树都是一棵平衡二叉树。

还是刚刚的例子,假如我们用平衡二叉树来实现的话,插入完元素后应该是下面这样的(不唯一)

平衡二叉树保证了在最差的情况下,二叉树依然能够保持绝对的平衡,即左右两个子树的高度差的绝对值不超过1。但是这又会带来一个问题,那就是平衡二叉树的定义过于严格,导致每次插入或者删除一个元素之后,都要去维护二叉树整体的平衡,这样产生额外的代价又太大了。二叉搜索树可能退化成链表,而平衡二叉树维护平衡的代价开销又太大了,那怎么办呢?这就要谈到“中庸之道”的智慧了。说白了就是把平衡的定义适当放宽,不那么严格,这样二叉树既不会退化成链表,维护平衡的开销也可以接受。没错,这就是我们要谈的红黑树了。

首先看一下红黑树的定义:

红黑树是一种含有红黑结点并能自平衡的二叉查找树。它必须除了满足二叉搜索树的性质外,还要满足下面的性质:

性质1:每个节点要么是黑色,要么是红色。

性质2:根节点是黑色。

性质3:每个叶子节点(NIL)是黑色。

性质4:每个红色结点的两个子结点一定都是黑色。

性质5:任意一结点到每个叶子结点的路径都包含数量相同的黑结点。

这就是红黑树的五条性质。我相信很多人都看到过,能背下来的也不在少数,但是真正理解为什么要这样定义的恐怕就不多了。下面就从2-3树的角度来谈谈红黑树的定义。

从2-3树来看红黑树

一般我们接触最多的是二叉树,也就是一个父节点最多有两个子节点。2-3树与二叉树的不同之处在于,一个父节点可以有两个子节点,也可以有三个子节点,并且其也满足类似二叉搜索树的性质。还有最重要的,2-3树的所有叶子节点都在同一层,且最后一层不能有空节点,类似于满二叉树。

我们依次插入10,9,8,7,6,5,4,3,2,1来看一下2-3树是如何进行自平衡的。

2-3树在插入元素之前首先要进行一次未命中的查找,然后将元素插入叶子节点中,之后再进行平衡操作,下面具体说明。

首先插入10,如下图

然后插入9,9小于10,2-3树在插入时要将9融入10这个叶子节点中(当然也是根节点),融合完成后如下:

这是一个3节点,不用执行平衡操作。2-3树中把有两个元素,三个子节点的节点称为3节点,把有一个元素,两个子节点的的节点称为2节点。

接着插入8,插入8的时候同样要先融入叶子节点中,如下图左侧所示

8融入叶子节点后,该结点便拥有了3个元素,不满足2-3树的定义,这时就要把3节点进行分裂,即把左侧和右侧的元素分裂为2节点,而中间的元素抽出,继续融入其父节点,在这里便成为了一个根节点。

继续插入7,如下

插入后,各个节点都满足2-3树的定义,不需要进行平衡操作。

接着插入6,还是首先找到叶子节点,然后将其融入,如下图左侧所示

插入后6、7、8三个元素所在的叶子节点不再满足2-3树的定义,需要进行分裂,即抽出元素7融入父节点,6和8分裂为7的左右子节点。

接着插入5,如下图所示,同样不需要进行平衡操作

接着插入4,还是首先找到叶子节点,然后将其融入,如下图左侧所示

插入后4、5、6三个元素所在的叶子节点不再满足2-3树的定义,需要进行分裂,即抽出元素5融入父节点,4和6分裂为5的左右子节点。5融入父节点后,该结点便有了5、7、9三个元素,因而需要继续分裂,元素7成为新的根节点,5和9成为7的左右子节点。

接着插入3,3融入4所在的叶子节点中,不需要进行平衡操作

接着插入2,还是首先找到叶子节点,然后将其融入,如下图左侧所示

插入后2、3、4三个元素所在的叶子节点不再满足2-3树的定义,需要进行分裂,即抽出元素3融入父节点,2和4分裂为3的左右子节点,3融入5所在的父节点中。

最后插入2,同样先找到叶子节点,然后将其融入,如下图所示

至此,我们便完成了在2-3树中依次插入10,9,8,7,6,5,4,3,2,1,并且2-3树始终维护着平衡。怎么样,是不是很神奇。

再看红黑树

那么红黑树与2-3树有什么关系呢?现在我们对2-3树进行改造,改造成一个二叉树。怎么改造呢?对于2节点,保持不变;对于3节点,我们首先将3节点中左侧的元素标记为红色,如下图2所示。

然后我们将其改造成图3的形式;再将3节点的位于中间的子节点的父节点设置为父节点中那个红色的节点,如图4的所示;最后我们将图4的形式改为二叉树的样子,如图5所示。图5是不是很熟悉,没错,这就是我们常常提到的大名鼎鼎的红黑树了。

下面我们回过头再看下红黑树的五条性质。

性质1:每个节点要么是黑色,要么是红色。

2-3树中存在2节点和3节点,3节点中左侧的元素便是红色节点,而其他的节点便是黑色节点。

性质2:根节点是黑色。

在2-3树中,根节点只能是2节点或者3节点,2节点与3节点在红黑树中的等价形式,如下图所示

显然,无论是哪种情况,根节点都是黑色的。

性质3:每个叶子节点(NIL)是黑色。

这里的叶子节点不是指左右子树为空的那个叶子节点,而是指节点不存在子节点或者为空节点被称作叶子节点。在性质2中我们讨论的根节点是黑色的都是讨论根节点不为空的情况,若红黑树是一个空树,那么根节点自然也是空的叶子节点,这时候叶子节点便必然是黑色的。

性质4:每个红色结点的两个子结点一定都是黑色。

还是从2-3树的角度来理解,红色节点对应2-3树中3节点左侧的元素,那么它的子节点要么是2节点,要么是3节点。无论是2节点还是3节点对应的节点颜色都是黑色的,这在性质2时已经讨论了。

性质5:任意一结点到每个叶子结点的路径都包含数量相同的黑结点。

性质5应该是红黑树最重要的一条性质了。2-3树是一颗绝对平衡的树,即2-3树中任意一个节点出发,到达叶子节点后所经过的节点数都是一样的。那么对应到红黑树呢?2-3树中2节点对应到红黑树便是一个黑色的节点,而3节点对应到红黑树是一个红色节点和一个黑色节点。所以,无论是2节点还是3节点,在红黑树中都会对应一个黑色节点。那么2-3树中的绝对平衡,在红黑树中自然就是任意一结点到每个叶子结点的路径都包含数量相同的黑结点了。

相信大家现在已经对红黑树的五条性质有了更加深刻的体会了。那么我们再看下红黑树维持平衡的三种操作,即变色、左旋、右旋怎么理解呢?

首先看一下变色,以下图为例

在2-3树中插入节点3后,便不再满足2-3树的定义,需要进行分解,将元素2抽出作为1和3的父节点,然后2继续向上融合。

对应到红黑树中就是,首先插入节点3,在红黑树中新插入的节点默认为红色,然后不满足定义,所以需要进行分解,分解后各个节点都为2节点,所以变为黑色。而2节点需要继续向上融合,故要变成红色。

接着看一下右旋转,以下图为例

插入元素1后,进行右旋转操作,首先把2节点与3节点断开连接,同时把2与2的右子树断开连接,然后把2的右子树连接至3的左子树位置,不会违背二分搜索树的性质,然后再把3连接至2的右子树位置。最后还要改变对应节点的颜色,即把2节点的颜色改为原来3节点的黑色,把3节点的颜色改为原来2节点的红色。

接着看一下左旋转,与右旋转类似,以下图为例

插入元素3后,进行左旋转操作,首先把2节点与3节点断开连接,同时把3与3的左子树断开连接,然后把3的左子树连接至2的右子树位置,不会违背二分搜索树的性质,然后再把2连接至3的左子树位置。最后还要改变对应节点的颜色,即把2节点的颜色改为原来3节点的红色,把3节点的颜色改为原来2节点的黑色。

写在最后

最后需要说的是,本文中提到的红黑树是一种特殊的红黑树——左倾红黑树,即红色节点都是父节点的左子树,其实按照红黑树的定义不必这样。只要满足红黑树的五条性质,就是红黑树,比如完全可以实现右倾红黑树等等,希望大家不要有误解。

更多关于红黑树的知识,比如红黑树的插入、删除操作,限于篇幅,本文不再介绍,有兴趣的还是推荐大家阅读《算法4》或者《算法导论》。

为什么红黑树查询快_为什么要有红黑树?什么是红黑树?画了20张图,看完这篇你就明白了...相关推荐

  1. 为什么红黑树查询快_目前最详细的红黑树原理分析(大量图片+过程推导!!!)...

    一.为什么要有红黑树这种数据结构? 我们知道ALV树是一种严格按照定义来实现的平衡二叉查找树,所以它查找的效率非常稳定,为O(log n),由于其严格按照左右子树高度差不大于1的规则,插入和删除操作中 ...

  2. 为什么红黑树查询快_红黑树为什么比二叉查找树更高效

    平衡二叉查找树 什么是平衡二叉查找树 二叉树中任意一个节点的左右子树的高度相差不能大于 1,这是一种较为严格的定义,但是实际工程中使用,不会要求这么严格,只要实际的高度不比 log2(n)大很多,能达 ...

  3. 为什么红黑树查询快_为什么工程中都喜欢用红黑树,而不是其他平衡二叉查找树呢?...

    前言 二叉查找树是最常用的一种二叉树,它支持快速插入.删除.查找操作,各个操作的时间复杂度跟树的高度成正比,理想情况下,时间复杂度是O(logn). 不过,二叉查找树在频繁的动态更新过程中,可能会出现 ...

  4. 为什么有红黑树?什么是红黑树?看完这篇你就明白了

    为什么要有红黑树 想必大家对二叉树搜索树都不陌生,首先看一下二叉搜索树的定义: 二叉搜索树(Binary Search Tree),或者是一棵空树,或者是具有下列性质的二叉树:若它的左子树不空,则左子 ...

  5. 为什么要有红黑树?什么是红黑树?画了20张图,看完这篇你就明白了

    为什么要有红黑树 想必大家对二叉树搜索树都不陌生,首先看一下二叉搜索树的定义: 二叉搜索树(Binary Search Tree),或者是一棵空树,或者是具有下列性质的二叉树: 若它的左子树不空,则左 ...

  6. 为什么红黑树查询快_为什么红黑树的效率比较高

    红黑树属于平衡二叉树.它不严格是因为它不是严格控制左.右子树高度或节点数之差小于等于1,但红黑树高度依然是平均log(n),且最坏情况高度不会超过2log(n). 红黑树(red-black tree ...

  7. c++ 不插入重复元素但也不排序_面试官爱问的 10 大经典排序算法,20+ 张图来搞定...

    (给算法爱好者加星标,修炼编程内功) 作者:技术让梦想更伟大 / 李肖遥 (本文来自作者投稿) 冒泡排序 简介 冒泡排序是因为越小的元素会经由交换以升序或降序的方式慢慢浮到数列的顶端,就如同碳酸饮料中 ...

  8. 家里宽带628连不上_连不上无线网络?到底是路由器还是电脑的“锅”,看完这篇就知道...

    我们在家娱乐或者公司办公,现在为了便携考虑,通常都是会用移动设备,不论是手机还是笔记本,似乎在室内都是需要一个良好的无线网络环境.但是实际使用的时候,相信大家也跟我一样,经常遇到路由器连不上网,电脑网 ...

  9. 格力机器人图解_格力空调拆机图解,这张图看完立马成专家

    摘要:格力空调室内机拆解 格力空调器室内机是通过电路板及各电器部件的连接实现对制冷循环的控制,因此,学习空调器室内机的维修,首先应掌握空调器室内机的拆卸方法. 如图12-1所示... 格力空调室内机拆 ...

  10. linux c 将虚拟地址转化为物理地址_面试不懂 Linux 内存管理?我用 20 张图给你讲明白...

    微信搜索公众号「 后端技术学堂 」回复「1024」获取50本计算机电子书,回复「学习路线」获取超详细后端技术学习路线思维导图,文章每周持续更新,我们下期见! 大家好,我是柠檬哥. 分享编程学习,助力程 ...

最新文章

  1. 【FFmpeg】打印日志函数分析(可以根据不同级别打印不同颜色的日志)
  2. h5自定义相机界面_MIUI 12全新相机发布,多款相机图标进行重绘,可升级机型一览...
  3. Oracle ORA-00903:表名无效
  4. java中的异常处理语句_Java中实现异常处理的基础知识
  5. Android 数据库综述(一) 数据库片的升级与数据的迁移操作
  6. IntelliJ IDEA For Mac 的破解方法
  7. 七周成为数据分析师 第四周:数据可视化
  8. Mac电脑 如何在任意目录快速打开终端并定位到当前目录
  9. 数据挖掘 文本分类(二)搜集中文语料库与ICTCLAS分词
  10. 【调剂】济南大学人工智能与科学计算课题组拟接收计算机专业 (学术型) 硕士生调剂-2021预宣传...
  11. 开源社已加入群聊,思否 AIGC Hackathon 扩列
  12. 计算机网路——163邮箱授权码
  13. 异常解决:在实体引用中, 实体名称必须紧跟在 ‘‘ 后面
  14. datagridview 获取选中行号 数据,判断是不是选中了一行
  15. 阿米洛 varlimo 机械键盘 cmd (win) 键锁定
  16. C++条件运算符(三目运算符+逗号运算符)案例实练
  17. Learn from Architects of Buildings
  18. 微信小程序使用字体图标的方法iconfont
  19. 自行实现ONVIF协议网络摄像机(IPC)开发(0):专栏开篇
  20. 计算机视觉实习生面试经验(微软/腾讯(AI Lab优图)/阿里巴巴)

热门文章

  1. Zotero批量下载知网文献
  2. 设z服从标准正态分布_设Z服从标准正态分布,则P(Z1.33)=
  3. SAP CO-PA(盈利能力分析)
  4. 实用代码、链接、工具汇总
  5. ERROR Error validating install location: Distro ‘rhe17‘ does not exist in our dictionary
  6. 家用带宽-路由器的选择
  7. 心不隔离|愿春早来,花枝春满
  8. 学习大数据参加培训班,大概需要多长时间?
  9. vnc远程连接,5个步骤教你如何轻松实现vnc远程连接
  10. 高效能人士的七个习惯读后感与总结概括-(第六章)