2019独角兽企业重金招聘Python工程师标准>>>

程序设计过程中,我们常常用树形结构来表征某些数据的关联关系,如企业上下级部门、栏目结构、商品分类等等,通常而言,这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库,都是以二维表的形式记录存储数据信息,因此是不能直接将Tree存入DBMS,设计合适的Schema及其对应的CRUD算法是实现关系型数据库中存储树形结构的关键。

理想中树形结构应该具备如下特征:数据存储冗余度小、直观性强;检索遍历过程简单高效;节点增删改查CRUD操作高效。无意中在网上搜索到一种很巧妙的设计,原文是英文,看过后感觉有点意思,于是便整理了一下。本文将介绍两种树形结构的Schema设计方案:一种是直观而简单的设计思路,另一种是基于左右值编码的改进方案。

一、基本数据

本文列举了一个食品族谱的例子进行讲解,通过类别、颜色和品种组织食品,树形结构图如下:

二、继承关系驱动的Schema设计

对树形结构最直观的分析莫过于节点之间的继承关系上,通过显示地描述某一节点的父节点,从而能够建立二维的关系表,则这种方案的Tree表结构通常设计为:{Node_id,Parent_id},上述数据可以描述为如下图所示:

这种方案的优点很明显:设计和实现自然而然,非常直观和方便。缺点当然也是非常的突出:由于直接地记录了节点之间的继承关系,因此对Tree的任何CRUD操作都将是低效的,这主要归根于频繁的“递归”操作,递归过程不断地访问数据库,每次数据库IO都会有时间开销。当然,这种方案并非没有用武之地,在Tree规模相对较小的情况下,我们可以借助于缓存机制来做优化,将Tree的信息载入内存进行处理,避免直接对数据库IO操作的性能开销。

三、基于左右值编码的Schema设计

在基于数据库的一般应用中,查询的需求总要大于删除和修改。为了避免对于树形结构查询时的“递归”过程,基于Tree的前序遍历设计一种全新的无递归查询、无限分组的左右值编码方案,来保存该树的数据。

第一次看见这种表结构,相信大部分人都不清楚左值(Lft)和右值(Rgt)是如何计算出来的,而且这种表设计似乎并没有保存父子节点的继承关系。但当你用手指指着表中的数字从1数到18,你应该会发现点什么吧。对,你手指移动的顺序就是对这棵树进行前序遍历的顺序,如下图所示。当我们从根节点Food左侧开始,标记为1,并沿前序遍历的方向,依次在遍历的路径上标注数字,最后我们回到了根节点Food,并在右边写上了18。

依据此设计,我们可以推断出所有左值大于2,并且右值小于11的节点都是Fruit的后续节点,整棵树的结构通过左值和右值存储了下来。然而,这还不够,我们的目的是能够对树进行CRUD操作,即需要构造出与之配套的相关算法。

四、树形结构CRUD算法

(1)获取某节点的子孙节点

只需要一条SQL语句,即可返回该节点子孙节点的前序遍历列表,以Fruit为例:SELECT* FROM Tree WHERE Lft BETWEEN 2 AND 11 ORDER BY Lft ASC。查询结果如下所示:

那么某个节点到底有多少的子孙节点呢?通过该节点的左、右值我们可以将其子孙节点圈进来,则子孙总数 = (右值 – 左值– 1) / 2,以Fruit为例,其子孙总数为:(11 –2 – 1) / 2 = 4。同时,为了更为直观地展现树形结构,我们需要知道节点在树中所处的层次,通过左、右值的SQL查询即可实现,以Fruit为例:SELECTCOUNT(*) FROM Tree WHERE Lft <= 2 AND Rgt >=11。为了方便描述,我们可以为Tree建立一个视图,添加一个层次数列,该列数值可以写一个自定义函数来计算,函数定义如下:

CREATE FUNCTION dbo.CountLayer
(@node_id int
)
RETURNS int
AS
begindeclare @result intset @result = 0declare @lft intdeclare @rgt intif exists(select Node_id from Tree where Node_id = @node_id)beginselect @lft = Lft, @rgt = Rgt from Tree where node_id = @node_idselect @result = count(*) from Tree where Lft <= @lft and Rgt >= @rgtendreturn @result
end
GO

基于层次计算函数,我们创建一个视图,添加了新的记录节点层次的数列:

CREATE VIEW dbo.TreeView
AS
SELECT Node_id, Name, Lft, Rgt, dbo.CountLayer(Node_id) AS Layer FROM dbo.Tree ORDER BY Lft
GO

创建存储过程,用于计算给定节点的所有子孙节点及相应的层次:

CREATE PROCEDURE [dbo].[GetChildrenNodeList]
(@node_id int
)
AS
declare @lft int
declare @rgt int
if exists(select Node_id from Tree where node_id = @node_id)beginselect @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_idselect * from TreeView where Lft between @lft and @rgt order by Lft ASCend
GO

现在,我们使用上面的存储过程来计算节点Fruit所有子孙节点及对应层次,查询结果如下:

从上面的实现中,我们可以看出采用左右值编码的设计方案,在进行树的查询遍历时,只需要进行2次数据库查询,消除了递归,再加上查询条件都是数字的比较,查询的效率是极高的,随着树规模的不断扩大,基于左右值编码的设计方案将比传统的递归方案查询效率提高更多。当然,前面我们只给出了一个简单的获取节点子孙的算法,真正地使用这棵树我们需要实现插入、删除同层平移节点等功能。

(2)获取某节点的族谱路径

假定我们要获得某节点的族谱路径,则根据左、右值分析只需要一条SQL语句即可完成,以Fruit为例:SELECT* FROM Tree WHERE Lft < 2 AND Rgt > 11 ORDER BY Lft ASC ,相对完整的存储过程:

CREATE PROCEDURE [dbo].[GetParentNodePath]
(@node_id int
)
AS
declare @lft int
declare @rgt int
if exists(select Node_id from Tree where Node_id = @node_id)beginselect @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_idselect * from TreeView where Lft < @lft and Rgt > @rgt order by Lft ASCend
GO

(3)为某节点添加子孙节点

    假定我们要在节点“Red”下添加一个新的子节点“Apple”,该树将变成如下图所示,其中红色节点为新增节点。


仔细观察图中节点左右值变化,相信大家都应该能够推断出如何写SQL脚本了吧。我们可以给出相对完整的插入子节点的存储过程:

CREATE PROCEDURE [dbo].[AddSubNode]
(@node_id int,@node_name varchar(50)
)
AS
declare @rgt int
if exists(select Node_id from Tree where Node_id = @node_id)beginSET XACT_ABORT ONBEGIN TRANSCTIONselect @rgt = Rgt from Tree where Node_id = @node_idupdate Tree set Rgt = Rgt + 2 where Rgt >= @rgtupdate Tree set Lft = Lft + 2 where Lft >= @rgtinsert into Tree(Name, Lft, Rgt) values(@node_name, @rgt, @rgt + 1)COMMIT TRANSACTIONSET XACT_ABORT OFFend
GO

(4)删除某节点

如果我们想要删除某个节点,会同时删除该节点的所有子孙节点,而这些被删除的节点的个数为:(被删除节点的右值 – 被删除节点的左值+ 1) / 2,而剩下的节点左、右值在大于被删除节点左、右值的情况下会进行调整。来看看树会发生什么变化,以Beef为例,删除效果如下图所示。


 则我们可以构造出相应的存储过程:

CREATE PROCEDURE [dbo].[DelNode]
(@node_id int
)
AS
declare @lft int
declare @rgt int
if exists(select Node_id from Tree where Node_id = @node_id)beginSET XACT_ABORT ONBEGIN TRANSCTIONselect @lft = Lft, @rgt = Rgt from Tree where Node_id = @node_iddelete from Tree where Lft >= @lft and Rgt <= @rgtupdate Tree set Lft = Lft – (@rgt - @lft + 1) where Lft > @lftupdate Tree set Rgt = Rgt – (@rgt - @lft + 1) where Rgt > @rgtCOMMIT TRANSACTIONSET XACT_ABORT OFFend
GO

五、总结

我们可以对这种通过左右值编码实现无限分组的树形结构Schema设计方案做一个总结:

(1)优点:在消除了递归操作的前提下实现了无限分组,而且查询条件是基于整形数字的比较,效率很高。

(2)缺点:节点的添加、删除及修改代价较大,将会涉及到表中多方面数据的改动。

当然,本文只给出了几种比较常见的CRUD算法的实现,我们同样可以自己添加诸如同层节点平移、节点下移、节点上移等操作。有兴趣的朋友可以自己动手编码实现一下,这里不在列举了。值得注意的是,实现这些算法可能会比较麻烦,会涉及到很多条update语句的顺序执行,如果顺序调度考虑不周详,出现Bug的话将会对整个树形结构表产生惊人的破坏。因此,在对树形结构进行大规模修改的时候,可以采用临时表做中介,以降低代码的复杂度,同时,强烈推荐在做修改之前对表进行完整备份,以备不时之需。在以查询为主的绝大多数基于数据库的应用系统中,该方案相比传统的由父子继承关系构建的数据库Schema更为适用。

转载于:https://my.oschina.net/u/3647620/blog/1552319

数据库学习,树形结构的数据库表Schema设计方案相关推荐

  1. 数据库学习:高并发数据库设计

    数据库学习:高并发数据库设计 随着乐视硬件抢购的不断升级,乐视集团支付面临的请求压力百倍乃至千倍的暴增.作为商品购买的最后一环,保证用户快速稳定的完成支付尤为重要.所以在15年11月,我们对整个支付系 ...

  2. mysql关系型数据库生成树形结构,Layui页面渲染树型结构图(详细)

    文章目录 一.学使用DTree 上代码(详细说明注释见) 引入结构 说明 dataFormat:"list" 二.使用MySQL查询结果 说明 三.效果展示 总结 # 前言 项目使 ...

  3. 数据库学习总结(一)——认识数据库

    认识数据库 一.数据库概述 二.数据库的特点 三.MySQL数据库管理系统的安装和使用 所有数据库学习总结文章均是根据B站尚硅谷视频总结而来,视频链接如下: https://www.bilibili. ...

  4. 数据结构学习——树形结构之递归遍历二叉树

    目录 一. 什么是二叉树 二. 二叉树分类 2.1.完全二叉树 2.2.满二叉树 2.3.扩充二叉树 2.4.平衡二叉树 三. 二叉树的应用场景 四. 遍历方式 五. 为什么要研究遍历 六. 前序遍历 ...

  5. 巨杉数据库学习笔记+巨杉数据库实操项目实践

    @TOC巨杉数据库学习笔记+项目实践心得 SequoialDB简介 SequoiaDB 巨杉数据库是一款金融级分布式数据库,主要面对高并发实时处理型场景提供高性能.可靠稳定以及无限水平扩展的数据库服务 ...

  6. SQL 数据库 学习 003 什么是数据库? 为什么需要数据库?是不是所有的软件都是用Sql Server?

    什么是数据库? 为什么需要数据库? 是不是所有的软件都是用Sql Server? 我的电脑系统: Windows 10 64位 使用的SQL Server软件: SQL Server 2014 Exp ...

  7. 【数据库学习笔记】——创建数据库文件

    目录 1.数据库基础知识 2.创建数据库文件 1.数据库基础知识 什么是数据库?--数据库是存放多个数据表的仓库,数据表可以理解为是二维数组 如上表所示,每个表由行列组成: 字段:每一列称之为一个字段 ...

  8. 数据库树状结构的关系表的删除方案

    所谓的树状结构的关系,即是记录之间有id,parentId关系的数据.场景是这样的:业务中用到了一张分享表,表里的主要字段有分享人,和被分享人,以及分享任务ID,可以通过一系列的分享构造成树状的结构, ...

  9. 数据库学习 - create table(创建表)

    创建table 简单语法形式: create table 表名(列名 数据类型[primary key|unique] [not null] [,列名 数据类型[not null],...]); &q ...

最新文章

  1. 9成P2P平台面临出局,千亿资本何去何从?
  2. 整数阶贝塞尔函数c语言,第二类整数阶贝塞尔函数(诺伊曼函数)
  3. 谈Objective-C Block的实现
  4. 拉取远程分支_git clone切换分支步骤,代理设置,作者信息设置
  5. camera(9)--手机摄像头技术结构与原理
  6. Python3 encode中的unicode-escape和raw_unicode_escape
  7. python获取url参数_python测试开发django(4)--获取url参数和name的作用
  8. 禁止Solaris系统不必要的网络服务
  9. c语言自学去视频,最适合自学的C语言自学视频
  10. java jmail_JavaMail学习--使用JMail发送邮件
  11. python 水位流量关系曲线_水位流量关系曲线的绘制方法_张红艳
  12. Variable used in lambda expression should be final or effectively final 问题的解决和追根溯源
  13. CAN接受和发送失败的原因有哪些---之前调试MCP2515驱动时,数据一直发不出去,三个发送邮箱都被占满.至今未解决,读寄存器-总线错误
  14. 谈及区块链,我们脑海当中首先浮现出来的是,狂热、浮躁的场景
  15. osgearth仿真平台(1)
  16. 2022最新中高阶Android面试题总结,Android面试题库
  17. DefaultMQPushConsumer 使用示例与注意事项
  18. phpstudy和thinkPHP的安装
  19. P3951 [NOIP2017 提高组] 小凯的疑惑 / [蓝桥杯 2013 省] 买不到的数目
  20. 妖精的尾巴等待服务器响应,《妖精的尾巴》数据互通注意事项

热门文章

  1. 我的世界java版游戏崩溃_我的世界全攻略之-游戏崩溃的解决方法
  2. C语言隐式/显式类型转换 | C++四种强制类型转换、类的隐式转换、explicit
  3. 学姐百度实习面经(轻松拿offer)
  4. (多线程)leetcode1114. 按序打印 认识AtomicInteger
  5. PaperNotes(19)-Learning Lane Graph Representations for Motion Forecasting
  6. python虚拟环境打包deb_可以为python脚本创建deb包吗?
  7. python根须系统斜杠_深入浅出Python中的os模块
  8. redis常用命令与特性
  9. 数字电视制播设备间的文件交换格式
  10. gcc中的内嵌汇编语言(Intel i386平台)