分布式数据库系统

  • 1)分布式数据库系统概述
    • 定义
    • 特点
    • 优缺点
    • 数据共享
    • 分类
  • 2)分布式数据库系统体系结构
    • 数据存储
    • 模式结构
    • 分布透明性
    • 分布式数据库管理系统
  • 3)分布式查询处理
    • 查询处理的传输代价
    • 连接查询的优化

1)分布式数据库系统概述

定义

分布式数据库系统(DDBS)是指数据存放在计算机网络的不同场地的计算机中,每个场地都具有自治处理能力并且可以完成局部应用,而且每一个场地也参与全局应用程序的执行,全局应用程序可以通过网络通信访问系统中多个场地的数据。其定义强调分布性和逻辑整体性两点。

与集中式系统的区别
集中式数据库系统是指数据库中所有数据都集中储存在一台计算机上,数据的处理也集中在一台计算机上。分布式数据库系统是把分散在各处的数据库系统通过网络通信连接起来形成的系统。

特点

分布式数据库系统特点如下:

  1. 数据独立性:除了具有常规的逻辑独立性与物理独立性外,还具有数据分布独立性。
  2. 集中与自治相结合的数据结构:各局部的DBMS可以独立的管理局部数据库,具有自治功能;系统也设有集中控制机制,协调各局部DBMS的工作,执行全局应用。
  3. 适当增加了数据冗余度:通过适当增加数据冗余可以方便检索,减少通信代价,提高系统的查询速度。
  4. 全局的一致性:可串行性和可恢复性

优缺点

优点:
1)具有灵活的体系结构
2)适应分布式的管理和控制机构
3)系统可靠性高
4)局部应用的响应速度快
5)可扩展性好,易于集成现有系统
6)经济性能优越
缺点:
1)系统开销大,主要花在通信部分
2)存取结构复杂
3)数据的安全性与保密性较难处理

数据共享

分布式数据库系统数据共享有以下两个层次:
1)局部共享:在局部数据库存储局部场地上各用户共享的数据,这些数据是本地用户常用的。
2)同构异质型DDBS:在分布式数据库系统的各个场地也存储供其他场地的用户共享的数据,支持系统的全局应用。

分类

分布式数据库系统可以分为以下3中类型:
1)同构同质型DDBS:各场地采用同一类型的数据模型(比如都是关系型),并且都是同一型号的数据库管理系统。
2)同构异质型DDBS:各个场地采用同一类型的数据模型,但是数据库管理系统不是同一型号。(譬如:SQL/DS,DB2,ORACLE等)
3)异构型DDBS:各个场地的数据模型是不同的类型。

2)分布式数据库系统体系结构

数据存储

分布式数据储存分为数据分布和数据分片。
数据分布:
数据分布也称为“数据分配”,是指数据在计算机网络各场地上的分配策略。数据的分配策略主要有:

  1. 集中式:所有数据均安排在同一个场地。
  2. 分割式:所有数据只有一份,分割安置在若干个场地。
  3. 全复制式:数据在每个场地重复存储。
  4. 混合式:数据库分为若干个可相交的子集,每个子集安置在一个或多个场地上,但是每一个场地未必保存全部数据。

数据分片
分布式数据库,一般数据存放的单位是片段而不是关系,这既有利于按照用户的需求较好的组织数据的分布,也有利于控制数据的冗余度。数据分片的主要方式有:

  1. 水平分片:按照一定的条件把全局关系按行分为若干不相交子集,每个子集为关系的一个片段。
  2. 垂直分片:把每一个全局关系的属性集分为若干子集,在子集上做投影运算,每个投影为垂直分片。
  3. 导出分片:又称为导出水平分片,即水平分片的条件不是本关系属性的条件,而是其他关系属性的条件。
  4. 混合型分片:按水平或垂直分片方式得到的片段继续按另一种方式进行分片。

    无论哪种分片方式都应满足以下条件:
    1) 完备性:一个全局关系中的数据必须完全的划分为若干片段,不允许某些数据属于全局关系但不属于任何一个片段。
    2)不相交性:不允许一个全局关系的某些数据既属于该全局关系的某一个片段,又属于另一个片段。
    3)可重构性:可以由片段重构全局关系,对于垂直分片可以用连接操作重构全局关系,对于水平分片,可以用并操作重构全局关系。

模式结构

下图所示的分布式数据库系统模式结构,从整体上可以分为两大部分:下部是集中式数据库系统的模式结构,代表了各局部场地上局部数据库系统的基本结构,上部分是分布式数据库系统增加的模式级别,其中包括:
1)全局外模式:是全局应用的用户视图,是全局概念模式概念的子集。
2)全局概念模式:定义了分布式数据库系统的整体逻辑结构,使得数据如同没有分布一样。
3)分片模式:定义片段以及全局关系与片段之间的映像。(一对多,一个全局关系对应多个片段)
4)分布模式:片段是全局关系的逻辑部分,一个片段在物理上可以分配到网络的不停结点上,分布模式定义片段的存放结点,根据分部策略选择定义片段的存放场地。
5)局部概念模式:定义了分布式数据库中局部数据的逻辑结构。
6)局部内模式:定义了分布式数据库中局部数据的物理结构。

分布透明性

分布透明性是指用户不必关心数据的逻辑分片,不必关心数据物理位置分配的细节,也不必关心各个场地上数据库的数据模型。所以分布透明性包括3三个层次:
1)分片透明性:指用户或应用程序只对全局关系进行操作而不必考虑关系的分片,当分片模式改变了,由于有全局概念模式到分片模式的映像存在(映像2),全局模式不变,应用出现不必改写。
2) 位置透明性:是指用户和应用程序不必知道片段的存储场地。当存储场地改变,由于分片模式到分布模式的映像存在(映像3),应用程序不必改写。
3)局部数据模型透明性:是指用户和应用程序不必了解局部场地上使用的是那种数据模型,模型的转换以及数据库语言的转换均由映像4完成。

分布式数据库管理系统

分布式数据库系统如下图所示,主要功能包括:接收用户请求,访问网络数据字典,数据的分布式处理,协调局部DBMS与其他计算机的DBMS,在异构型分布式环境中,提供数据与进程移植的支持等。

分布式数据库系统的组成如下:
1)查询子系统;
2)完整性子系统;
3)调度子系统;
4)可靠性子系统;
分布式数据库系统存在的问题如下:
1)不同场地的通信速度,与局部DBS的存储部件的存取速度相比,是非常慢的。
2)通信系统有较高的存取处理延迟。
3)在CPU上处理通信的代价很高。
4)不同通信系统有不同意义的字符,数据的转换速度不一样,可能会相差1000倍,存取延迟也可能相差1000000倍,所以一个设计方案可能只能被一个系统接受。

3)分布式查询处理

查询处理的传输代价

在分布式查询中,数据传输是衡量查询时间的主要指标,不同查询处理技术差别很大。
在集中式数据库中,查询执行开销为:I/O代价+CPU代价;
在分布式查询数据库中,查询执行开销为:I/O代价+CPU代价+通信代价;

连接查询的优化

分布式DBS的数据分布在各个场地,查询过程中,为了减少数据网络传输量,提高查询速度,需要连接查询优化,主要有两种策略:
1)使用半连接来缩减关系(或片段)进行节省传输开销;
2)直接使用连接的查询优化方案;

分布式数据库系统体系结构相关推荐

  1. 分布式数据库系统(DDBS) 概述

    一.什么是分布式数据库 分布式数据库系统(DDBS:Distributed Database System)是在集中式数据库系统的基础上发展来的.是数据库技术与网络技术结合的产物. 分布式数据库系统有 ...

  2. 第2章 数据库系统体系结构

    从DBMS的角度看,数据库系统体系结构=数据库系统内部的模式结构 从用户角度看,数据库系统体系结构=数据库系统的外部体系结构 数据库的三级模式结构 1. 外模式(子模式,用户模式) 单个用户所看到的局 ...

  3. 计算机二级数据库系统知识点,2020年全国计算机二级Access复习知识点:分布式数据库系统...

    [摘要] 小编整理了2020年全国计算机二级Access复习知识点:分布式数据库系统的相关内容,下面一起来看看2020年全国计算机二级Access复习知识点:分布式数据库系统的具体内容吧,希望能够帮助 ...

  4. 分布式数据库系统作业

    分布式系统的基本概念 写在最前面 分布式系统的基本概念 1. 什么不是分布式数据库系统 松耦合/紧耦合的多处理器系统 网络节点上的集中式数据库系统 2. 多数据库系统[1] 3. 网格数据库[2] 4 ...

  5. 分布式数据库系统期末复习

    期末复习 写在最前面 一.分布式数据库系统概述 DDBS基本概念 作用和特点 优缺点 二.分布式数据库系统的结构 体系结构:有哪几种类型 模式结构(从数据角度分析) 组件结构(从功能) 三.分布式数据 ...

  6. 实践案例丨基于Raft协议的分布式数据库系统应用

    摘要:简单介绍Raft协议的原理.以及存储节点(Pinetree)如何应用 Raft实现复制的一些工程实践经验. 1.引言 在华为分布式数据库的工程实践过程中,我们实现了一个计算存储分离. 底层存储基 ...

  7. 京东分布式数据库系统演进之路

    作者:张成远,京东云资深架构师,<Mariadb原理与实现>作者,开源项目speedy作者,2012年加入京东数据库研发团队,负责京东分布式数据库系统的架构与研发工作,主导了京东分布式数据 ...

  8. 数据库系统---分布式数据库系统

    分布式数据库系统 近年来,随着计算机技术与网络技术的发展,特别是 Internet 的兴起,分布式数据库系统得到了很快的发展和应用. 1 分布式数据库的概念  分布式数据库系统是相对于集中式数据库系统 ...

  9. 分布式系统和分布式数据库系统(介绍篇)

    分布式系统的基本系统 分布式车统(distributed system)是建立在网络之上的软件系统,正是因为具有软件的特性,所以分布式系统有高度的内聚性和通明性,因此,网络和分布式系统之间的区别更多地 ...

  10. 分布式数据库系统面临的问题和挑战

    分布式数据库系统在逻辑上可以看作一个完整的系统,用户如同在使用单机数据库系统:但是,从物理角度看,其为一个网络系统,包含若干个物理意义上的分散的节点,而节点之间通过网络进行连接,通过网络协议进行数据交 ...

最新文章

  1. python del函数_python del函数是什么以及如何使用?
  2. AAD Connect 微软官方的描述准确吗?
  3. mysql innodb_sort_buffer_size_mysql优化---第7篇:参数 innodb_buffer_pool_instances设置
  4. Express接口案例——完成文章增删改查接口
  5. ot协议是什么_OT的完整形式是什么?
  6. 《大数据——大价值、大机遇、大变革》试读
  7. 导航 navigationbar 与 tabbar
  8. 网络安全实验4 SQL注入攻击
  9. 被迫学计算机,IBM超级计算机Watson爆粗口 被迫“洗脑”
  10. 如何查计算机上网找网络协议,怎么查看电脑网络协议
  11. 求最大公约数 最大公因数 语言实现输出一个整数的最大公约数(因数),四种算法实现
  12. 腾讯云服务器搭建鸿蒙Hi3861开发板开发环境
  13. 服务器解压gz文件命令,gz解压(手机怎么解压gz文件)
  14. 计算机怎么设置定时音乐,怎么让电脑自动开机播放音乐教程 以及自动关机计划任务设置...
  15. python出行轨迹记录软件_看看过去跑过哪些地方,用Python和高德API绘制跑步轨迹...
  16. android刷礼物动画demo,GiftSurfaceView 直播间送礼物动画
  17. 双语矩阵论课程笔记(2)—— 【chapter 1】 Vector Spaces (Linear Spaces)
  18. 跟着NC学作图 | 柱状图新画法 (环状柱状图)
  19. 电视剧中一看就让人崩溃的镜头大全~
  20. oobe crash 分析

热门文章

  1. node2vec之小黑尝试
  2. vcpkg安装库时异常解决
  3. python贝叶斯网络预测模型_概率图模型之:贝叶斯网络
  4. 使用uni-app开发App简易教程
  5. Kettle使用教程(问题)
  6. 【ETL工具】-Kettle详细教程
  7. live2d模型导入unity报错 live2dsdk与Cubism下载 live2dSDKforUnity使用手册
  8. 《Adobe Flash CS4中文版经典教程》——1 FLASH CS4快速入门1.1 启动Flash并打开文件...
  9. python 爬取种子_利用python代码爬取torrentkitty上的种子
  10. 计算机黑屏闪光标,电脑开机黑屏只有光标在闪的解决方法