数据库描述数据的存储、运算和控制这些方式。

本文主要对书中的概念进行梳理,不涉及太多关系运算和编程问题。

基础篇

第一章 绪论

数据( Data ) :描述事物的符号记录称为数据。

数据库( DataBase ,简称 DB ) :数据库是长期储存在计算机内的、有组织的、可共享的数据集合。

1、使用数据库的好处?

(1)提高应用开发的效率,方便用户的使用,减轻数据库系统管理人员维护的负担

2、试述文件系统与数据库系统的区别和联系?

(1)文件系统面向某一应用程序,共享性差,冗余度大,数据独立性差,记录内有结构,整体无结构,由应用程序自己控制。

(2)数据库系统面向现实世界,共享性高,冗余度小,具有较高的物理独立性和一定的逻辑独立性,整体结构化,用数据模型描述,由数据库管理系统提供数据的安全性、完整性、并发控制和恢复能力。

二者联系:文件系统是操作系统的重要组成部分;而 DBMS 是独立于操作系统的软件。但是 DBMS 是在操作系统的基础上实现的;数据库中数据的组织和存储是通过操作系统中的文件系统来实现的。

(重)二者比较:
文件系统                                              数据库管理系统
某一应用                                              现实世界
共享性差,冗余度大                            共享性高,冗余度小
记录内有结构,整体无结构                 整体结构化,用数据模型描述
应用程序自己控制                               由数据库管理系统提供数据安全性,完整性,并发控制和恢复能力
独立性差                                              具有高度的物理独立性和一定的逻辑独立性

3、文件系统与DBS适用范围:

(1)文件系统适合功能比较简单、比较固定的应用系统,还有数据的备份、软件或应用程序使用过程中的临时数据存储。

(2)大型机构、涉及大量数据操作

4、数据库特点:

(1)主要特征之一,结构化,也是数据库系统与文件系统的本质区别。

(2)共享性高,冗余度低,易扩充,面向整个系统(而不再是某个应用)

(3)数据独立性高数据独立性包括数据的物理独立性和数据的逻辑独立性,由于数据库管理系统的模式结构和二级映像功能决定。

(4)数据由 DBMS 统一管理和控制数据库的共享是并发的共享,可以由多个用户同时使用。涉及,数据的安全性保护、数据的完整性检查、并发控制和数据库恢复几个方面。

解释:数据的安全性保护:保护数据以防止不合法的使用造成的数据的泄密和破坏;数据的完整性检查:将数据控制在有效的范围内,或保证数据之间满足一定的关系;并发控制:对多用户的并发操作加以控制和协调,保证并发操作的正确性;数据库恢复:当计算机系统发生硬件故障、软件故障,或者由于操作员的失误以及故意的破坏影响数据库中数据的正确性,甚至造成数据库部分或全部数据的丢失时,能将数据库从错误状态恢复到某一已知的正确状态(亦称为完整状态或一致状态)。

5、数据库管理系统的主要功能有哪些?

答:

( l )数据库定义功能;

( 2 )数据存取功能;

( 3 )数据库运行管理;

( 4 )数据库的建立和维护功能。

6、试述数据模型的概念、数据模型的作用和数据模型的三个要素。

数据模型是数据库系统的基础。

概念:数据模型是数据库中用来对现实世界进行抽象的工具,是数据库中用于提供信息表示和操作手段的形式构架。

作用:精确描述了系统的静态特性、动态特性和完整性约束条件。因此数据模型通常由数据结构、数据操作和完整性约束三部分组成。

解释:

数据的约束条件:是一组完整性规则的集合。完整性规则是给定的数据模型中数据及其联系所具有的制约和依存规则,以保证数据的正确、有效、相容。

数据模型:根据模型应用的不同目的,可以将模型分成两类或者说两个层次:一类是概念模型,是按用户的观点来对数据和信息建模,用于信息世界的建模,强调语义表达能力,概念简单清晰;另一类是数据模型,是按计算机系统的观点对数据建模,用于机器世界,人们可以用它定义、操纵数据库中的数据,一般需要有严格的形式化定义和一组严格定义了语法和语义的语言,并有一些规定和限制,便于在机器上实现。

关系完整性:实体完整性、参照完整性、用户自定义完整性。

实体完整性:基本关系的主键所对应的所有属性都不能取空值。

7、定义并解释概念模型中的术语:

实体:客观存在并可以相互区分的事物叫实体。

实体型:具有相同属性的实体具有相同的特征和性质,用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。

实体集:同型实体的集合称为实体集。

属性:实体所具有的某一特性,一个实体可由若干个属性来刻画。

:惟一标识实体的属性集称为码。

实体联系图( E 一 R 图):提供了表示实体型、属性和联系的方法: (1)实体型:用矩形表示,矩形框内写明实体名; (2)属性:用椭圆形表示,并用无向边将其与相应的实体连接起来; (3)联系:用菱形表示,菱形框内写明联系名,并用无向边分别与有关实体连接起来,同时在无向边旁标上联系的类型( 1 : 1 , 1 : n 或 m : n )。

8、试述关系模型的概念,定义并解释以下术语:

关系模型由关系数据结构、关系操作集合和关系完整性约束三部分组成。在用户观点下,关系模型中数据的逻辑结构是一张二维表,它由行和列组成。

(1)关系:一个关系对应通常说的一张表;

(2)属性:表中的一列即为一个属性;

(3)域:属性的取值范围;

(4)元组:表中的一行即为一个元组;

(5)主码:表中的某个属性组,它可以惟一确定一个元组;

(6)分量:元组中的一个属性值;

(7)关系模式:对关系的描述,一般表示为关系名(属性 1 ,属性 2 , … ,属性 n )

9、试述网状、层次数据库的优缺点。

层次模型的优点主要有:

(1)模型简单,突出特点。

(2)用层次模型的应用系统性能好,特别是对于那些实体间联系是固定的且预先定义好的应用,采用层次模型来实现,其性能优于关系模型;

(3)层次数据模型提供了良好的完整性支持。

层次模型的缺点:

(1)现实世界中很多联系是非层次性的,如多对多联系。

(2)对插入和删除操作的限制比较多; (3)查询子女结点必须通过双亲结点。

网状数据模型的优点主要有:

(1)能够更为直接地描述现实世界,如一个结点可以有多个双亲;

(2)具有良好的性能,存取效率较高。

网状数据模型的缺点主要有:

(1)结构比较复杂,不利于用户使用。比如,访问数据时必须选择适当的存取路径,用户必须了解系统结构的细节。

10、试述关系数据库的特点

关系数据模型具有下列优点: (1)严格的数学基础;(2)关系模型的概念单一,无论实体还是实体之间的联系都用关系表示,操作的对象和操作的结果都是关系,所以其数据结构简单、清晰,用户易懂易用。(3)关系模型的存取路径对用户透明,从而具有更高的数据独立性、更好的安全保密性。

缺点:由于存取路径对用户透明,查询效率往往不如非关系数据模型。

(重)11、试述数据库系统三级模式结构,这种结构的优点是什么?

数据库系统的三级模式结构由外模式、模式和内模式组成。

外模式:亦称子模式或用户模式,是数据库用户(包括应用程序员和最终用户)能够看见和使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。

模式:亦称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。

内模式:亦称存储模式,是数据在数据库系统内部的表示,即对数据的物理结构和存储方式的描述。

注:(1)模式描述的是数据的全局逻辑结构。外模式涉及的是数据的局部逻辑结构,通常是模式的子集。

(2)为了能够在内部实现这三个抽象层次的联系和转换,数据库系统在这三级模式之间提供了两层映像:外模式/模式映像和模式/内模式映像。正是这两层映像保证了数据库系统中的数据能够具有较高的逻辑独立性和物理独立性。

12、定义并解释以下术语:模式、外模式、内模式、 DDL 、 DML

模式、外模式、内模式,亦称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。

模式描述的是数据的全局逻辑结构。

外模式涉及的是数据的局部逻辑结构,通常是模式的子集。

内模式,亦称存储模式,是数据在数据库系统内部的表示,即对数据的物理结构和存储方式的描述。

DDL :数据定义语言,用来定义数据库模式、外模式、内模式的语言。

DML :数据操纵语言,用来对数据库中的数据进行查询、插入、删除和修改的语句。

(重)13、什么叫数据与程序的物理独立性?什么叫数据与程序的逻辑独立性?为什么数据库系统具有数据与程序的独立性?

数据与程序的逻辑独立性:当模式改变时(例如增加新的关系、新的属性、改变属性的数据类型等),由数据库管理员对各个外模式/模式的映像做相应改变,可以使外模式保持不变。应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性。

数据与程序的物理独立性:当数据库的存储结构改变了,由数据库管理员对模式/内模式映像做相应改变,可以使模式保持不变,从而应用程序也不必改变,保证了数据与程序的物理独立性。

14、试述数据库系统的组成

数据库系统一般由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。

(重)15、DBA 的职责是什么?

负责全面地管理和控制数据库系统的人员。具体职责包括:

①决定数据库的信息内容和结构;

②决定数据库的存储结构和存取策略;

③定义数据的安全性要求和完整性约束条件;

④监督和控制数据库的使用和运行;

⑤改进和重组数据库系统。

解释:

DBMS必须提供的数据控制功能:数据的安全性保护、数据的完整性检查、并发控制、数据库恢复。

ps:数据库保护(访问)的内容有哪些?
①利用权限机制和完整性约束防止非法数据进入数据库;
②提供故障恢复能力;
③提供并发访问控制。

第2章 关系数据库

1、关系数据语言的特点和分类。

关系数据语言可以分为三类:

关系代数语言。

关系演算语言:元组关系演算语言和域关系演算语言。

SQL:具有关系代数和关系演算双重特点的语言。

这些关系数据语言的共同特点是,语言具有完备的表达能力,是非过程化的集合操作语言,功能强,能够嵌入高级语言中使用。

(重)2、关系模型的三类完整性
1)实体完整性, 基本关系的所有主属性不能取空值
2)参照完整性,也叫引用完整性, 若基本关系R含有与另一个基本关系S的主关键字相对应的属性组F(F称为R的外键或外部码),则R中每个元组在F上的值或为空值,或等于S中某个元组的主关键字值
3)用户定义的完整性

3、试述关系模型的完整性规则。在参照完整性中,为什么外部码属性的值也可以为空?什么情况下才可以为空?

实体完整性规则是指若属性A是基本关系R的主属性,则属性A不能取空值。

若属性(或属性组)F是基本关系R的外码,它与基本关系S的主码Ks相对应(基本关系R和S不一定是不同的关系),则对于R中每个元组在F上的值必须为:或者取空值(F的每个属性值均为空值);或者等于S中某个元组的主码值。即属性F本身不是主属性,则可以取空值,否则不能取空值。

4、试述等值连接与自然连接的区别和联系。

连接运算符是“=”的连接运算称为等值连接。它是从关系R与S的广义笛卡尔积中选取A,B属性值相等的那些元组。

自然连接是一种特殊的等值连接,它要求两个关系中进行比较的分量必须是相同的属性组,并且在结果中把重复的属性列去掉。

5、关系代数的基本运算有哪些 ? 如何用这些基本运算来表示其他运算?

并、差、笛卡尔积、投影和选择5种运算为基本的运算。其他3种运算,即交、连接和除,均可以用这5种基本运算来表达。

关系代数中专门的关系运算:选择、投影、连接、除。

(重)关系数据库都有那些操作,特点是什么?
查询:选择、投影、连接、除、并、交、差
数据更新:插入、删除、修改
关系操作的特点:集合操作方式,即操作的对象和结果都是集合。

6、试述 SQL 的定义功能。

SQL 的数据定义功能包括定义表、定义视图和定义索引。

CREATE TABLE 语句建立基本表,

ALTER TABLE 语句修改基本表定义,

DROP TABLE 语句删除基本表;

CREATE INDEX 语句建立索引,

DROP INDEX 语句删除索引;

CREATE VIEW 语句建立视图,

DROP VIEW 语句删除视图。

解释:

(重)SQL(Structured Query Language)的四个组成部分?
① 数据定义语言(Data Definition Language);
② 查询语言(Query Language);
③ 数据操纵语言(Data Manipulation Language);
④ 数据控制语言(Data Control Language)。

数据操纵语言DML(Data Manipulation Language),用户通过它可以实现对数据库的基本操作。例如,对表中数据的查询(select)、插入(insert)、删除(delete)和修改(update)。

第3章 关系数据库标准语言SQL

1、试述 SQL 语言的特点。

(l)综合统一。SQL 语言集数据定义语言 DDL 、数据操纵语言 DML 、数据控制语言 DCL 的功能于一体。

(2)高度非过程化。存储过程由系统执行。

(3)面向集合的操作方式。SQL 语言采用集合操作方式,不仅操作对象、查找结果可以是元组的集合,而且一次插入、删除、更新操作的对象也可以是元组的集合。

(4)以同一种语法结构提供两种使用方式。SQL 语言既是自含式语言,又是嵌入式语言。

(5)语言简捷,易学易用。

(重)2、什么是基本表?什么是视图?两者的区别和联系是什么?

基本表:是本身独立存在的表,在 SQL 中一个关系就对应一个表。

视图:是从一个或几个基本表导出的表。视图本身不独立存储在数据库中,是一个虚表。即数据库中只存放视图的定义而不存放视图对应的数据,这些数据仍存放在导出视图的基本表中。视图在概念上与基本表等同,用户可以如同基本表那样使用视图,可以在视图上再定义视图。

(重)3、试述视图的优点。

(l)视图能够简化用户的操作;(2)视图使用户能以多种角度看待同一数据;(3)视图对重构数据库提供了一定程度的逻辑独立性;(4)视图能够对机密数据提供安全保护。

(重)4、所有的视图是否都可以更新?为什么?

不是。视图是不实际存储数据的虚表,因此对视图的更新,最终要转换为对基本表的更新。因为有些视图的更新不能惟一有意义地转换成对相应基本表的更新,所以,并不是所有的视图都是可更新的.

(重)5、哪类视图是可以更新的?哪类视图是不可更新的?各举一例说明

基本表的行列子集视图一般是可更新的。若视图的属性来自集函数、表达式,则该视图肯定是不可以更新的。

第4章 数据库安全性

1、什么是数据库的安全性?

数据库的安全性是指保护数据库以防止不合法的使用所造成的数据泄露、更改或破坏。

(重)2、试述实现数据库安全性控制的常用方法和技术?

(1)用户标识和鉴别:该方法由系统提供一定的方式让用户标识自己的名字或身份。每次用户要求进入系统时,由系统进行核对,通过鉴定后才提供系统的使用权。

(2)存取控制:通过用户权限定义和合法权检查确保只有合法权限的用户访问数据库,所有未被授权的人员无法存取数据。例如CZ 级中的自主存取控制(DAC),Bl级中的强制存取控制(MAC)。

(3)视图机制:为不同的用户定义视图,通过视图机制把要保密的数据对无权存取的用户隐藏起来,从而自动地对数据提供一定程度的安全保护。

(4)审计:建立审计日志,把用户对数据库的所有操作自动记录下来放入审计日志中,DBA 可以利用审计跟踪的信息,重现导致数据库现有状况的一系列事件,找出非法存取数据的人、时间和内容等。

解释:使用背景:任何系统的安全保护措施都不是完美无缺的,蓄意盗窃破坏数据的人总可能存在。

(5)数据加密:对存储和传输的数据进行加密处理,从而使得不知道解密算法的人无法获知数据的内容。

3、什么是数据库中的自主存取控制方法和强制存取控制方法?

自主存取控制方法:定义各个用户对不同数据对象的存取权限。当用户对数据库访问时首先检查用户的存取权限。防止不合法用户对数据库的存取。

强制存取控制方法:每一个数据对象被(强制地)标以一定的密级,每一个用户也被(强制地)授予某一个级别的许可证。系统规定只有具有某一许可证级别的用户才能存取某一个密级的数据对象。

4、理解并解释MAC 机制中主体、客体、敏感度标记的含义?

主体是系统中的活动实体,既包括DBMS 所管理的实际用户,也包括代表用户的各进程。

客体是系统中的被动实体,是受主体操纵的,包括文件、基表、索引、视图等。对于主体和客体,DBMS为它们每个实例(值)指派一个敏感度标记(Label )。

敏感度标记被分成若干级别,例如绝密(Top Secret )、机密(Secret )、可信( Confidential )、公开(PubliC )等。主体的敏感度标记称为许可证级别(ClearanCe Level ) ,客体的敏感度标记称为密级(Classification Level)。

(重)5、建立索引时需要考虑哪些影响性能的问题?

(1)表的数据量

(2)建立索引的数量

(3)建立索引的时机

(4)是否建立聚簇索引

(5)数据是否有大量的重复值。

数据库索引目的:提供多种存储路径,加快查找速度。
建立索引需要考虑的问题:1.没有查询、统计的需要则不建2.数据增删改频繁,系统会花费许多时间来维护索引,从而降低了查询效率。

第5章 数据库完整性

(重)1、什么是数据库的完整性?

数据库的完整性是指数据的正确性和相容性。主要包括:实体完整性、参照完整性、用户自定义完整性。

即:数据库管理系统的完整性要完成的功能
-- 防止不合语意的数据,防止无效操作和错误结果

2、数据库的完整性概念与数据库的安全性概念有什么区别和联系?

安全性措施的防范对象是非法用户和非法操作,完整性措施的防范对象是不合语义的数据。

3 、什么是数据库的完整性约束条件?可分为哪几类?

完整性约束条件是指数据库中的数据应该满足的语义约束条件。一般可以分为六类:静态列级约束、静态元组约束、静态关系约束、动态列级约束、动态元组约束、动态关系约束。

静态列级约束是对一个列的取值域的说明,包括以下几个方面:

(l)对数据类型的约束,包括数据的类型、长度、单位、精度等;

(2)对数据格式的约束;

(3)对取值范围或取值集合的约束;

(4)对空值的约束;

(5)其他约束。

静态元组约束就是规定组成一个元组的各个列之间的约束关系,静态元组约束只局限在单个元组上。

静态关系约束是在一个关系的各个元组之间或者若干关系之间常常存在各种联系或约束。

常见的静态关系约束有:

(l)实体完整性约束;

(2)参照完整性约束;

(3)函数依赖约束。

动态列级约束是修改列定义或列值时应满足的约束条件,包括下面两方面:

(l)修改列定义时的约束;

(2)修改列值时的约束。

动态元组约束是指修改某个元组的值时需要参照其旧值,并且新旧值之间需要满足某种约束条件。

动态关系约束是加在关系变化前后状态上的限制条件,例如事务一致性、原子性等约束条件。

解释:

另一种角度,分为四类:类型约束、属性约束、关系变量约束、数据库约束。

类型约束是完整性约束的最基础构成,定义属性列对应域的取值范围。

属性约束主要规定属性的类型、取值范围、精度等约束条件。

关系变量约束定义同一关系内不同元组之间、不同属性间的约束。

数据库约束定义多个关系之间应满足的约束条件。

4、DBMS 的完整性控制机制应具有哪些功能?

DBMS 的完整性控制机制应具有三个方面的功能:

(l)定义功能,即提供定义完整性约束条件的机制;

(2)检查功能,即检查用户发出的操作请求是否违背了完整性约束条件;

(3)违约反应:如果发现用户的操作请求使数据违背了完整性约束条件,则采取一定的动作来保证数据的完整性。

解释:

(重)DBMS的控制操作有哪些?
①数据的安全性保护;②数据的完整性检查;③并发控制;④数据库恢复。

5、RDBMS 在实现参照完整性时需要考虑哪些方面?

RDBMS 在实现参照完整性时需要考虑以下几个方面:

(l)外码是否可以接受空值。

(2)在被参照关系中删除元组时的问题,这时系统可能采取的作法有三种:

l)级联删除( CASCADES ) ;

2)受限删除( RESTRICTED ) ;

3)置空值删除( NULLIFIES)。

(3 )在参照关系中插入元组时的问题,这时系统可能采取的作法有: l)受限插入; 2)递归插入。

(4)修改关系中主码的问题。一般是不能用 UPDATE 语句修改关系主码的。如果需要修改主码值,只能先删除该元组,然后再把具有新主码值的元组插入到关系中。如果允许修改主码,首先要保证主码的惟一性和非空,否则拒绝修改。然后要区分是参照关系还是被参照关系。

6、关系系统中,当操作违反实体完整性、参照完整性和用户定义的完整性约束条件时,一般是如何分别进行处理的?

对于违反实体完整性和用户定义的完整性的操作一般都采用拒绝执行的方式进行处理。

而对于违反参照完整性的操作,并不都是简单地拒绝执行,有时要根据应用语义执行一些附加的操作,以保证数据库的正确性。

设计与开发篇

第6章 关系数据库理论

主线:

重点:

术语和记号:

X->Y,但Y不是X的子集,则称X->Y是非平凡的函数依赖。若不特别声明,总是讨论非平凡的函数依赖。

X->Y,但Y是X的子集,则称X->Y是平凡的函数依赖

若X->Y,则X叫做决定因素(Determinant)

若X->Y,Y->X,则记作X<->Y。

若Y不函数依赖于X,则记作X -> Y。

(1)外键:设F是关系中某个属性或属性组合而并非该关系的建,但却是另一个关系S的主键,称F为关系R的外键。

(2)主码:关系中能唯一区分、确定不同元组的属性或属性组合。

(重)1 、理解并给出下列术语的定义:

定义1:设R(U)是属性集U上的关系模式。X,Y是属性集U的子集。若对于R(U)的任意一个可能的关系r,r中不可能存在两个元组在X上的属性值相等,而在Y上的属性值不等,则称X函数确定Y或Y函数依赖于X,记作X->Y。(即只要X上的属性值相等,Y上的值一定相等。)

定义2:在R(U)中,如果 X->Y,并且对于X的任何一个真子集X’,都有X’ -> Y,则称Y对X完全函数依赖

若X->Y,但Y不完全函数依赖于X,则称Y对X部分函数依赖

定义3:若关系模式R的每一个分量是不可再分的数据项,则关系模式R属于第一范式(1NF)。

定义4:若关系模式R∈1NF,且每一个非主属性完全函数依赖于码,则关系模式R∈2NF 。(即1NF消除了非主属性对码的部分函数依赖则成为2NF)。

定义5:关系模式R<U,F> 中若不存在这样的码X、属性组Y及非主属性Z(Z不是Y的子集)使得X->Y,Y-> X,Y -> Z成立,则称R<U,F>∈3NF。(属性对非主属性没有影响,同时码与属性组没有依赖关系。)

定义6:关系模式R<U,F>∈1NF 。若XàY且Y不是X的子集时,X必含有码,则R<U,F>∈BCNF

定义7:关系模式R<U,F>∈1NF,如果对于R的每个非平凡多值依赖XààY(Y不是X的子集,Z=U-X-Y不为空),X都含有码,则称R<U,F>∈4NF

解释:

(重)1NF 有哪些缺点?(又可问关系模式的四种缺点?)
1。数据冗余太大(每一个系的系主任名字重复出现),通过2NF优化
2。更新异常(某个系更换系主任之后,必须将该系学生有关的每一个元组进行修改),通过2NF优化
3,插入异常(如果一个系刚成立,尚无学生,就无法将老师存入到数据库中),通过3NF优化
4,删除异常(如果学生都毕业了,在删除学生时,把这个系的系主任的所有信息都删除了),通过3NF优化

2、试举出3 个多值依赖的实例。

(1)关系模式MSC ( M , S , C )中,M 表示专业,S 表示学生,C 表示该专业的必修课。假设每个专业有多个学生,有一组必修课。设同专业内所有学生选修的必修课相同,实例关系如下。按照语义对于M 的每一个值M i , s 有一个完整的集合与之对应而不问C 取何值,所以M 一一S 。由于C 与S 的完全对称性,必然有M 一一C 成立。

(2)关系模式ISA ( I , S , A )中,I 表示学生兴趣小组,S 表示学生,A 表示某兴趣小组的活动项目。假设每个兴趣小组有多个学生,有若干活动项目。每个学生必须参加所在兴趣小组的所有活动项目,每个活动项目要求该兴趣小组的所有学生参加。
按照语义有I 一一S , I 一一A 成立。
(3)关系模式RDP ( R , D , P )中,R 表示医院的病房,D 表示责任医务人员,P 表示病人。假设每个病房住有多个病人,有多个责任医务人员负责医治和护理该病房的所有病人。

3、下面的结论哪些是正确的? 哪些是错误的? 对于错误的请给一个反例说明之。

(1)任何一个二目关系是属于3NF。

答:正确。因为关系模式中只有两个属性,所以无传递。

(2)任何一个二目关系是属于BCNF.

答:正确。按BCNF的定义,若XàY,且Y不是X的子集时,每个决定因素都包含码,对于二目关系决定因素必然包含码。详细证明如下:(任何二元关系模式必定是BCNF)。

证明:设R为一个二目关系R(A1,A2),则属性A1和A2之间可能存在以下几种依赖关系:

A、A1->A2,但A2->A1,则关系R的码为A1,决定因素都包含码,所以,R是BCNF。

B、A1->A2,A2->A1,则关系R的码为A2,所以决定因素都包含码,R是BCNF。

包含码。C、R的码为(A1,A2)(即A1 ->A2,A2 ->A1)。

(3)任何一个二目关系是属于4NF.

答:正确。因为只有两个属性,所以无非平凡的多值依赖。

4、说明完整性约束定义中主键约束与唯一约束的差异。

主键约束要求属性的分量值唯一且不能取空值;而唯一约束允许属性的分量值为空值。

第7章 数据库设计

1、试述数据库设计过程?

这里只概要列出数据库设计过程的六个阶段: (1)需求分析; (2)概念结构设计; (3)逻辑结构设计; (4)数据库物理设计; (5)数据库实施; (6)数据库运行和维护。

2、试述数据库设计过程各个阶段上的设计描述?

各阶段的设计要点如下:

(1)需求分析:准确了解与分析用户需求(包括数据与处理)。

(2)概念结构设计:通过对用户需求进行综合、归纳与抽象,形成一个独立于具体 DBMS 的概念模型。

(3)逻辑结构设计:将概念结构转换为某个 DBMS 所支持的数据模型,并对其进行优化。

解释:

将总体E-R模型(实体-联系模型)转换成关系模型。

(4)数据库物理设计:为逻辑数据模型选取一个最适合应用环境的物理结构(包括存储结构和存取方法)。

解释:

影响存储结构的设计是存储空间效率、存取时间性能,以及维护成本等方面。

存储结构设计需考虑:1)数据的存放位置;2)确定系统配置。

(5)数据库实施:设计人员运用 DBMS 提供的数据语言、工具及宿主语言,根据逻辑设计和物理设计的结果建立数据库,编制与调试应用程序,组织数据入库,并进行试运行。

(6)数据库运行和维护:在数据库系统运行过程中对其进行评价、调整与修改。

3、试述数据库设计过程中结构设计部分形成的数据库模式?

数据库结构设计的不同阶段形成数据库的各级模式,即:

(1)在概念设计阶段形成独立于机器特点,独立于各个 DBMS 产品的概念模式,在本篇中就是 E 一 R 图;

(2)在逻辑设计阶段将 E 一 R 图转换成具体的数据库产品支持的数据模型,如关系模型,形成数据库逻辑模式,然后在基本表的基础上再建立必要的视图,形成数据的外模式;

(3)在物理设计阶段,根据 DBMS 特点和处理的需要,进行物理存储安排,建立索引,形成数据库内模式。

4、需求分析阶段的设计目标是什么?调查的内容是什么?

需求分析阶段的设计目标是通过详细调查现实世界要处理的对象(组织、部门、企业等),充分了解原系统(手工系统或计算机系统)工作概况,明确用户的各种需求,然后在此基础上确定新系统的功能。调查的内容是“数据’和“处理”,即获得用户对数据库的如下要求:

(1)信息要求,指用户需要从数据库中获得信息的内容与性质,由信息要求可以导出数据要求,即在数据库中需要存储哪些数据;

(2)处理要求,指用户要完成什么处理功能,对处理的响应时间有什么要求,处理方式是批处理还是联机处理;

(3)安全性与完整性要求。

感:其他项目和活动前期规划也大抵是这样一个思想。

5、数据字典的内容和作用是什么?

数据字典是系统中各类数据描述的集合。

数据字典的内容通常包括:

(1)数据项; (2)数据结构; (3)数据流; (4)数据存储; (5)处理过程五个部分。

其中数据项是数据的最小组成单位,若干个数据项可以组成一个数据结构。数据字典通过对数据项和数据结构的定义来描述数据流和数据存储的逻辑内容。

数据字典的作用:数据字典是关于数据库中数据的描述,在需求分析阶段建立,是下一步进行概念设计的基础,并在数据库设计过程中不断修改、充实、完盖。

6、什么是数据库的概念结构?试述其特点和设计策略。

概念结构是信息世界的结构,即概念模型。

特点:(1)真实性;(2)易理解;(3)易更改;(4)易于向关系、网状、层次等各种数据模型转换。

概念结构的设计策略通常有四种:

1)自顶向下,即首先定义全局概念结构的框架,然后逐步细化;

2)自底向上,即首先定义各局部应用的概念结构,然后将它们集成起来,得到全局概念结构;

3)逐步扩张,首先定义最重要的核心概念结构,然后向外扩充,以滚雪球的方式逐步生成其他概念结构,直至总体概念结构;

4)混合策略,即将自顶向下和自底向上相结合,用自顶向下策略设计一个全局概念结构的框架,以它为骨架集成由自底向上策略中设计的各局部概念结构。

7、什么叫数据抽象?

数据抽象是对实际的人、物、事和概念进行人为处理,抽取所关心的共同特性,忽略非本质的细节,并把这些特性用各种概念精确地加以描述,这些概念组成了某种模型。

8、为什么要视图集成?视图集成的方法是什么?

在对数据库系统进行概念结构设计时一般采用自底向上的设计方法,把繁杂的大系统分解子系统。首先设计各个子系统的局部视图,然后通过视图集成的方式将各子系统有机地融合起来,综合成一个系统的总视图。

视图集成可以有两种方式: ( 1)多个分 E 一 R 图一次集成; ( 2 )逐步集成,用累加的方式一次集成两个分 E 一 R 图。

9、什么是数据库的再组织和重构造?为什么要进行数据库的再组织和重构造?

数据库的再组织是指:按原设计要求重新安排存储位置、回收垃圾、减少指针链等,以提高系统性能。

数据库的重构造则是指:部分修改数据库的模式和内模式,即修改原设计的逻辑和物理结构。

数据库的再组织是不修改数据库的模式和内模式的。

进行数据库的再组织和重构造的原因:数据库运行一段时间后,由于记录不断增、删、改,会使数据库的物理存储情况变坏,降低了数据的存取效率,数据库性能下降,这时 DBA 就要对数据库进行重组织。 DBMS 一般都提供用于数据重组织的实用程序。数据库应用环境常常发生变化,如增加新的应用或新的实体,取消了某些应用,有的实体与实体间的联系也发生了变化等,使原有的数据库设计不能满足新的需求,需要调整数据库的模式和内模式。这就要进行数据库重构造。

系统篇

第9章 关系查询处理和查询优化

1、试述查询优化在关系数据库系统中的重要性和可能性。

重要性:关系系统的查询优化既是 RDBMS 实现的关键技术又是关系系统的优点所在。

可能性:

(1)优化器可以从数据字典中获取许多统计信息,优化器可以根据这些信息选择有效的执行计划,而用户程序则难以获得这些信息。例如关系中的元组数、关系中每个属性值的分布情况、这些属性上是否有索引、是什么索引( B +树索引还是 HASH 索引或惟一索引或组合索引)等。

(2)如果数据库的物理统计信息改变了,系统可以自动对查询进行重新优化以选择相适应的执行计划。

(3)优化器可以考虑数十甚至数百种不同的执行计划,从中选出较优的一个,而程序员一般只能考虑有限的几种可能性。

(4)优化器中包括了很多复杂的优化技术,这些优化技术往往只有最好的程序员才能掌握。

2、试述查询优化的一般准则

下面的优化策略一般能提高查询效率:

(l)选择运算应尽可能先做;

(2)把投影运算和选择运算同时进行;

(3)把投影同其前或其后的双目运算结合起来执行;

(4)把某些选择同在它前面要执行的笛卡儿积结合起来成为一个连接运算;

(5)找出公共子表达式;

(6)选取合适的连接算法。

3、试述查询优化的一般步骤

各个关系系统的优化方法不尽相同,大致的步骤可以归纳如下:

(l)把查询转换成某种内部表示,通常用的内部表示是语法树。

(2)把语法树转换成标准(优化)形式。即利用优化算法,把原始的语法树转换成优化的形式。

(3)选择低层的存取路径。

(4)生成查询计划,选择代价最小的。

第10章 数据库恢复技术

(重)1、试述事务的概念及事务的4 个特性

事务是用户定义的一个数据库操作序列,这些操作要么全做要么全不做,是一个不可分割的工作单位,是数据库应用程序的基本逻辑单元。

事务具有4 个特性:原子性(Atomicity )、一致性(consistency )、隔离性( Isolation )和持续性(Durability )。这4 个特性也简称为ACID 特性。

原子性:事务是数据库的逻辑工作单位,事务中包括的诸操作要么都做,要么都不做。

一致性:事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。

隔离性:一个事务的执行不能被其他事务干扰。即一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。

持续性:持续性也称永久性(Perfnanence ) ,指一个事务一旦提交,它对数据库中数据的改变就应该是永久性的。接下来的其他操作或故障不应该对其执行结果有任何影响。

2、为什么事务非正常结束时会影响数据库数据的正确性?

事务执行的结果必须是使数据库从一个一致性状态变到另一个一致性状态。如果数据库系统运行中发生故障,有些事务尚未完成就被迫中断,这些未完成事务对数据库所做的修改有一部分已写入物理数据库,这时数据库就处于一种不正确的状态,或者说是不一致的状态。

3、数据库中为什么要有恢复子系统?它的功能是什么?

因为计算机系统中硬件的故障、软件的错误、操作员的失误以及恶意的破坏是不可避免的,这些故障轻则造成运行事务非正常中断,影响数据库中数据的正确性,重则破坏数据库,使数据库中全部或部分数据丢失,因此必须要有恢复子系统。

恢复子系统的功能是:把数据库从错误状态恢复到某一已知的正确状态(亦称为一致状态或完整状态)。

4、数据库运行中可能产生的故障有哪几类?哪些故障影响事务的正常执行?哪些故障破坏数据库数据?

数据库系统中可能发生各种各样的故障,大致可以分以下几类:

(1)事务内部的故障;

(2)系统故障;

(3)介质故障;

(4)计算机病毒。

事务故障和系统故障影响事务的正常执行;介质故障和计算机病毒破坏数据库数据。

(重)5、简述不同类型故障的恢复策略

(1)事务故障:利用日志文件撤销此事务对数据库已经做过的修改;

(2)系统故障:利用日志文件回滚(UNDO)未完成事务,重做(REDO)已提交事务;

(3)介质故障:装入最近的完全转储后备副本。若数据库副本是动态转储的,还需要同时装入转储开始时刻的日志文件副本,利用恢复系统故障的方法将数据库恢复到某个一致性状态。如果后续的增量转出,按照从前往后的顺序,根据增量转出来修改数据库。装入转储结束后的日志文件副本,重做已完成的事务。

ps:数据库有哪几种备份策略,大概的操作?
完全备份、事务日志备份、差异备份、文件备份。

(重)6、数据库恢复的基本技术有哪些?

数据转储和登录日志文件是数据库恢复的基本技术。当系统运行过程中发生故障,利用转储的数据库后备副本和日志文件就可以将数据库恢复到故障前的某个一致性状态。

解释:

日志文件的定义与作用?
日志文件是用来记录事务对数据库的更新操作的文件。
作用:记录数据库使用情况,并协助后备副本进行介质故障恢复。
日志文件主要包含:事务标识、操作的类型、操作对象、更新前数据的旧值、更新后数据的新值。

(重)7、数据库转储的意义是什么?试比较各种数据转储方法。

数据转储是数据库恢复中采用的基本技术。所谓转储即DBA 定期地将数据库复制到磁带或另一个磁盘上保存起来的过程。

(1)静态转储:在系统中无运行事务时进行的转储操作,降低数据库的可用性。

(2)动态转储:指转储期间允许对数据库进行存取或修改。转储结束时后援副本上的数据并不能保证正确有效和一致性,需要建立日志文件

(3)其他方式:海量转储是指每次转储全部数据库。增量转储则指每次只转储上一次转储后更新过的数据

8、什么是检查点记录?检查点记录包括哪些内容?

检查点记录是一类新的日志记录。它的内容包括:

① 建立检查点时刻所有正在执行的事务清单

② 这些事务的最近一个日志记录的地址。

9、什么是数据库镜像?它有什么用途?

数据库镜像即根据DBA 的要求,自动把整个数据库或者其中的部分关键数据复制到另一个磁盘上。每当主数据库更新时,DBMS 自动把更新后的数据复制过去,即DBMS 自动保证镜像数据与主数据的一致性。

数据库镜像的用途有:

1)用于数据库恢复。当出现介质故障时,可由镜像磁盘继续提供使用,同时DBMS 自动利用镜像磁盘数据进行数据库的恢复,不需要关闭系统和重装数据库副本。

2)提高数据库的可用性。在没有出现故障时,当一个用户对某个数据加排它锁进行修改时,其他用户可以读镜像数据库上的数据,而不必等待该用户释放锁。

第11章 并发控制

(重)1、并发操作可能会产生哪几类数据不一致?用什么方法能避免各种不一致的情况?

并发操作带来的数据不一致性包括三类:丢失修改、不可重复读和读“脏’数据。

(l)丢失修改(lost update ) 两个事务 Tl 和T2读入同一数据并修改,T2提交的结果破坏了(覆盖了) Tl 提交的结果,导致 Tl 的修改被丢失。

(2)不可重复读( Non 一 Repeatable Read ) 不可重复读是指事务 Tl 读取数据后,事务几执行更新操作,使 Tl 无法再现前一次读取结果。

(3)读“脏”数据( Dirty Read ) 读“脏’夕数据是指事务 Tl 修改某一数据,并将其写回磁盘,事务几读取同一数据后, Tl 由于某种原因被撤销,这时 Tl 已修改过的数据恢复原值,已读到的数据就与数据库中的数据不一致,则已读到的数据就为“脏”数据,即不正确的数据。

避免不一致性的方法和技术就是并发控制。最常用的技术是封锁技术。也可以用其他技术,例如在分布式数据库系统中可以采用时间戳方法来进行并发控制。

2、什么是封锁?基本的封锁类型有几种?试述它们的含义。

封锁就是事物T获得共享区的单独使用权。

基本的封锁类型有两种:排它锁( Exclusive Locks ,简称 x 锁)和共享锁 ( Share Locks,简称 S 锁)。

(1)排它锁又称为写锁。保证了其他事务在 T 释放 A 上的锁之前不能再读取和修改 A 。

(2)共享锁又称为读锁。保证了其他事务可以读 A ,但在 T 释放 A 上的 S 锁之前不能对 A 做任何修改。

3、什么是活锁?什么是死锁?

活锁就是事务(T2)等待时间太久,似乎被锁住了,但实际是可能被激活的。可采用先来先服务的准则。

死锁是两个事务各自把对方资源(数据)拿着,而进入僵持的情况。

4、什么样的并发调度是正确的调度?

可串行化( Serializable )的调度是正确的调度。

可串行化的调度的定义:多个事务的并发执行是正确的,当且仅当其结果与按某一次序串行执行它们时的结果相同,称这种调度策略为可串行化的调度。

解释:

串行调度和可串行化调度差别:

可串行是多个事务的各指令交叉执行。

5、为什么要引进意向锁?意向锁的含义是什么?

引进意向锁是为了提高封锁子系统的效率。该封锁子系统支持多种封锁粒度。

原因是:在多粒度封锁方法中一个数据对象可能以两种方式加锁 ― 显式封锁和隐式封锁。

因此系统在对某一数据对象加锁时不仅要检查该数据对象上有无(显式和隐式)封锁与之冲突,还要检查其所有上级结点和所有下级结点,看申请的封锁是否与这些结点上的(显式和隐式)封锁冲突,显然,这样的检查方法效率很低。

为此引进了意向锁。意向锁的含义是:对任一结点加锁时,必须先对它的上层结点加意向锁。例如事务 T 要对某个元组加 X 锁,则首先要对关系和数据库加 ix 锁。换言之,对关系和数据库加 ix 锁,表示它的后续结点 ― 某个元组拟(意向)加 X 锁。引进意向锁后,系统对某一数据对象加锁时不必逐个检查与下一级结点的封锁冲突了。例如,事务 T 要对关系 R 加 X 锁时,系统只要检查根结点数据库和 R 本身是否已加了不相容的锁(如发现已经加了 ix ,则与 X 冲突),而不再需要搜索和检查 R 中的每一个元组是否加了 X 锁或 S 锁。

(重)6、什么是两阶段锁协议?

事务分为两个阶段:

第一阶段是获得封锁,也称为扩展阶段,指根据操作请求申请相应的锁资源;

第二阶段是释放封锁,也称为收缩阶段,指一旦开始释放锁资源,就不再申请其它的任何锁资源。

解释:

(1)遵守两阶段所协议的并发事务一定是可串行化的。但有可能发生级联回滚(UNDO)和死锁。

(2)严格两段锁协议:要求满足两段锁协议规定外,还要求事务的排它锁必须在事务提交之后释放。

(3)强两段锁协议:要求满足两段锁协议规定外,还要求事务的所有锁都必须在事务提交之后释放。

(4)注意两段锁协议和防止死锁的一次封锁法的异同之处。一次封锁法要求每个事务必须一次将所有要使用的数据全部加锁,否则就不能继续执行,因此一次封锁法遵守两段锁协议;但是两段锁协议并不要求事务必须一次将所有要使用的数据全部加锁,因此遵守两段锁协议的事务可能发生死锁。

【高效复习】《数据库系统概论》王珊版相关推荐

  1. (数据库系统概论|王珊)第六章关系数据理论-第一节:为什么要研究关系数据理论

    文章目录 一:概念回顾:关系模式 二:数据依赖 三:一个例子:不遵循关系数据理论导致的问题 一句话,研究关系数据库理论就是为了设计出合适的关系模式,也即合适.高效的表 一:概念回顾:关系模式 相关文章 ...

  2. (数据库系统概论|王珊)第七章数据库设计-第一节:数据库设计概述

    注意:此部分内容和软件工程的知识点重合较多,更多请点击[免费分享]软件工程核心知识点 本章较分散,各节导航如下 (数据库系统概论|王珊)第七章数据库设计-第二节:需求分析 (数据库系统概论|王珊)第七 ...

  3. (数据库系统概论|王珊)第三章关系数据库标准语言SQL:习题

    文章目录 名词解释 简答题 应用题 名词解释 视图:视图是一个虚表,其本质就是一条SELECT语句,而查询结果被赋予了一个名字,也即视图名字.或者说视图本身不包含任何数据,它只包含映射到基表的一个查询 ...

  4. (数据库系统概论|王珊)第九章关系查询处理和关系优化-第三节:查询优化之代数优化

    注意: 关系代数有关符号,大家可能又不熟悉了,点击跳转:(数据库系统概论|王珊)第二章关系数据库-第四节:关系代数 文章目录 一:关系代数表达式等价变换规则 (1)连接.笛卡尔积.并.交的交换律 (2 ...

  5. (数据库系统概论|王珊)第四章数据库安全性-第一节:数据库安全性概述

    文章目录 一:数据库的不安全因素 二:安全标准简介 (1)信息安全标准的发展简史 (2)TCSEC/TDI A:基本内容 B:安全级别划分 在(数据库系统概论|王珊)第一章绪论-第一节:数据库系统概论 ...

  6. (数据库系统概论|王珊)第三章关系数据库标准语言SQL-第四节:数据查询

    文章目录 ★★★★★SELECT语句格式★★★★★ 一:单表查询(查询时只涉及一张表) (1)选择表中的若干列 A:查询指定列 B:查询全部列 C:查询经过计算的值 ①:算数表达式 ②:字符串常量及函 ...

  7. (数据库系统概论|王珊)第三章关系数据库标准语言SQL-第二、三节:数据定义

    文章目录 零:有关说明 (1)安装数据库与建表 (2)一些语法说明 一:模式的定义和删除(SCHEMA) (1)定义模式 (2)删除模式 二:基本表的定义.删除和修改(TABLE) (1)定义基本表 ...

  8. (数据库系统概论|王珊)第二章关系数据库-第一节:关系数据结构及其形式化定义

    文章目录 一:关系 (1)域 (2)笛卡尔积 (3)关系 A:基本概述 B:码相关概念 C:关系的三种类型 二:关系模式 三:关系数据库 (1)基本概念 (2)关系数据库的型与值 前面说过,数据模型由 ...

  9. 数据库系统概论王珊编写的第三章学生-课程数据库

    一.前言 因为考研需求,我于是将数据库系统概论王珊编写的第三章学生-课程数据库的三张表实现了一下,为了简化操作,我没有实现部分外码功能. 我用的是MySQL实现的 二.正文 /*3. 创建学生表Stu ...

  10. (数据库系统概论|王珊)第七章数据库设计-第三节:概念结构设计

    pdf下载:密码7281 专栏目录首页:[专栏必读](考研复试)数据库系统概论第五版(王珊)专栏学习笔记目录导航及课后习题答案详解 文章目录 一:E-R模型 (1)两个实体之间的联系 ①:一对一联系( ...

最新文章

  1. docker容器-实战(分享十六)
  2. 完美解决百度地图MarkerClusterer 移动地图时,Marker 的Label 丢失的问题
  3. 不想学python-学Python好久都学不会?然后选择放弃,总结出这几个原因
  4. nonlocal和global关键字
  5. 【汇编优化】之X86架构优化公用头讲解
  6. 日语学习 「バージョン」 version と 「リビジョン」 revision
  7. Html5 Canvas动画基础碰撞检测的实现
  8. 研究生英语单词学习——Learning English
  9. DM8达梦数据库:sql查询达梦数据库实例的详情
  10. 操作系统的位数决定寻址空间
  11. oracle sql语句加减,Oracle sql 常用加减法
  12. JZOJ4991. Skyfall
  13. sublime复制一行_sublime怎么快速复制一行,快捷键是什么?
  14. Bootstrap Table Fixed Columns
  15. linux 6.7 远程端口,CentOS6.7安装vncserver及xrdp实现远程桌面
  16. VoLTE和语音呼通率测试开发--执行脚本(三)
  17. Python 机器学习工具库
  18. 个人计算机是国产芯片,全球最纯国产PC诞生!所有芯片/系统都是国产
  19. 计算机组成原理微控制器实验报告,计算机组成原理实验报告三
  20. Android TableLayout记

热门文章

  1. 虚拟IP技术 ip地址漂移技术
  2. MATLAB R2016a 安装详细教程
  3. java入门第二天如何使用Elipse
  4. 信号与系统_冲激函数匹配法
  5. win10字体安装_Win10操作系统下字体的安装教程(非常详细,适合新手DIY)
  6. 哲理故事300篇 中
  7. DarkSide勒索病毒分析
  8. lopatkin俄大神精简中文系统Windows 10 Pro 18898.1000 20H1 PreRelease x86-x64 ZH-CN DREY
  9. 阿里中间件首席架构师钟华:《企业IT架构转型之道:阿里巴巴中台战略思想与架构实战》新书出版(含试读PDF)!...
  10. 华中科技大学计算机基地班,华中科技大学基地班管理方法.doc