继续肝吧,本章主要讲的数据库安全,分布式数据库,数据仓库技术,反规范化技术,大数据,概念性的东西比较多。

1.数据库安全

考的不多,了解下补充自己的知识。

静态转储:即冷备份,指在转储期间不允许对数据库进行任何存取、修改操作;优点是非常快速的备份方法、容易归档(直接物理复制操作);

缺点是只能提供到某一时间点上的恢复,不能做其他工作,不能按表或按用户恢复。

动态转储:即热备份,在转储期间允许对数据库进行存取、修改操作,因此,转储和用户事务可并发执行;

优点是可在表空间或数据库文件级备份,数据库仍可使用,可达到秒级恢复;

缺点是不能出错,否则后果严重,若热备份不成功,所得结果几乎全部无效。

完全备份:备份所有数据。

差量备份:仅备份上一次完全备份之后变化的数据。

增量备份:备份上一次备份之后变化的数据。

日志文件:在事务处理过程中,DBMS把事务开始、事务结束以及对数据库的插入、删除和修改的每一次操作写入日志文件。一旦发生故障,DBMS的恢复子系统利用日志文件撤销事务对数据库的改变,回退到事务的初始状态。

差量备份跟增量备份的区别是,差量备份是备份上一次完全备份之后变化的数据,(主要是这个上一次完全备份!)

2.分布式数据库

分布式也有自己的三级模式两级映像!内模式分为了:分片模式和分布模式。

局部数据库位于不同的物理位置,使用一个全局DBMS将所有局部数据库联网管理,这就是分布式数据库。

分片模式

水平分片:将表中水平的记录分别存放在不同的地方。

垂直分片:将表中的垂直的列值分别存放在不同的地方。

分布透明性

分片透明性:用户或应用程序不需要知道逻辑上访问的表具体是如何分块存储的

位置透明性:应用程序不关心数据存储物理位置的改变

逻辑透明性:用户或应用程序无需知道局部使用的是哪种数据模型

复制透明性:用户或应用程序不关心复制的数据从何而来

3.数据仓库技术

数据仓库是一个面向主题的、集成的、非易失的、且随时间变化的数据集合,用于支持管理决策。

面向主题:按照一定的主题域进行组织的。

集成的:数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息。

相对稳定的:数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新。

反映历史变化:数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。

数据仓库的结构通常包含四个层次,如下图所示:

1.数据源:是数据仓库系统的基础,是整个系统的数据源泉。

2.数据的存储与管理:是整个数据仓库系统的核心。

3.OLAP(联机分析处理)服务器:对分析需要的数据进行有效集成,按多维模型组织,以便进行多角度、多层次的分析,并发现趋势。

4.前端工具:主要包括各种报表工具、查询工具、数据分析工具、数据挖掘工具以及各种基于数据仓库或数据集市的应用开发工具。

BI系统主要包括数据预处理、建立数据仓库、数据分析和数据展现四个主要阶段。

数据预处理是整合企业原始数据的第一步,它包括数据的抽取(Extraction)、转换(Transformation)和加载(Load)三个过程(ETL过程);

建立数据仓库则是处理海量数据的基础;

数据分析是体现系统智能的关键,一段采用联机分析处理(OLAP)和数据挖掘两大技术。联机分析处理不仅进行数据汇总/聚集,同时还提供切片、切块、下钻、上卷和旋转等数据分析功能,用户可以方便地对海量数据进行多维分析。数据挖掘的目标则是挖掘数据背后隐藏的知识,通过关联分析、聚类和分类等方法建立分析模型,预测企业未来发展趋势和将要面临的问题;

在海量数据和分析手段增多的情况下,数据展现则主要保障系统分析结果的可视化。

4.反规范化技术

反规范化技术:规范化设计后,数据库设计者希望牺牲部分规范化来提高性能

采用反规范化技术的益处:降低连接操作的需求、降低外码和索引的数目,还可能减少表的数目,能够提高查询效率。

可能带来的问题:数据的重复存储,浪费了磁盘空间;可能出现数据的完整性问题,为了保障数据的一致性,增加了数据维护的复杂性,会降低修改速度

具体方法:

(1)增加冗余列:在多个表中保留相同的列,通过增加数据冗余减少或避免查询时的连接操作。

(2)增加派生列:在表中增加可以由本表或其它表中数据计算生成的列,减少查询时的连接操作并避免计算或使用集合函数。

(3)重新组表:如果许多用户需要查看两个表连接出来的结果数据,则把这两个表重新组成一个表来减少连接而提高性能。

(4)水平分割表:根据一列或多列数据的值,把数据放到多个独立的表中,主要用于表数据规模很大、表中数据相对独立或数据需要存放到多个介质上时使用。

(5)垂直分割表:对表进行分割,将键与部分列放到一个表中,主键与其它列放到另一个表中,在查询时减少1/0次数。

5.大数据

考试的话,基本就是送分题。

特点:大量化、多样化、价值密度低、快速化。

大数据和传统数据的比较如下:

要处理大数据,一般使用集成平台,称为大数据处理系统,其特征为:

高度可扩展性、高性能、高度容错、支持异构环境、较短的分析延迟、易用且开放的接口、较低成本、向下兼容性。

考题来了:

1.为了保证数据库中数据的安全可靠和正确有效,系统在进行事务处理时,对数据的插入、删除或修改的全部有关内容先写入();当系统正常运行时,按一定的时间间隔,把数据库缓冲区内容写入();当发生故障时,根据现场数据内容及相关文件来恢复系统的状态。

A.索引文件 B.数据文件 C.日志文件 D.数据字典

A.索引文件 B.数据文件 C.日志文件 D.数据字典

2.数据仓库中数据()的特点是指数据一旦进入数据仓库后,将被长期保留并定期加载和刷新,可以进行各种查询操作,但很少对数据进行修改和删除操作。

A.面向主题 B.集成性 C.相对稳定性 D.反映历史变化

数据库安全-分布式数据库-数据仓库技术-反规范化技术-大数据相关推荐

  1. 大数据技术介绍:01大数据概述

    大数据技术介绍:01大数据概述 大数据技术框架: Hadoop生态系统(1) Hadoop生态系统(2) Hadoop构成:Flume(非结构化数据收集): Cloudera开源的日志收集系统 用于非 ...

  2. 大数据技术原理与应用——大数据存储与管理

    大数据技术原理与应用--大数据存储与管理 1.分布式文件系统 (1)计算机集群结构 集群的概念 集群是指将多台服务器整合在一起,每台服务器都实现相同的业务,做相同的事情. 每台服务器并不是缺一不可,它 ...

  3. 学python对数学要求高吗_人工智能的小男孩 大专学历的人没有数学基础想学习python技术未来能往大数据或人工智能方向进行职业发展吗?...

    内容由传智播客提供,电器吧机器人网提供人工智能的小男孩相关内容,小编烟酉为您整理并发布于人工智能栏目下,原标题:大专学历的人没有数学基础想学习python技术未来能往大数据或人工智能方向进行职业发展吗 ...

  4. python大数据需要什么技术有前途_大数据就业前景好不好 一般要掌握哪些技术...

    大数据就业前景好不好?一般要掌握哪些技术?目前,大数据人才的就业薪资水涨船高,一般在两万左右.不过这个薪资水平是不固定的,一是看个人技术能力如何,再就是看公司了,有的公司非常重视大数据技术人才,就开出 ...

  5. 大数据技术与应用 百度大数据显威力

    大数据技术与应用 百度大数据显威力 "大数据时代,如此清晰地让人们感觉到大数据的存在与威力." 在刚过去不久的清明节假期中,百度预测因为连续多天得到CCTV13<新闻直播间& ...

  6. 虚拟化技术与云计算基础 大数据视频教程

    虚拟化是云计算的重要支撑技术.是基于互联网的相关服务的增加.使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源.通过虚拟化,可以将应用程序和数据在不同层次以不同的方式展现给客户,为 ...

  7. 视频教程-直通企业的数据仓库处理术—启动篇-大数据

    直通企业的数据仓库处理术-启动篇 数据架构与处理方向咨询师. 某高等教育职业技术学院特约讲师. 12年银行金融和保险业项目经验. 熟悉项目管理,数据建模,ETL数据处理和报表展现.在数据建模,数据仓库 ...

  8. McObject的eXtremeDB凭“杰出的结构化数据库”荣获业界倍受推崇的大数据卓越奖

    2018年5月29日 - 伦敦,纽约,西雅图:极速数据库管理系统eXtremeDB®的开发商McObject®,宣布以"杰出结构化数据库"类别荣获业界著名的大数据卓越奖. eXtr ...

  9. 数据库设计之反规范化

    1.反规范的好处  是否规范化的程度越高越好?这要根据需要来决定,因为"分离"越深,产生的关系越多,关系过多,连接操作越频繁,而连接操作是最费时间的,特别对以查询为主的数据库应用来 ...

最新文章

  1. android系统密码设置功能,手机锁屏密码怎么设置 三种安卓手机锁屏方式推荐
  2. 2015年国际智慧教育展览会盛大开幕
  3. Ubuntu 创建开机自启动脚本的方法
  4. redis演练(5) redis持久化
  5. Java面试10大知识点总结宝典助你通关!已拿意向书!
  6. epoll哪些触发模式_epoll的内部实现 百万级别句柄监听 lt和et模式非常好的解释...
  7. oracle 12c 取消omf,Oracle12c创建及删除PDB
  8. 19. 用 GTK+ 进行GNOME 编程,用 Qt进行KDE 编程
  9. winrar 4.20 注册码
  10. YDOOK:ANSYS 谐波分析的要点和主要应用场景 谐波效应的来源
  11. HTTP 报文及作用
  12. python安装文件或目录损坏_文件或目录损坏且无法读取的解决办法
  13. 攻防世界web练习5
  14. 无锡学python_无锡python基础编程好学吗
  15. FMS4.5 (Flash media server)视频服务器安装和配置以及pomelo聊天室的调用
  16. VTK:体绘制裁剪——Clipping技术
  17. 【JS】递归获取树的所有叶子节点
  18. Java校验XML文件
  19. seatunnel 架构
  20. 陀螺仪偏航角的夹角计算方法

热门文章

  1. 安装虚拟机 vmware
  2. chmod的用法|SHELL积累
  3. UVM virtual interface errors
  4. 抖音seo企业号开发在线客服关键系统上线.技术源代码mvc架构搭建
  5. RFID与物联网的关系是什么?
  6. Ardupilot固件之Flightgear模拟仿真
  7. 自然语言理解(三)—— 逻辑形式语言
  8. UIUC计算机科学系博士,PhD捷报|计算机博士全美TOP5!清华首批UIUC CS PhD全奖!恭喜Nuts清华学员!...
  9. Web前端学习笔记01:Web标准_HTML_lang_字符集_HTML标签的语义化
  10. 申请 Apple ID 的操作方法