1:引言
     a:人类对数据的管理经历了人工管理,文件系统管理,数据库系统管理三个阶段,数据库管理实现了对数据的永久存储,有序组
  织和共享。
     b:在数据库系统管理阶段的早期,人们对数据的使用主要集中在crud。
     c:当数据积累到一定程度时,人们希望对数据进行统计,多维分析,甚至挖掘来产生更多的价值,这时候,传统的操作型数据库
  已经无法满足这一需求,因此便产生了数据仓库。
     d:传统的数据库与数据仓库在存放的数据特征,性能要求,应用范围,面向人员等方面均有差别。
2:两种数据处理模式:操作性数据处理和分析型数据处理
     计算机系统中存在着两种不同的数据处理模型:操作性数据处理和分析型数据处理,又分别称为联机事务处理和联机分析处理。
    A: 操作型数据处理:是指对数据库联机的日常操作,主要完成数据的收集,整理,存储以及增删改查等操作,主要由一般人员和
    基层管理人员完成。
    B: 分析型数据处理:是指对数据的再加工,通常是对海量的历史数据查询和分析,从中获取信息,主要由分析人员和中高级管理
    人员完成。
3:两类数据:操作型数据和分析型数据
     两种数据操作模式对应两类数据:操作型数据和分析型数据。
     操作型数据:细节的,当前的,可更新的,事务驱动,一次操作数据量小,操作简单,一个时刻操作一个单元
     分析型数据:综合的,历史的,可修改的,分析驱动,一次操作数据量大,计算复杂,一个时刻操作一个集合
     操作型数据:主要应用于企业的日常事务处理,数据库中存放的是细节的数据,也是当前的数据,反映的是最近一次修改的结
果。对数据库的操作主要是数据的增删改查,数据库中的数据可以修改,数据的组织以方便事务处理,提高事务性能处理为主。
     分析型数据处理:主要用于企业的管理工作,数据库中主要存放历史数据和综合数据,当数据的操作主要集中在查询和统计分
析时,需要涉及大量数据,数据的组织方式主要以方便查询分析为主要目标,为了提高查询效率允许存在一定的数据冗余。
4:数据的局限性
      传统的数据库在操作型数据处理上取得了巨大的成功,但是在分析型数据处理上遇到了瓶颈。
       1):数据的分散。操作型数据处理往往只需要涉及一个部门业务或者一个系统数据,因此现在的企业数据是分散在各个操作
型数据库,而分析型操作往往面向整个企业,跨部门进行。
       2):数据不一致问题。从各个操作型数据库中抽取数据会存在数据不一致的问题,比如同名异义,异名同义,单位不统一,
字长不一致等,因此在分析操作之前必须首先对这些数据进行预处理。
       3):历史数据问题。分析型数据操作一般需要大量的历史数据,但操作型数据库一般存放的是短期的数据。
       4):数据粒度的问题。分析型操作往往关注的是综合数据,但是操作型数据库往往存放的是细节数据,如果分析前对细节数
据进行综合,会严重影响分析的效率。
       因此,为了克服以上困难,使两种数据操作都能有效的进行,就产生了数据仓库。
       总结:数据库和数据仓库分工不同,数据库存放操作型数据,用于操作型数据处理,关注事务处理效率;
                             数据仓库存放分析型数据,用于分析型数据处理,关注的是分析和查询的效率;
 两者功能不同,用途不同,因此结构也会不同。
5:数据仓库的定义
     数据仓库是面向主题的,集成的,不可更新的,随时间不断变化的用来更好的支持企业或组织决策分析的数据集合。
     数据仓库的特征:
     面向主题的
     集成的
     不可更新的
     随时间不断变化的
     数据仓库的用途:面向企业决策分析。
     简单来讲,数据仓库就是一种面向决策主题的,从多个数据源集成数据的,拥有当前数据,细节级和综合级的历史数据,以查询
   和分析为主的数据库系统,目的是支持企业决策。
6:数据仓库数据的特征
      1):面向主题的
              面向主题的数据组织方式是相对面向应用的数据组织方式而言的。
              什么是面向主题的数据组织方式?
              面向主题的数据组织方式就是在较高层次上对分析对象的数据的一个完整的,一致的描述,能完整,统一的刻画各个分析对
    象所涉及的各项数据,以及数据之间的联系。
             
             企业在信息化建设时通常会按照业务类别来建立子系统,比如采购,销售,库存,人事,财务,子系统背后就是各个操作型
    数据库。基于这样的数据环境,如果需要对“顾客”这一对象进行相关的分析处理,就需要从各个操作型数据库中提取数
    据,即使能够取出来也会面临各种问题,比如数据不一致。这就是面向应用的数据组织方式,显然不能满足分析需要。
             面向主题就是根据分析的需要,将分析对象所涉及的数据以及数据之间的联系从企业各个方面进行收集,汇聚,形成一个完
    整的,一致的,统一的数据集合。这里的主题就是分析对象,比如“顾客”,“商品”,“供应商”。
             面向应用侧重于做什么,面向主题侧重于谁来做。
             面向主题的数据组织方式强调的就是,要形成关于主题一致的信息集合。
      2):集成的
     由于数据仓库中的数据是按照主题组织的,因此所涉及的数据来源于各个操作性数据库,数据文件胡总和网络。由于数据来
    源不同,就可能存在不一致的情况,比如同名异义,异名同义,单位不同,字长不同,因此在进入数据仓库前就需要对数据
    进行清洗,转换等操作。又因为之前的数据是面向应用的,因此需要将数据从面向应用到面向主题进行转变。而数据仓库中
    不仅有细节数据,还需要有大量的综合数据,所以就需要对数据进行综合,计算。完成这几步后,数据才能被加载到数据仓
    库中去。
      3):不可更新的
     不可更新是指数据一旦进入到数据仓库中去,就不允许修改,并且会被长期保留。
     数据仓库中的数据反映的是一段相当长时间内的历史数据,一般会按照一定的周期进行刷新,加载。
      4):随时间不断变化的
     数据仓库会随着时间的变化不断增加新的数据,因为数据仓库中的数据是来源于操作型数据库等数据源的历史数据和综合性
     数据,所以需要定期去捕获这些数据源中的新数据,将其加载到数据仓库中去。
       数据仓库中的数据会有一定的存储期限,当超过这个期限后,数据就会被删除。
              数据仓库中有大量的综合数据,而很多数据是按照时间进行组织的,比如日记录,月记录,所以就需要按照一定的时间周
    期,定期加载这些数据。
7:数据仓库的功能
 数据仓库是一种数据存储,将不同来源的异构数据进行清洗,转换,加工,集成并存储起来,支持分析查询需求,从而为企业决策提
供支持。

    

转载于:https://www.cnblogs.com/zja001/p/10282276.html

第一节:数据库与数据仓库相关推荐

  1. mysql php 入门_第一节 数据库概述_MySQL_php入门教程

    数据库是数据管理的有效技术,是计算机科学的重要分支.随着时代的发展,今天信息资源已经成为一种宝贵的财富.从校务管理系统到电子政务.商务系统,这些社会的方方面面都会产生庞大的数据,管理和使用这些数据成为 ...

  2. 【数据库系统原理】第一节数据库系统概述

    一.数据库基本概念 数据 数据(Data)是描述事物的符号记录,是指用物理符号记录下来的,可以鉴别的信息. 数据有多种表现形式,包括数字.字母.文字.特殊字符组成的文本数据,也可以是图形.图像.动画. ...

  3. 数据库系统原理 —— 第一章 数据库系统概述知识点总结(自考本)

    第一节 数据库基本概念 什么是数据? 什么是数据库? 数据库的基本特点 什么是数据库管理系统? 数据库管理系统的主要功能 什么是数据库系统? 数据库系统的组成 数据库系统结构图 第二节 数据管理技术的 ...

  4. (数据库系统概论|王珊)第四章数据库安全性-第一节:数据库安全性概述

    文章目录 一:数据库的不安全因素 二:安全标准简介 (1)信息安全标准的发展简史 (2)TCSEC/TDI A:基本内容 B:安全级别划分 在(数据库系统概论|王珊)第一章绪论-第一节:数据库系统概论 ...

  5. 软件构造 第二章 第一节 软件生命周期和版本控制

    软件构造第二章 第一节 软件生命周期和版本控制 基本内容 Software Development Lifecycle (SDLC) Traditional software process mode ...

  6. 数仓和mysql的区别_数据库和数据仓库的区别和联系

    数据库与数据仓库的区别和联系https://www.zhihu.com/video/1252167793992593408 在以往我们和客户的沟通过程中,大家经常会问到这样的一个问题,数据库和数据仓库 ...

  7. 第一节:别出心裁的HTML5简介

    来了来了,总算来了,新一个系列的连载,是:<HTML5开发>.想必部分期待reactjs和nodejs的同学会失望,但是,前端君怎么舍得让你难过.这次选择HTML5,只是顺序的问题.热门的 ...

  8. (数据库系统概论|王珊)第六章关系数据理论-第一节:为什么要研究关系数据理论

    文章目录 一:概念回顾:关系模式 二:数据依赖 三:一个例子:不遵循关系数据理论导致的问题 一句话,研究关系数据库理论就是为了设计出合适的关系模式,也即合适.高效的表 一:概念回顾:关系模式 相关文章 ...

  9. 第一节:创建SpringBoot项目并运行HelloWorld

    SpingBoot 365计划开始更新了,计划手敲365个SpringBoot案例回顾总结形成知识体系.目前已经输出了32节的内容.所有源码托管在GitHub和Gitee上. 1.第一节:创建Spri ...

最新文章

  1. leetcode算法题--Gas Station
  2. 重学java基础第十一课:基本的dos命令
  3. java gui 连接mysql数据库
  4. Win10配置Tensorflow_Object_Detection_API
  5. oracle 对象类型是什么意思,Oracle-对象类型
  6. 复变函数第一章第二章知识脑图
  7. 从零开始再造打爆李世石的AlphaGo:快速构建棋盘和围棋规则
  8. pcap头文件位置 Linux,pcap文件头的组织格式
  9. linux 根据字母产生颜文字 figlet
  10. 场效应管 - MOSFET
  11. 如何使用ARM协处理器CP15在32位ARRCH模式下操作64位寄存器)
  12. 学习笔记-Hadamard矩阵的Kronecker积
  13. pycharm调试时显示图片
  14. VC6.0 project settings
  15. CPU内核部件之:MMU、MPU、ITCM、DTCM、CCM、Cache
  16. 神经网络中“端到端”思想
  17. asp基础入门(上)
  18. 数学物理方法·基础⑦基本初等复变函数的计算公式/方法
  19. 解决HbuilderX拒绝访问页面的问题
  20. 创业内外部环境综合分析:创业究竟需要什么?

热门文章

  1. cdev_init() / cedev_alloc() / cdev_del()
  2. 【Tools】WireShark3.2安装教程详解
  3. mvc动态添加html控件,jquery – MVC3 Html.DisplayFor – 可以让这个控件生成一个ID吗?...
  4. 雪花算法原理_低照度摄像机原理及影响图像效果因素
  5. c语言node程序,如何从Node.js调用C代码?
  6. Docker Centos 7.X部署Mysql并修改编码
  7. 每天一道LeetCode-----括号匹配
  8. MFC使用CCommandLineInfo处理命令行
  9. Codeforces Round #506 (Div. 3) - E. Tree with Small Distances
  10. HDU Problem - 3763 CD(二分)