第一节:数据库与数据仓库
a:人类对数据的管理经历了人工管理,文件系统管理,数据库系统管理三个阶段,数据库管理实现了对数据的永久存储,有序组
b:在数据库系统管理阶段的早期,人们对数据的使用主要集中在crud。
c:当数据积累到一定程度时,人们希望对数据进行统计,多维分析,甚至挖掘来产生更多的价值,这时候,传统的操作型数据库
计算机系统中存在着两种不同的数据处理模型:操作性数据处理和分析型数据处理,又分别称为联机事务处理和联机分析处理。
A: 操作型数据处理:是指对数据库联机的日常操作,主要完成数据的收集,整理,存储以及增删改查等操作,主要由一般人员和
两种数据操作模式对应两类数据:操作型数据和分析型数据。
操作型数据:细节的,当前的,可更新的,事务驱动,一次操作数据量小,操作简单,一个时刻操作一个单元
分析型数据:综合的,历史的,可修改的,分析驱动,一次操作数据量大,计算复杂,一个时刻操作一个集合
操作型数据:主要应用于企业的日常事务处理,数据库中存放的是细节的数据,也是当前的数据,反映的是最近一次修改的结
传统的数据库在操作型数据处理上取得了巨大的成功,但是在分析型数据处理上遇到了瓶颈。
1):数据的分散。操作型数据处理往往只需要涉及一个部门业务或者一个系统数据,因此现在的企业数据是分散在各个操作
2):数据不一致问题。从各个操作型数据库中抽取数据会存在数据不一致的问题,比如同名异义,异名同义,单位不统一,
3):历史数据问题。分析型数据操作一般需要大量的历史数据,但操作型数据库一般存放的是短期的数据。
4):数据粒度的问题。分析型操作往往关注的是综合数据,但是操作型数据库往往存放的是细节数据,如果分析前对细节数
因此,为了克服以上困难,使两种数据操作都能有效的进行,就产生了数据仓库。
总结:数据库和数据仓库分工不同,数据库存放操作型数据,用于操作型数据处理,关注事务处理效率;
数据仓库存放分析型数据,用于分析型数据处理,关注的是分析和查询的效率;
两者功能不同,用途不同,因此结构也会不同。
5:数据仓库的定义
数据仓库是面向主题的,集成的,不可更新的,随时间不断变化的用来更好的支持企业或组织决策分析的数据集合。
数据仓库的特征:
面向主题的
集成的
不可更新的
随时间不断变化的
数据仓库的用途:面向企业决策分析。
简单来讲,数据仓库就是一种面向决策主题的,从多个数据源集成数据的,拥有当前数据,细节级和综合级的历史数据,以查询
1):面向主题的
面向主题的数据组织方式是相对面向应用的数据组织方式而言的。
什么是面向主题的数据组织方式?
面向主题的数据组织方式就是在较高层次上对分析对象的数据的一个完整的,一致的描述,能完整,统一的刻画各个分析对
企业在信息化建设时通常会按照业务类别来建立子系统,比如采购,销售,库存,人事,财务,子系统背后就是各个操作型
面向主题的数据组织方式强调的就是,要形成关于主题一致的信息集合。
2):集成的
由于数据仓库中的数据是按照主题组织的,因此所涉及的数据来源于各个操作性数据库,数据文件胡总和网络。由于数据来
不可更新是指数据一旦进入到数据仓库中去,就不允许修改,并且会被长期保留。
数据仓库中的数据反映的是一段相当长时间内的历史数据,一般会按照一定的周期进行刷新,加载。
4):随时间不断变化的
数据仓库会随着时间的变化不断增加新的数据,因为数据仓库中的数据是来源于操作型数据库等数据源的历史数据和综合性
数据仓库中的数据会有一定的存储期限,当超过这个期限后,数据就会被删除。
数据仓库中有大量的综合数据,而很多数据是按照时间进行组织的,比如日记录,月记录,所以就需要按照一定的时间周
数据仓库是一种数据存储,将不同来源的异构数据进行清洗,转换,加工,集成并存储起来,支持分析查询需求,从而为企业决策提
转载于:https://www.cnblogs.com/zja001/p/10282276.html
第一节:数据库与数据仓库相关推荐
- mysql php 入门_第一节 数据库概述_MySQL_php入门教程
数据库是数据管理的有效技术,是计算机科学的重要分支.随着时代的发展,今天信息资源已经成为一种宝贵的财富.从校务管理系统到电子政务.商务系统,这些社会的方方面面都会产生庞大的数据,管理和使用这些数据成为 ...
- 【数据库系统原理】第一节数据库系统概述
一.数据库基本概念 数据 数据(Data)是描述事物的符号记录,是指用物理符号记录下来的,可以鉴别的信息. 数据有多种表现形式,包括数字.字母.文字.特殊字符组成的文本数据,也可以是图形.图像.动画. ...
- 数据库系统原理 —— 第一章 数据库系统概述知识点总结(自考本)
第一节 数据库基本概念 什么是数据? 什么是数据库? 数据库的基本特点 什么是数据库管理系统? 数据库管理系统的主要功能 什么是数据库系统? 数据库系统的组成 数据库系统结构图 第二节 数据管理技术的 ...
- (数据库系统概论|王珊)第四章数据库安全性-第一节:数据库安全性概述
文章目录 一:数据库的不安全因素 二:安全标准简介 (1)信息安全标准的发展简史 (2)TCSEC/TDI A:基本内容 B:安全级别划分 在(数据库系统概论|王珊)第一章绪论-第一节:数据库系统概论 ...
- 软件构造 第二章 第一节 软件生命周期和版本控制
软件构造第二章 第一节 软件生命周期和版本控制 基本内容 Software Development Lifecycle (SDLC) Traditional software process mode ...
- 数仓和mysql的区别_数据库和数据仓库的区别和联系
数据库与数据仓库的区别和联系https://www.zhihu.com/video/1252167793992593408 在以往我们和客户的沟通过程中,大家经常会问到这样的一个问题,数据库和数据仓库 ...
- 第一节:别出心裁的HTML5简介
来了来了,总算来了,新一个系列的连载,是:<HTML5开发>.想必部分期待reactjs和nodejs的同学会失望,但是,前端君怎么舍得让你难过.这次选择HTML5,只是顺序的问题.热门的 ...
- (数据库系统概论|王珊)第六章关系数据理论-第一节:为什么要研究关系数据理论
文章目录 一:概念回顾:关系模式 二:数据依赖 三:一个例子:不遵循关系数据理论导致的问题 一句话,研究关系数据库理论就是为了设计出合适的关系模式,也即合适.高效的表 一:概念回顾:关系模式 相关文章 ...
- 第一节:创建SpringBoot项目并运行HelloWorld
SpingBoot 365计划开始更新了,计划手敲365个SpringBoot案例回顾总结形成知识体系.目前已经输出了32节的内容.所有源码托管在GitHub和Gitee上. 1.第一节:创建Spri ...
最新文章
- leetcode算法题--Gas Station
- 重学java基础第十一课:基本的dos命令
- java gui 连接mysql数据库
- Win10配置Tensorflow_Object_Detection_API
- oracle 对象类型是什么意思,Oracle-对象类型
- 复变函数第一章第二章知识脑图
- 从零开始再造打爆李世石的AlphaGo:快速构建棋盘和围棋规则
- pcap头文件位置 Linux,pcap文件头的组织格式
- linux 根据字母产生颜文字 figlet
- 场效应管 - MOSFET
- 如何使用ARM协处理器CP15在32位ARRCH模式下操作64位寄存器)
- 学习笔记-Hadamard矩阵的Kronecker积
- pycharm调试时显示图片
- VC6.0 project settings
- CPU内核部件之:MMU、MPU、ITCM、DTCM、CCM、Cache
- 神经网络中“端到端”思想
- asp基础入门(上)
- 数学物理方法·基础⑦基本初等复变函数的计算公式/方法
- 解决HbuilderX拒绝访问页面的问题
- 创业内外部环境综合分析:创业究竟需要什么?
热门文章
- cdev_init() / cedev_alloc() / cdev_del()
- 【Tools】WireShark3.2安装教程详解
- mvc动态添加html控件,jquery – MVC3 Html.DisplayFor – 可以让这个控件生成一个ID吗?...
- 雪花算法原理_低照度摄像机原理及影响图像效果因素
- c语言node程序,如何从Node.js调用C代码?
- Docker Centos 7.X部署Mysql并修改编码
- 每天一道LeetCode-----括号匹配
- MFC使用CCommandLineInfo处理命令行
- Codeforces Round #506 (Div. 3) - E. Tree with Small Distances
- HDU Problem - 3763 CD(二分)