【数据仓库】Inmon与Kimball数仓理论对比
Inmon和Kimball是数据仓库领域伟大的开拓者,他们均多年从事数据仓库的研究,Inmon还被称为“数据仓库之父”。Inmon的《数据仓库》和Kimball的《数据仓库工具箱》都是此领域的经典之作。后来人把这两人的数据仓库思想总结为“Inmon理论”和“Kimball理论”。他们的思想有共同点,也有不同点。下面按照我的想法总结一下,理解如有偏颇,还请多多指正。
1. 共同点
(1)均极力推崇数据仓库,认为从OLTP到BI分析之间建立数据仓库是很有必要的;
(2)均认为数据仓库的建立需要从企业整体角度出发,迭代开发,尽量避免按部门建立独立的数据仓库;
(3)数据进入数据仓库之前,需要经过ETL整合。
2. 不同点
Inmon理论
(1)(必须把他的经典定义放在前面)数据仓库是一个面向主题的、集成的、随时间变化的、不易改变的用来支持管理人员决策的数据集合;
(2)自上而下按照主题建立数据仓库,如按照客户、供应商、产品等建立不同的主题。开发过程中每次增加一个主题;
(3)当建立的数据集市是跨多个主题的,需要以整合好的主题数据为基础。
Kimball理论
(1)自下而上,维度建模;
(2)先按照业务主线建立最小粒度的事实表,再建立维度表,形成数据集市,通过“一致维度”能够共同看到不同数据集市的信息;
【数据仓库】Inmon与Kimball数仓理论对比相关推荐
- 数据仓库 Inmon与Kimball数仓理论对比
Kimball和Inmon是两种主流的数据仓库方法论,分别由 Ralph Kimbal大神 和 Bill Inmon大神提出,在实际数据仓库建设中,业界往往会相互借鉴使用两种开发模式 Inmon和Ki ...
- 数据仓库简介、数据仓库的发展、数仓理论简介
数仓理论简介 数据仓库解决方案诞生至今,也有2.30年的发展历史了,在这个过程中,数仓理论不断被更新和完善,逐步形成了目前大家普通遵守的数仓开发理论(概念). 数据仓库的发展 阶段1 以解决数据孤岛为 ...
- 企业级数据仓库:数据仓库概述;核心技术框架,数仓理论,数据通道Hive技术框架,HBase设计,系统调度,关系模式范式,ER图,维度建模,星型/雪花/星座模式,数据采集同步,业务数据埋点,数据仓库规范
文章目录 第一章 数据仓库概述 1.1 数据仓库简介 1.1.2 什么是数据仓库? 1.1.3 OLTP 与 OLAP 1.2 数据仓库技术架构 1.3 课程目标 第二章 核心技术框架 2.1 数据仓 ...
- 数据仓库(二) 数仓理论(重点核心)
文章目录 数据仓库(二) 数仓理论(重点核心) 数仓分层 数据仓库分层 ODS层 DWD层 DWS层 DWT层 ADS层 数据仓库分层的好处 关系建模与维度建模 关系建模 维度建模 星型模型 雪花模型 ...
- 数据仓库项目(第五节)数仓理论、电商业务数仓介绍与创建
目录 数仓理论 表的分类 实体表 维度表 事务型事实表 周期型事实表 同步策略 实体表同步策略 维度表同步策略 事务型事实表同步策略 周期型事实表同步策略 范式理论 范式概念 函数依赖 三范式区分 关 ...
- 数据仓库系列:初识数仓
数据仓库系列:初识数仓 前言: 本节是数据仓库系列文章的第一篇,本系列的目的在于快速的构建一套最小化可运行的基础数据体系,过程中也会涉及一些数仓的理论知识,但更偏重的是数仓的实现和背后的思考逻辑.所以 ...
- 尚硅谷数据仓库实战之3数仓搭建
尚硅谷数据仓库实战之3数仓搭建 第4章 数仓搭建-ODS层 4.2 ODS层(业务数据) 4.2.1 活动信息表 第5章 数仓搭建-DIM层 5.1 商品维度表(全量) 5.6 用户维度表(拉链表) ...
- 《2020/07/24》数仓理论
数仓理论 1. 数仓分层 1.1 数仓分层 ODS(Operation Data Store)原始数据层 原始数据层,存放原始数据,直接加载原始日志.数据,数据保持原貌不做处理. DWD(Data W ...
- 数据仓库面试题汇总-数仓-四
目录 1.数仓与关系数据库区别? 2.数仓为什么需要分层?优缺点? 2.1 什么是数仓? 2.2 数据仓库建模的意义,为什么要对数据仓库分层? 3.数仓链路很长怎么保证任务有序执行? 4.消息队列(了 ...
最新文章
- 无监督学习:大数据带我们洞察现在,但小数据将带我们抵达未来
- samba linux文件服务器 changepassword + httpd 实现用户web自行修改密码
- 数据中心调试的重新思考
- 解决导入的maven聚合工程中子模块项目不显示
- uva 753(网络流最大流)
- myeclipse中的一些设置
- 在Angular应用的child Component里同时使用@Input和@Output
- 机器学习之线性回归(matlab)
- U-GAT-IT中的一些细节以及变量含义
- 【C语言 基础】什么流程控制?
- 全志 A64 开发板移植SQLite3
- 英文版的java项目简历_java开发英文简历范文
- abaqus帮助文档翻译,中英对照
- 利用opencv 做一个疲劳检测系统(2)
- 第20节 信息化基础知识
- 模式与数据库与表的关系
- 算法之迪杰斯特拉算法
- 金融银行软件测试超大型攻略,最受欢迎的金融银行大揭秘附面试题
- 干货|手把手教你写一个串口调试助手
- 给了一串数字:218916754,根据下面规则可以找出扣扣号码:首先删除第一个数,紧接着将第二个数放到这串数字的末尾,再将第三个数删除,并将第四个数放到这串数字的末尾......如此循环,知道剩下最后
热门文章
- matlab非线性系统频域标识,基于MATLAB的最小二乘法系统辨识与仿真
- mysql 61_MySQL 连接错误Can't connect to MySQL server on (61)
- php xampp 安装yaf,在apache中,yaf访问yaf,apache会异常退出是为何?
- python使用itchat获取微信好友列表
- [李景山php]每天TP5-20161205|Loader.php-3
- unity, 不要用TextMesh,用图片代替
- 今天走了一天, 才回到家
- 医疗数据分析——过高费用的异常检测
- 如何更好地理解和应用ITIL
- 2009年度工作安排计划