Inmon和Kimball是数据仓库领域伟大的开拓者,他们均多年从事数据仓库的研究,Inmon还被称为“数据仓库之父”。Inmon的《数据仓库》和Kimball的《数据仓库工具箱》都是此领域的经典之作。后来人把这两人的数据仓库思想总结为“Inmon理论”和“Kimball理论”。他们的思想有共同点,也有不同点。下面按照我的想法总结一下,理解如有偏颇,还请多多指正。

1. 共同点

(1)均极力推崇数据仓库,认为从OLTP到BI分析之间建立数据仓库是很有必要的;

(2)均认为数据仓库的建立需要从企业整体角度出发,迭代开发,尽量避免按部门建立独立的数据仓库;

(3)数据进入数据仓库之前,需要经过ETL整合。

2. 不同点

Inmon理论

(1)(必须把他的经典定义放在前面)数据仓库是一个面向主题的、集成的、随时间变化的、不易改变的用来支持管理人员决策的数据集合;

(2)自上而下按照主题建立数据仓库,如按照客户、供应商、产品等建立不同的主题。开发过程中每次增加一个主题;

(3)当建立的数据集市是跨多个主题的,需要以整合好的主题数据为基础。

Kimball理论

(1)自下而上,维度建模;

(2)先按照业务主线建立最小粒度的事实表,再建立维度表,形成数据集市,通过“一致维度”能够共同看到不同数据集市的信息;

【数据仓库】Inmon与Kimball数仓理论对比相关推荐

  1. 数据仓库 Inmon与Kimball数仓理论对比

    Kimball和Inmon是两种主流的数据仓库方法论,分别由 Ralph Kimbal大神 和 Bill Inmon大神提出,在实际数据仓库建设中,业界往往会相互借鉴使用两种开发模式 Inmon和Ki ...

  2. 数据仓库简介、数据仓库的发展、数仓理论简介

    数仓理论简介 数据仓库解决方案诞生至今,也有2.30年的发展历史了,在这个过程中,数仓理论不断被更新和完善,逐步形成了目前大家普通遵守的数仓开发理论(概念). 数据仓库的发展 阶段1 以解决数据孤岛为 ...

  3. 企业级数据仓库:数据仓库概述;核心技术框架,数仓理论,数据通道Hive技术框架,HBase设计,系统调度,关系模式范式,ER图,维度建模,星型/雪花/星座模式,数据采集同步,业务数据埋点,数据仓库规范

    文章目录 第一章 数据仓库概述 1.1 数据仓库简介 1.1.2 什么是数据仓库? 1.1.3 OLTP 与 OLAP 1.2 数据仓库技术架构 1.3 课程目标 第二章 核心技术框架 2.1 数据仓 ...

  4. 数据仓库(二) 数仓理论(重点核心)

    文章目录 数据仓库(二) 数仓理论(重点核心) 数仓分层 数据仓库分层 ODS层 DWD层 DWS层 DWT层 ADS层 数据仓库分层的好处 关系建模与维度建模 关系建模 维度建模 星型模型 雪花模型 ...

  5. 数据仓库项目(第五节)数仓理论、电商业务数仓介绍与创建

    目录 数仓理论 表的分类 实体表 维度表 事务型事实表 周期型事实表 同步策略 实体表同步策略 维度表同步策略 事务型事实表同步策略 周期型事实表同步策略 范式理论 范式概念 函数依赖 三范式区分 关 ...

  6. 数据仓库系列:初识数仓

    数据仓库系列:初识数仓 前言: 本节是数据仓库系列文章的第一篇,本系列的目的在于快速的构建一套最小化可运行的基础数据体系,过程中也会涉及一些数仓的理论知识,但更偏重的是数仓的实现和背后的思考逻辑.所以 ...

  7. 尚硅谷数据仓库实战之3数仓搭建

    尚硅谷数据仓库实战之3数仓搭建 第4章 数仓搭建-ODS层 4.2 ODS层(业务数据) 4.2.1 活动信息表 第5章 数仓搭建-DIM层 5.1 商品维度表(全量) 5.6 用户维度表(拉链表) ...

  8. 《2020/07/24》数仓理论

    数仓理论 1. 数仓分层 1.1 数仓分层 ODS(Operation Data Store)原始数据层 原始数据层,存放原始数据,直接加载原始日志.数据,数据保持原貌不做处理. DWD(Data W ...

  9. 数据仓库面试题汇总-数仓-四

    目录 1.数仓与关系数据库区别? 2.数仓为什么需要分层?优缺点? 2.1 什么是数仓? 2.2 数据仓库建模的意义,为什么要对数据仓库分层? 3.数仓链路很长怎么保证任务有序执行? 4.消息队列(了 ...

最新文章

  1. 无监督学习:大数据带我们洞察现在,但小数据将带我们抵达未来
  2. samba linux文件服务器 changepassword + httpd 实现用户web自行修改密码
  3. 数据中心调试的重新思考
  4. 解决导入的maven聚合工程中子模块项目不显示
  5. uva 753(网络流最大流)
  6. myeclipse中的一些设置
  7. 在Angular应用的child Component里同时使用@Input和@Output
  8. 机器学习之线性回归(matlab)
  9. U-GAT-IT中的一些细节以及变量含义
  10. 【C语言 基础】什么流程控制?
  11. 全志 A64 开发板移植SQLite3
  12. 英文版的java项目简历_java开发英文简历范文
  13. abaqus帮助文档翻译,中英对照
  14. 利用opencv 做一个疲劳检测系统(2)
  15. 第20节 信息化基础知识
  16. 模式与数据库与表的关系
  17. 算法之迪杰斯特拉算法
  18. 金融银行软件测试超大型攻略,最受欢迎的金融银行大揭秘附面试题
  19. 干货|手把手教你写一个串口调试助手
  20. 给了一串数字:218916754,根据下面规则可以找出扣扣号码:首先删除第一个数,紧接着将第二个数放到这串数字的末尾,再将第三个数删除,并将第四个数放到这串数字的末尾......如此循环,知道剩下最后

热门文章

  1. matlab非线性系统频域标识,基于MATLAB的最小二乘法系统辨识与仿真
  2. mysql 61_MySQL 连接错误Can't connect to MySQL server on (61)
  3. php xampp 安装yaf,在apache中,yaf访问yaf,apache会异常退出是为何?
  4. python使用itchat获取微信好友列表
  5. [李景山php]每天TP5-20161205|Loader.php-3
  6. unity, 不要用TextMesh,用图片代替
  7. 今天走了一天, 才回到家
  8. 医疗数据分析——过高费用的异常检测
  9. 如何更好地理解和应用ITIL
  10. 2009年度工作安排计划