数据仓库搭建——Inmon与Kimball
一、简介
1.1 历史
搞数据仓库这么久,实践中发现首先搭建数据集市,还是清洗数据之后,直接进入数据立方体(形成维度表和实施表)形成核心数据仓库层,是个选择题...
随后发现这其实涉及到了数据仓库的历史问题,是采用Inmon建模还是采用Kimball建模?甚至有人称之为数据仓库界的宗教之争。下面我说一下自己的理解:
1.2 Inmon
2000年5月,W.H.Inmon在DM Review杂志上发表一篇文章,正是揭示了他的企业信息化工厂的特点。下图是我理解的企业信息化工厂架构图:
数据获取到之后,先进行整理,并且要求整理的数据是满足第三范式标准的。
1.3 Kimball
我理解,Kimball与Inmon的主要区别就是Kimball更强调一致性事实和维度,也就是一致性维度企业总线的总要作用,这样在数据仓库迭代开发过程中更接近需求,也会提升敏捷性。通常,Kimball都是以最终任务为导向。
首先,在得到数据后需要先做数据的探索,深入理解业务逻辑与数据表的关系。
然后,在明确数据依赖后,按照目标需求,直接生成事实表+维度表。
最后,(数据集市层)拆分出部分的事实表和维度表
结果,数据集市一方面可以直接向BI环节输出数据,另一方面也可以向数据仓库层输出数据,方便后续的多维分析。如下图:
二、特点
他们之间的区别用这个图表体现非常合适:
特性 | Kimball | Inmon |
---|---|---|
时间 | 快速交付 | 路漫漫其修远兮 |
开发难度 | 小 | 大 |
维护难度 | 大 | 小 |
技能要求 | 入门级 | 专家级 |
数据要求 | 特定业务 | 企业级 |
三、参考文献
https://segmentfault.com/a/1190000006255954
http://blog.csdn.net/paicMis/article/details/53236869
数据仓库搭建——Inmon与Kimball相关推荐
- 【数据仓库】Inmon与Kimball数仓理论对比
Inmon和Kimball是数据仓库领域伟大的开拓者,他们均多年从事数据仓库的研究,Inmon还被称为"数据仓库之父".Inmon的<数据仓库>和Kimball的< ...
- 数据仓库Inmon和Kimball架构
文章目录 一.Inmon 架构 二.Kimball 架构 三.Inmon vs Kimball 三.独立数据集市 五.总结 关注我的公众号[宝哥大数据],更多干货 对于数据仓库体系结构的最佳问题,始终 ...
- 数据仓库 Inmon与Kimball数仓理论对比
Kimball和Inmon是两种主流的数据仓库方法论,分别由 Ralph Kimbal大神 和 Bill Inmon大神提出,在实际数据仓库建设中,业界往往会相互借鉴使用两种开发模式 Inmon和Ki ...
- 数据仓库中的Inmon与Kimball架构之争
对于数据仓库体系结构的最佳问题,始终存在许多不同的看法,甚至有人把Inmon和Kimball之争称之为数据仓库界的"宗教战争",那么本文就通过对两位提倡的数据仓库体系和市场流行的另 ...
- 数据仓库中的Inmon与Kimball架构
对于数据仓库体系结构的最佳问题,始终存在许多不同的看法,甚至有人把Inmon和Kimball之争称之为数据仓库界的"宗教战争",那么本文就通过对两位提倡的数据仓库体系和市场流行的另 ...
- 层 数据仓库_小尝试:基于指标体系的数据仓库搭建和数据可视化
关于作者:小姬,某知名互联网公司产品专家,对数据采集.生产.加工有所了解,期望多和大家交流数据知识,以数据作为提出好问题的基础,挖掘商业价值. 0x00 前言 我将整理文章分享数据工作中的经验,因为业 ...
- 电商平台数据仓库搭建01-项目介绍
1,项目说明 本项目来源于github 电商平台数据仓库搭建 .该项目仅供个学习使用 项目为个人学习记录,项目代码及文件可访问 电商平台数据仓库搭建 获得.访问不了的同学也可以私信我. 2,项目流程设 ...
- 电商平台数据仓库搭建02-Hadoop集群搭建
1,项目说明 本项目来源于github 电商平台数据仓库搭建 . 项目为个人学习记录,项目代码及文件可访问 电商平台数据仓库搭建 获得. 2,项目准备 虚拟机准备 虚拟机开发工具为 VMware15. ...
- 6.数据仓库搭建之数据仓库设计
数据仓库搭建之数据仓库设计 1.数据仓库的分层规划 本项目的分层规划如下图所示: 对于原始数据层(ODS):该层我们存放的是未经处理的原始数据,结构上与源系统保持一致,这是数据仓库的数据准备区. 对于 ...
- 10.数据仓库搭建之DWD层搭建
数据仓库搭建之DWD层搭建 我们在设计项目中DWD层时,需要注意以下几点: 1)DWD层的设计依据维度建模理论,该层存储维度模型当中的事实表. 2)DWD层的数据存储格式为ORC列式存储结合snapp ...
最新文章
- Apple Mac OS X每日一技巧026:Spotlight打开文件所在的文件夹
- .NET体系中的源程序安全问题
- CCF201712-5 商路(60分题解链接)
- ./configure,make,make install 的作用
- 什么是持续集成(CI)/持续部署(CD)?
- RecyclerView 判断滑到底部 顶部 预加载 更多 分页 MD
- C++程序设计课程主页-2014级
- 【图像特征提取】基于matlab脉冲耦合神经网络(PCNN)图像特征提取【含Matlab源码 1868期】
- 关于Axure原型在Axure share上的尺寸问题。
- 通达oa mysql密码_谁知道通达OA数据库user表密码的加密方法?
- Docker源码分析(三)之Docker Daemon
- 程序异常终止:Process finished with exit code -1073741819 (0xC0000005)
- Luogu P2751 [USACO4.2]工序安排Job Processing
- 自由人NFT元农(Meta Agriculture)发行计划
- 【优化分配】基遗传算法求解医疗资源分配优化问题【含Matlab源码 1419期】
- fatal: pathspec ‘dianji_02‘ did not match any files
- 智能手表音频特性测试_中学生可以戴99.9元的小米有品-Haylou/嘿喽智能手表上学吗?...
- Beauty Box for Premiere Pro Mac(pr人像磨皮美容插件)
- 双摄像头的实时视频拼接及目标跟踪(七)
- 二层广播(帧广播)和三层广播(路由器广播)有什么区别?