数据仓库模型数据仓库四大模型
ER模型(Bill Inmon 比尔·恩门)提出 (大型企业底层构建)
1,整体性考虑:全面了解企业业务和数据
2,实施周期长
3,建模人员的能力要求高
步骤:
高层模型:考虑所有上层主题,主题之间的关系
中层模型:细化 上层主题 数据项
物理模型:基于性能,存储,平台特点,数据合并,分区设计
维度建模(Ralph Kimball 拉尔夫·金博尔)提出 (当前最主流的模型)
星型:所有维表直接连接到事实表
雪花型: 当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上
(雪花型场景:
1, 大型客户维度,客户属性需要隐匿
2,银行、金融多种产品属性无法共享
3,多切页日历维,结账期、季度、假期
)
建模过程
1,选择需要进行分析决策的业务过程
2,选择粒度:时间维度
3,识别维表:基于粒度设计维表,包括维度属性,用于分析时进行分组和筛选
4,选择事实:确定分析需要衡量的指标,筛选有用字段
Data Vault 模型:ER模型的衍生,设计出发点是为了实现数据整合,但不能直接用于数据分析决策。强调数据的历史性、可追溯性和原子性。范化程度较高
Anchor 模型:对Data Vault进一步范化处理,核心思想是所有的扩展都是添加而不是修改,模型高度范化,6NF。基本变成k-v结构模型
数据仓库模型数据仓库四大模型相关推荐
- 数据仓库—stg层_马蜂窝数据仓库的架构、模型与应用实践
(马蜂窝技术原创内容,公众号ID:mfwtech) 一.马蜂窝数据仓库与数据中台 最近几年,数据中台概念的热度一直不减.2018 年起,马蜂窝也开始了自己的数据中台探索之路. 数据中台到底是什么?要不 ...
- 马蜂窝数据仓库的架构、模型与应用实践(转)
马蜂窝数据仓库的架构.模型与应用实践(转) Part.1 马蜂窝数据仓库与数据中台 最近几年,数据中台概念的热度一直不减.2018 年起,马蜂窝也开始了自己的数据中台探索之路. 数据中台到底是什么? ...
- 电商数据仓库的架构、模型与应用实践
一. 数据仓库概念 二. 项目需求及架构设计 1. 项目需求分析 2. 项目框架 2.1 技术选型 2.2 系统数据流程设计 2.3 框架版本选型 2.4 服务器选型 2.5 集群资源规划设计 2)测 ...
- 数据仓库星型模型vs雪花模型
一.概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型.在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织. 当所有维 ...
- 大数据开发:数据仓库建模方法与模型
大数据平台当中的数据仓库,往往需要通过建模来更好地对数据进行存储和管理,这其中涉及到性能.成本.效率.质量等多方面的综合考量,对于工程师来说,也需要细细规划.今天的大数据开发分享,我们主要来讲讲数据仓 ...
- 浅谈Opencl四大模型之Programming Model
Opencl 平台模型解决了 硬件兼容问题,将各种硬件抽象成了模型:执行模型解决了opencl程序如何运行的问题:内存模型解决了opencl 内存管理 问题,而编程模型(programming mod ...
- 浅谈Opencl四大模型之Platform model
Opencl是一种典型的异构架构,可以很好的实施并发性,为了简化并行计算复杂度以及兼容各个芯片差异性,opencl将其抽象为四大模型(Platform model, Execution model,M ...
- Kimball多维模型的四大误解
很久没看模型方面的理论知识,最近3年在互联网公司琢磨前行,遇到了很多坑和自我否定或迷惑的状态.就多维模型来说,被传统行业洗礼,还有误人子弟的网上文章和CUBE工具,把kimball带入了一个万劫不复的 ...
- 数学建模中四大模型总结
文章作者吴翔 1 优化模型 1.1 数学规划模型 线性规划.整数线性规划.非线性规划.多目标规划.动态规划. 1.2 微分方程组模型 阻滞增长模型.SARS传播模型. 1.3 ...
- MATLAB应用实战系列(六十)-MATLAB数学建模常用的四大模型
优化模型 1.1 数学规划模型 线性规划.整数线性规划.非线性规划.多目标规划.动态规划. 1.2 微分方程组模型 阻滞增长模型.SARS传播模型. 1.3 图论与网络优化问题 最短路径问题.网络最大 ...
最新文章
- torch序列化 pickle 慢
- 刷题之旅2020.12.05
- 2021-04-24 Python 最小二乘法求解线性回归模型
- C++之对象的动态建立和释放
- (转)Spring Boot(五):Spring Boot Jpa 的使用
- 在YUI3下打印Panel内容
- 创业者如何吸引风险投资商
- ad中使用智能粘贴_AD元件复制粘贴使用技巧
- 28岁自学3年前端成功转行的励志故事
- 数据中心(DC)核心交换机和普通交换机的区别
- docker push latest 和 保存历史版本
- 来谈一谈专注力的真相
- 地雷復 (易經大意 韓長庚)
- zkh工业/润滑油//服// 务
- 又拿下一块屏幕,中景园2.08寸OLED SH1122 带字库芯片 GT30L32S4W
- 伦茨科技小知识-蓝牙的通信原理和协议
- Python 中 if not 用法
- Android内存泄漏查找和解决adb shell dumpsys meminfo packagement
- FLUKE 9500B 电阻测量功能经验分享
- 收费企业邮箱,适合媒体行业的企业邮箱