三大数据模型:星型模型、雪花模型、星座模型
星型模型
星型模型中只有一张事实表,以及0张或多张维表,事实表与维表通过主键外键相关联,维表之间不存在关联关系,当所有维表都关联到事实表时,整个图形非常像一种星星的结构,所以称之为“星型模型”。
星型模型是最简单最常用的模型。星型模型本质是一张大表,相比于其他数据模型更合适于大数据处理。其他模型可以通过一定的转换,变为星型模型。
星型模型的缺点是存在一定程度的数据冗余。因为其维表只有一个层级,有些信息被存储了多次。比如一张包含国家、省份、地市三列的维表,国家列会有很多重复的信息。
雪花模型
当一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。它对星型模型的维表进一步层次化,原有的各维表可能被扩展为小的事实表,形成一些局部的"层次"区域,这些被分解的表都连接到主维表而不是事实表。
其优点是通过最大限度地减少数据存储量以及联合较小的维表来改善查询性能,避免了数据冗余。其缺点是增加了主键-外键关联的几率,导致查询效率低于星型模型,并且不利于开发。
星座模型
星座模型也是星型模型的扩展。区别是星座模型中存在多张事实表,不同事实表之间共享维表信息,常用于数据关系更复杂的场景。其经常被称为星系模型。
对比
属性 | 星型模型(星座模型) | 雪花模型 |
---|---|---|
事实表 | 1张或多张 | 1张或多张 |
维度表 | 一级维表 | 多层级维表 |
数据总量 | 多 | 少 |
数据冗余度 | 高 | 低 |
可读性 | 高 | 低 |
表个数 | 少 | 多 |
表宽度 | 宽 | 窄 |
查询逻辑 | 简单 | 复杂 |
查询性能 | 高 | 低 |
扩展性 | 差 | 好 |
总结
通过上面的对比分析,可以发现数据仓库更适合使用星型模型来构建底层数据 hive 表,通过数据冗余来减少查询次数以提高查询效率。雪花模型在关系型数据库中(MySQL/Oracle)更加常见。在具体规划设计时,应结合具体场景及两者的优缺点来进行设计,找到一个平衡点去开展工作。
转载于:https://www.modb.pro/db/134542
三大数据模型:星型模型、雪花模型、星座模型相关推荐
- (星型、雪花、星座、交叉连接)多维数据模型各种类型优劣分析
概述 在数据仓库的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构,同时从模型中又衍生出星座模型和交叉模型.下面我们先来理解这几种模型的概念和比较. 事实 和 维度 我们先来了解一下事实和 ...
- 维度建模(星型、雪花、星座)
整理不易,转发请注明出处,请勿直接剽窃! 点赞.关注.不迷路! 摘要: 事实表.维度表.维度模型.核心四步骤 事实表:度量(可计算数值).维度表的主键作为事实表的外键. 事务表分类: 事务事实表:最细 ...
- 【DBMS 数据库管理系统】多维数据模型 ( 星型模式 | 雪片模型 | 事实群模型 | 度量 | 分布型 | 代数型 | 整体型 )
文章目录 一.星型模式 二.星型模式 缺点 三.雪片模型 四.星型模型 雪片模型 折衷方案 五.事实群模型 ( 仅做了解 ) 六.度量 一.星型模式 星型模式 是 多维数据模型 的表现形式 ; 星型模 ...
- 使用Mondrian Virtual OLAP Cube 实现星座模型并在saiku展现分析
1.什么是星座模型? 2.哪些地方可以用到星座模型? 3.Mondrian怎么构建星座模型,构建过程又涉及到哪些理论概念. 答1:这里描述了维度模型常用的 星型.雪花.星座模型,简而言之就是多事实表模 ...
- 数据仓库的星型模型和雪花模型的区别以及优缺点
数据仓库的星型模型和雪花模型 星型模型 星型模型是维度模型最简单的形式,也是数据仓库以及数据集市开发中使用最广泛的形式. 星型模式由事实表和维度表组成,一个星型模式中可以有一个或多个事实表,每个事实表 ...
- 数仓 建模思想之星型模型、雪花模型、星座模型
数仓 建模思想之星型模型.雪花模型.星座模型 1. 背景 在大数据开发中,数据一般是分为事实表,维度表,实体表等表. 事实表顾名思义就是记录实际发生的事情如订单表,优惠券使用表等等. 维度表,顾名思义 ...
- 全方位解读星型模型,雪花模型及星座模型
1背景 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型,雪花型模型及星座模型.在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型,雪花型模型还是星座模型 ...
- 数据仓库——数据仓库架构、维度数据建模、雪花模型和星型模型
文章目录 一.数据仓库架构 1. 自顶向下 2. 自底向上 二.维度数据建模 三.星型模型和雪花模型 1. 星型模型 2. 雪花模型 本篇文章主要介绍了数据仓库的整体架构.数仓中常用的维度数据建模方法 ...
- 数据仓库星型模型vs雪花模型
一.概述 在多维分析的商业智能解决方案中,根据事实表和维度表的关系,又可将常见的模型分为星型模型和雪花型模型.在设计逻辑型数据的模型的时候,就应考虑数据是按照星型模型还是雪花型模型进行组织. 当所有维 ...
最新文章
- Android中进程间通讯 AIDL
- Ubuntu16.04下Hadoop 2.7.3的安装与配置
- 3分钟,看回归分析模型怎么做
- java自动获取时间 月代码_【java代码获取系统时间和执行定时任务】
- 在PC上用模拟器搭建Windows Mobile仿真环境:Microsoft Device Emulator使用
- .net打包自动安装数据库
- [转]How do I use variables in Oracle SQL Developer?
- 阿里云keepalived的虚拟ip怎么让外网访问_Nginx之Keepalived高可用工具
- 网易云音乐云盘上传歌词的方法
- 计算机台式硬件排名,CPU天梯图2019年1月最新版 一月台式电脑处理器排名
- 二代旅游网站CMS缓存列表
- java抛硬币,抛硬币模拟(Coin Tossing Simulation)
- vue3 源码分析-运行流程分析
- Wireshark抓包页面的登录信息
- Web作业表单的制作
- Java编程思想笔记——并发3
- nginx配置文件结构1
- 做自适应网站时需要参考的设备分辨率有哪些
- Altair Activate 2021.1 x64
- 动态内存申请(Linux)
热门文章
- VR GunJack 制作 - 机舱模型和动画
- 工业互联网平台赋能制造业数字化转型分析
- windows环境安装好了virtualenvwrapper,pycharm中workon命令用不了
- 软件测试十二阶段(软件测试方法)
- TensorFlow应用:制作一个简单的聊天机器人
- ubuntu安装投影仪后系统无法启动
- 解决————心情低落,抑郁
- java wal实现原理,IoTDB-WAL解析
- python3中默认的字符编码和文件编码_python3 unicod,utf-8,gbk的编码和解码中文显示问题...
- 解决Windows Server 2008 System进程占用80端口