数仓知识05:事实表和维度表的概念
数仓中通常有两种表:事实表、维度表,这两种表是什么含义,有哪些区别,今天进行讲解。
- 事实表
数据仓库架构中的中央表,它包含联系事实与维度表的数字度量值和键。事实数据表包含描述业务(如银行事务或产品销售)内特定事件的数据。
- 维度表
数据仓库中的表,其条目描述事实数据表中的数据。维度表包含创建维度所基于的数据。
举个实际的例子。银行对存款记账,A表中存放实际数据,包括账号、所属机构号、存款金额等,B表存放机构号和机构名称的对应关系。则A是事实表,B是维表。
其他说明:
每个数据仓库都包含一个或者多个事实数据表。事实数据表的主要特点是包含数字数据(事实),并且这些数字信息可以汇总,以提供有关单位作为历史的数据,每个事实数据表包含一个由多个部分组成的索引,该索引包含作为外键的相关性维度表的主键,而维度表包含事实记录的特性。事实数据表不应该包含描述性的信息,也不应该包含除数字度量字段及使事实与维度表中对应项的相关索引字段之外的任何数据。
一般来说,一个事实数据表都要和一个或多个维度表相关联,用户在利用事实数据表创建多维数据集时,可以使用一个或多个维度表。
维度表是从事实表中抽离出来的分析粒度,在数据建模时,最好是分清事实表和维度表,对于后期的分析思路以及模型理解非常重要,也会降低信息冗余,提升运算速度。
参考资料:
百度百科:事实表
百度百科:维度表
事实表和维度表
数仓知识05:事实表和维度表的概念相关推荐
- 通俗易懂数仓建模:范式建模与维度建模
一.两种建模思想 对于 Inmon 和 Kimball 两种建模方式可以长篇大论叙述,但理论是很枯燥的,尤其是晦涩难懂的文字,大家读完估计也不会收获太多,所以笔者根据自己的理解用通俗的语言提炼出最核心 ...
- [hive]数仓分层|用户纬度拉链表|维度建模
https://www.modb.pro/404?redirect=%2Fdb%2F241289 一.数仓分层 1.ODS层:原始数据层 ODS(O=original D=data S=store) ...
- 数据仓库、事实表、维度表、DB、DW、DM、ODS、OLAP、OLTP和BI的概念理解
详情请点击 1.数据仓库 DW是一个 面向主题的,集成的,相对稳定的,反映历史变化的 数据集合 用于支持管理决策(DMS) 面向主题的:经过ETL抽数.清洗.转换加载之后,数据按不同主题存放同一个库中 ...
- 【数仓建模】传统建模与宽表建模有何差异?基于宽表建模实践
[数仓建模]传统建模与宽表建模有何差异?基于宽表建模实践 一.业务背景 1.1 数据建模现状: 1.2 当前业务特性与趋势 二.面临的问题 2.1 在数据驱动业务越来越重要的大趋势下,面临的问题 2. ...
- 数仓实践:浅谈 Kimball 维度建模
我们不管是基于 Hadoop 的数据仓库(如 Hive ),还是基于传统 MPP 架构的数据仓库(如 Teradata ),抑或是基于传统 Oracle .MySQL .SQL Server 关系型数 ...
- 理解维度数据仓库——事实表、维度表、聚合表
一.事实表 在多维数据仓库中,保存度量值的详细值或事实的表称为"事实表".一个按照州.产品和月份划分的销售量和销售额存储的事实表有5个列,概念上与下面的示例类似. 在这些事实表的示 ...
- 事实表和维度表是怎么造数据_从电商数据指标到电商数据中台
接上一篇业务洞察--从人货场提炼电商数据指标 数据指标体系已经提炼好了,接着就是想办法落地实现.现在数据中台是个流行词汇,在技术思维里,重复的逻辑会被抽象为组件.服务或者系统,系统这个层级都包不住的, ...
- BI中事实表,维度表和数据集市,数据仓库的理解
维度表(dimension)存放着一些维度属性,例如时间维度:年月日时:地域维度:省份,城市:年龄维度:老年,中年,青年:职称维度:高,中,低.它定义了可以从哪些角度分析事实表. 事实表(fact)存 ...
- 事实表与维度表的区别与关系
事实表 每个数据仓库都包含一个或者多个事实数据表.事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行.事实数据表的主要特点是包含数字数据(事实),并且这 ...
- BI中的事实表和维度表
事实表: 每个数据仓库都包含一个或者多个事实数据表.事实数据表可能包含业务销售数据,如现金登记事务. 所产生的数据,事实数据表通常包含大量的行.事实数据表的主要特点是包含数字数据(事实),并且这些数字 ...
最新文章
- 小米miui系统怎么关闭文件管理里的热门视频和表情?
- vue如何输出一个值_怎么在控制台打印出来data里想要的数据? Vue
- 超大 Cookie 拒绝服务攻击
- python ttf svg path_SVG的path的使用
- 如何隐藏SAP Spartacus home页面标准的header区域
- 少儿编程150讲轻松学Scratch(二)-制作过马路小游戏
- 为什么Spring需要三级缓存解决循环依赖,而不是二级缓存?
- X大佬:建议被降级降薪员工主动辞职,网友炸了
- python程序调用函数的过程是什么_Python:函数定义和调用时都加*,有什么作用?...
- 国际电联秘书长特别代表杨晓雅:2020年全球将接入500亿物联网终端
- 【NLP】浅谈 Transformer-based 模型中的位置表示
- e class connect.php,帝国CMS6.6程序剖析——e/class/connect.php
- 写烂代码的人离职之后...
- Flash学习资源下载列表
- 08-微信公众号素材管理
- 揭秘沃尔玛、腾讯、京东、浙商银行的供应链管理方案
- 数学在计算机科学上的应用文献,计算机科学技术在数学中应用浅析
- 07深圳浩项隔音窗,隔音知识与方法
- echart 折线从左到右动画效果_echarts多条折线图动态分层的实现方法
- 为什么k8s天然适合微服务?
热门文章
- 2.8数据-paddlepaddle数据集uci_housing
- linux查看磁盘内存cpu
- EMC信号完整性落地实测1---走出玄学
- Java 中的十大排序算法
- 手把手教你用Python操纵Word自动编写离职报告!
- python cmp_to_key
- 奈奎斯特与香农定理_奈奎斯特定律和香农定理
- 文件共享锁溢出 请增加MaxLocksperFile注册表项值
- m3u8播放器 android,在android中播放m3u8视频
- 疯狂模渲大师体验版安装教程|效果图设计师怎么安装并注册3dmax疯狂模渲大师体验版?