事实表:

1.0事务事实表:(->明细事实表->聚合事实表)

记录的是事务层面的事实,保存的是最原子的数据,也叫做“原子事实表”。事务事实表中的数据在事务事件发生后产生,数据的粒度通常是每个事务一条记录。一旦事务被提交,事实表数据被插入,数据就不再进行更改,其更新方式为增量更新。

1.1.0明细事实表(单事件事实表,流程事实表): 一般位于DWD层,该层事实表设计不进行聚合,汇总等动作,仅做数据规范化,数据降维动作,同时数据保持业务事务粒度,确保数据信息无丢失。
  • 单事件事实表:
    1.更方便跟踪业务流程细节数据,针对特殊的业务分析场景比较方便和灵活,数据处
    理上也更加灵活;
    2.不方便的地方就是数仓中需要管理太多的事实表,同时跟踪业务流转不够直观;

  • 流程事实表
    能够更直观的跟踪业务流转和当前状态,流程事实集中,方便大部分的通用分析应
    用场景,由于和业务侧的数据模型设计思路一致,也是目前最常用的事实表设计;但是细节
    数据跟踪不到位,特殊场景的分析不够灵活;

1.2.0聚合事实表:相对于明细事实表,聚合事实表通常是在明细事实表的基础上,按照一定的粒度粗细进行的汇总、聚合操作,它的粒度较明细数据粒度粗,同时伴随着细节信息的丢失。聚合事实表一般位于DWS层,聚合事实表的数据来源可以是两种明细事实表中的任一种。
  • 通用汇总层:封装底层计算逻辑,做通用汇总,避免上层直接访问下层明细数据,应用广泛
  • 日粒度:数据范围一般为T-1天的数据
  • 周期性积累:用于周期性分析,数据来源于通用汇总层,或者日粒度
  • 历史积累:历史数据积累的大表,用于用户画像,特征提取,经营分析等场景,计算比较耗时。

2.0周期快照事实表

以一定的周期间隔来记录事实,它是在事务事实表之上建立的聚集表,记录的事实是这一段时间的聚集事实值。eg:销售日快照表,库存日快照表

3.0积累快照事实表

存储的不确定周期的事务数据的快照信息。


维度表

1.0稳定维度表

部分维度表的维度是在维度表产生以后,属性是稳定的,无变化的。eg:时间维度,区域维度,

2.0缓慢渐变维度表(拉链表)

维度数据会随着时间发生变化,变化速度非常缓慢。eg:电商平台的用户维度表,用户的收货地址是缓慢变化的。

总而总之:事实表有三种(事务事实表,周期快照事实表,历史快照事实表),维度表有两种(稳定维度维表,渐变维度维表)。


数仓分层:DW,DWD,DWB,DWS

data wareHouse 数据仓库
data wareHouse detail 细节数据层,业务层和数仓的隔离层
data wareHouse base 基础数据层,中间层
data warehouse service 服务数据层,作用于某个主题域的服务数据,一般是宽表

数仓之事实表和维度表(一)相关推荐

  1. HAWQ取代传统数仓实践(十)——维度表技术之杂项维度

    一.什么是杂项维度 简单地说,杂项维度就是一种包含的数据具有很少可能值的维度.事务型商业过程通常产生一系列混杂的.低基数的标志位或状态信息.与其为每个标志或属性定义不同的维度,不如建立单独的将不同维度 ...

  2. 理解维度数据仓库——事实表、维度表、聚合表

    一.事实表 在多维数据仓库中,保存度量值的详细值或事实的表称为"事实表".一个按照州.产品和月份划分的销售量和销售额存储的事实表有5个列,概念上与下面的示例类似. 在这些事实表的示 ...

  3. 事实表和维度表是怎么造数据_从电商数据指标到电商数据中台

    接上一篇业务洞察--从人货场提炼电商数据指标 数据指标体系已经提炼好了,接着就是想办法落地实现.现在数据中台是个流行词汇,在技术思维里,重复的逻辑会被抽象为组件.服务或者系统,系统这个层级都包不住的, ...

  4. BI中事实表,维度表和数据集市,数据仓库的理解

    维度表(dimension)存放着一些维度属性,例如时间维度:年月日时:地域维度:省份,城市:年龄维度:老年,中年,青年:职称维度:高,中,低.它定义了可以从哪些角度分析事实表. 事实表(fact)存 ...

  5. 事实表与维度表的区别与关系

    事实表       每个数据仓库都包含一个或者多个事实数据表.事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行.事实数据表的主要特点是包含数字数据(事实),并且这 ...

  6. BI中的事实表和维度表

    事实表: 每个数据仓库都包含一个或者多个事实数据表.事实数据表可能包含业务销售数据,如现金登记事务. 所产生的数据,事实数据表通常包含大量的行.事实数据表的主要特点是包含数字数据(事实),并且这些数字 ...

  7. 数仓中指标-标签,维度-度量,自然键-代理键,数据集市等各名词解析及关系

    序列号 内容 链接 1 大数据知识面试题-通用(2022版) https://blog.csdn.net/qq_43061290/article/details/124819089 2 大数据知识面试 ...

  8. 数仓中指标-标签,维度-度量,自然键-代理键等各名词深度解析

    作为一个数据人,是不是经常被各种名词围绕,是不是对其中很多概念认知模糊.有些词虽然只有一字之差,但是它们意思完全不同,今天我们就来了解下数仓建设及数据分析时常见的一些概念含义及它们之间的关系. 本文首 ...

  9. 数仓:事实表设计方法,原则和三种类型选择

    关注公众号,回复关键字 [资料],获取[10万字大数据框架面试知识点]与[大数据开发的命令手册] 事实表设计方法 事实表作为数据仓库维度建模的核心,紧紧围绕着业务过程来设计.其包含与该业务过程有关的维 ...

  10. 数仓构建维表--行政区域维度表的构建

    前言 为啥子要花时间搞这个呢? 就是写sql的时候,想要一个省市区维表,在网上找啊找啊找,不是要钱,就是要C币,或者就是别的,竟然没有公益的,共享一下不好吗? 太抠了,今天我来分享一个,哈哈...  ...

最新文章

  1. 从数据库中存取二进制数据并显示
  2. python编码-python中处理中文编码问题
  3. 抓虫系列(三) 不要轻视web程序中常用的三个池 之数据库连接池
  4. Python 建模步骤
  5. 迅雷手机版苹果版_2020最新迅雷苹果版如何下载?
  6. java编程填空及答案_JAVA填空题标准答案(103题)
  7. 什么是面向对象?谈谈你对面向对象的理解
  8. “金三银四” “阿里” 我去定了,谁也拦不住我,这份《Android面试宝典》说的
  9. c++中“箭头(-)”和“点号(.)”操作符的区别 .
  10. Android11 热点开启流程
  11. 理想汽车确认首席技术官王凯离职
  12. 超级删除PowerTools
  13. 大唐天下平台模式开发
  14. 更新ZTE N880E手机的MAC地址
  15. 【机器学习】机器学习算法模式:区别监督学习、无监督学习、半监督学习、强化学习
  16. 分区表信息整理 for10g
  17. layui列表筛选列_layUI实现列表查询功能
  18. 云计算:程序员重回个人英雄时代,国内云计算平台即将搭建运行。
  19. mysql5.7 源码调试,用VS2015 Debug MySQL5.7源码
  20. java搜索页面历史记录,使用JS location实现搜索框历史记录功能

热门文章

  1. linux查看内存使用情况top详解
  2. caxa画图怎么倒角_CAXA怎么画倒角和圆角?
  3. CAXA实体设计 2020 在草图中怎么快速选择与某一曲线相连的曲线?
  4. 【拆解】便携示波器怎么选?
  5. 如何在IDEA中使用 Jclasslib
  6. 数据库设计之需求分析
  7. oracle删库语句,oracle删除表语句是什么?_数据库
  8. 家庭版联想台式计算机,联想台式机预装win10家庭版升级win10专业版方法教程
  9. oppo9s刷机教程_OPPO R9s R9sk刷机教程 OPPO R9s R9sk卡刷升级教程
  10. 某选煤厂智能智能化解决方案