度量

度量是业务流程节点上的一个数值。比如销量,价格,成本等等。

粒度

粒度就是业务流程中对度量的单位,比如商品是按件记录度量,还是按批记录度量。

事实

在《数据仓库工具箱》一书中对事实的定义是:

事实涉及来自业务过程的度量,基本都以数量值表示。一个事实表行与粒度存在一对一关系。
比如上班时长表(上班时间,加班时间),上班时间可以拆分成签到时间,签退时间形成一个维度表,加班时间就是一个数值,加了几个小时的班是一个度量。

简单来说事实就是业务流程中的一条业务,是一个度量集,他按照粒度的划分包含着度量,连接着维度。

事实表根据灵活性与用途将数字度量分为三类:

  • 可以与事实表关联的任意维度汇总的是可加事实
  • 可以操控某些维度但不能操控全部维度的是半可加事实
  • 本身是操作后的度量(比例,占比等)是不可加事实。

在设计时应该解决不可加事实的出现,尽可能使用半可加事实来描述不可加事实。

维度

在《数据仓库工具箱》一书中对维度的定义是:

维度表是事实表不可或缺的组成部分。维度表包含业务过程度量事件有关的文本环境。他用来描述与"谁、什么、哪里、何时、如何、为什么"有关的事件。

维度用来描述事实,他从不同角度描述事实,也就是说维度是描述事实的角度。
我们描述事实的何时,那么就是时间维度。
比如我们描述这件商品的何时售出,那就是时间维度
比如我们描述这件商品的何地售出,那就是地理维度
比如我们描述这件商品的被谁买了,那就是人员维度

等等等

度量是业务中产生的一个数值。
粒度是度量的单位。
事实是一条业务中度量的集合。
维度是我们描述事实的角度。

数仓理论知识之什么是度量,什么是粒度,什么是事实,什么是维度相关推荐

  1. 数据仓库(二) 数仓理论(重点核心)

    文章目录 数据仓库(二) 数仓理论(重点核心) 数仓分层 数据仓库分层 ODS层 DWD层 DWS层 DWT层 ADS层 数据仓库分层的好处 关系建模与维度建模 关系建模 维度建模 星型模型 雪花模型 ...

  2. 数据仓库简介、数据仓库的发展、数仓理论简介

    数仓理论简介 数据仓库解决方案诞生至今,也有2.30年的发展历史了,在这个过程中,数仓理论不断被更新和完善,逐步形成了目前大家普通遵守的数仓开发理论(概念). 数据仓库的发展 阶段1 以解决数据孤岛为 ...

  3. 数据仓库项目(第五节)数仓理论、电商业务数仓介绍与创建

    目录 数仓理论 表的分类 实体表 维度表 事务型事实表 周期型事实表 同步策略 实体表同步策略 维度表同步策略 事务型事实表同步策略 周期型事实表同步策略 范式理论 范式概念 函数依赖 三范式区分 关 ...

  4. 《2020/07/24》数仓理论

    数仓理论 1. 数仓分层 1.1 数仓分层 ODS(Operation Data Store)原始数据层 原始数据层,存放原始数据,直接加载原始日志.数据,数据保持原貌不做处理. DWD(Data W ...

  5. 企业级数据仓库:数据仓库概述;核心技术框架,数仓理论,数据通道Hive技术框架,HBase设计,系统调度,关系模式范式,ER图,维度建模,星型/雪花/星座模式,数据采集同步,业务数据埋点,数据仓库规范

    文章目录 第一章 数据仓库概述 1.1 数据仓库简介 1.1.2 什么是数据仓库? 1.1.3 OLTP 与 OLAP 1.2 数据仓库技术架构 1.3 课程目标 第二章 核心技术框架 2.1 数据仓 ...

  6. 数仓理论- 03 数据仓库建模

    4 建模 4.1 OLTP系统建模方式 OLTP(Online Transaction Process )在线事务处理,一般业务数据库使用,目的是为业务提供存储以及数据操作,主要是面向数据的随机读写 ...

  7. 数据仓库 Inmon与Kimball数仓理论对比

    Kimball和Inmon是两种主流的数据仓库方法论,分别由 Ralph Kimbal大神 和 Bill Inmon大神提出,在实际数据仓库建设中,业界往往会相互借鉴使用两种开发模式 Inmon和Ki ...

  8. 大数据项目之数仓相关知识

    第1章 数据仓库概念 数据仓库(DW): 为企业指定决策,提供数据支持的,帮助企业,改进业务流程,提高产品质量等. DW的输入数据通常包括:业务数据,用户行为数据和爬虫数据等   ODS:  数据备份 ...

  9. 【数据仓库】Inmon与Kimball数仓理论对比

    Inmon和Kimball是数据仓库领域伟大的开拓者,他们均多年从事数据仓库的研究,Inmon还被称为"数据仓库之父".Inmon的<数据仓库>和Kimball的< ...

最新文章

  1. Tech.ED 2009前瞻:认识System Center
  2. QML 性能优化建议(二)
  3. 步步为营-72-asp.net简单练习(通过webForm实现一些简单实例)
  4. 17 张程序员壁纸(赶快挑一张吧)
  5. 详解面向对象、构造函数、原型与原型链
  6. linux检查nginx 状态,Nginx配置检测服务状态的实现方法,
  7. 面试系列26 如何基于dubbo进行服务治理、服务降级、失败重试以及超时重试
  8. 《程序设计技术》第九章例程
  9. 【win】全屏、窗口化、动态修改分辨率和获取屏幕支持的所有分辨率
  10. 消极和积极的道德--给亲爱的安德烈
  11. 第一届嵌入式电子竞赛方案设计——智能门禁系统
  12. python学习 -女神或者男神把微信消息撤回后好慌,有了这个妈妈再也不担心你看不到女神或者男神撤回的消息了(超详解)...
  13. web-VR(虚拟现实)
  14. python输入城市名称_python - 使用熊猫一次将多个城市名称格式化为每个城市的通用名称 - 堆栈内存溢出...
  15. 解读 ChatGPT 背后的技术重点:RLHF、IFT、CoT、红蓝对抗
  16. 初级前端小程序项目加载速度优化
  17. 三招必杀技 彻底清除IE内部顽固病毒(转)
  18. codeforces 1574 C. Slay the Dragon
  19. python实现2048小游戏_python—手把手教你实现2048小游戏
  20. 分类模型优劣分析指标

热门文章

  1. 基于大数据技术之电视收视率企业项目实战(hadoop+Spark)
  2. rails使用devise验证
  3. js中的经典题Foo.getName
  4. 夏日汽车保养 雨季汽车保养
  5. html怎么把字做成动画效果,用纯CSS实现文字的动态效果
  6. [DAX] SUM函数 | SUMX函数
  7. 小技巧(2):谷歌网盘容量15G不够用?不科学上网谷歌网盘下载速度太慢?试一下这个“Google teamdrive开通”+“GDIndex链接Google Drive”
  8. TCP状态转换图文解说
  9. docker redis
  10. 小卡的土豆园开园了~