数仓理论知识之什么是度量,什么是粒度,什么是事实,什么是维度
度量
度量是业务流程节点上的一个数值。比如销量,价格,成本等等。
粒度
粒度就是业务流程中对度量的单位,比如商品是按件记录度量,还是按批记录度量。
事实
在《数据仓库工具箱》一书中对事实的定义是:
事实涉及来自业务过程的度量,基本都以数量值表示。一个事实表行与粒度存在一对一关系。
比如上班时长表(上班时间,加班时间),上班时间可以拆分成签到时间,签退时间形成一个维度表,加班时间就是一个数值,加了几个小时的班是一个度量。
简单来说事实就是业务流程中的一条业务,是一个度量集,他按照粒度的划分包含着度量,连接着维度。
事实表根据灵活性与用途将数字度量分为三类:
- 可以与事实表关联的任意维度汇总的是可加事实
- 可以操控某些维度但不能操控全部维度的是半可加事实
- 本身是操作后的度量(比例,占比等)是不可加事实。
在设计时应该解决不可加事实的出现,尽可能使用半可加事实来描述不可加事实。
维度
在《数据仓库工具箱》一书中对维度的定义是:
维度表是事实表不可或缺的组成部分。维度表包含业务过程度量事件有关的文本环境。他用来描述与"谁、什么、哪里、何时、如何、为什么"有关的事件。
维度用来描述事实,他从不同角度描述事实,也就是说维度是描述事实的角度。
我们描述事实的何时,那么就是时间维度。
比如我们描述这件商品的何时售出,那就是时间维度
比如我们描述这件商品的何地售出,那就是地理维度
比如我们描述这件商品的被谁买了,那就是人员维度
等等等
度量是业务中产生的一个数值。
粒度是度量的单位。
事实是一条业务中度量的集合。
维度是我们描述事实的角度。
数仓理论知识之什么是度量,什么是粒度,什么是事实,什么是维度相关推荐
- 数据仓库(二) 数仓理论(重点核心)
文章目录 数据仓库(二) 数仓理论(重点核心) 数仓分层 数据仓库分层 ODS层 DWD层 DWS层 DWT层 ADS层 数据仓库分层的好处 关系建模与维度建模 关系建模 维度建模 星型模型 雪花模型 ...
- 数据仓库简介、数据仓库的发展、数仓理论简介
数仓理论简介 数据仓库解决方案诞生至今,也有2.30年的发展历史了,在这个过程中,数仓理论不断被更新和完善,逐步形成了目前大家普通遵守的数仓开发理论(概念). 数据仓库的发展 阶段1 以解决数据孤岛为 ...
- 数据仓库项目(第五节)数仓理论、电商业务数仓介绍与创建
目录 数仓理论 表的分类 实体表 维度表 事务型事实表 周期型事实表 同步策略 实体表同步策略 维度表同步策略 事务型事实表同步策略 周期型事实表同步策略 范式理论 范式概念 函数依赖 三范式区分 关 ...
- 《2020/07/24》数仓理论
数仓理论 1. 数仓分层 1.1 数仓分层 ODS(Operation Data Store)原始数据层 原始数据层,存放原始数据,直接加载原始日志.数据,数据保持原貌不做处理. DWD(Data W ...
- 企业级数据仓库:数据仓库概述;核心技术框架,数仓理论,数据通道Hive技术框架,HBase设计,系统调度,关系模式范式,ER图,维度建模,星型/雪花/星座模式,数据采集同步,业务数据埋点,数据仓库规范
文章目录 第一章 数据仓库概述 1.1 数据仓库简介 1.1.2 什么是数据仓库? 1.1.3 OLTP 与 OLAP 1.2 数据仓库技术架构 1.3 课程目标 第二章 核心技术框架 2.1 数据仓 ...
- 数仓理论- 03 数据仓库建模
4 建模 4.1 OLTP系统建模方式 OLTP(Online Transaction Process )在线事务处理,一般业务数据库使用,目的是为业务提供存储以及数据操作,主要是面向数据的随机读写 ...
- 数据仓库 Inmon与Kimball数仓理论对比
Kimball和Inmon是两种主流的数据仓库方法论,分别由 Ralph Kimbal大神 和 Bill Inmon大神提出,在实际数据仓库建设中,业界往往会相互借鉴使用两种开发模式 Inmon和Ki ...
- 大数据项目之数仓相关知识
第1章 数据仓库概念 数据仓库(DW): 为企业指定决策,提供数据支持的,帮助企业,改进业务流程,提高产品质量等. DW的输入数据通常包括:业务数据,用户行为数据和爬虫数据等 ODS: 数据备份 ...
- 【数据仓库】Inmon与Kimball数仓理论对比
Inmon和Kimball是数据仓库领域伟大的开拓者,他们均多年从事数据仓库的研究,Inmon还被称为"数据仓库之父".Inmon的<数据仓库>和Kimball的< ...
最新文章
- Tech.ED 2009前瞻:认识System Center
- QML 性能优化建议(二)
- 步步为营-72-asp.net简单练习(通过webForm实现一些简单实例)
- 17 张程序员壁纸(赶快挑一张吧)
- 详解面向对象、构造函数、原型与原型链
- linux检查nginx 状态,Nginx配置检测服务状态的实现方法,
- 面试系列26 如何基于dubbo进行服务治理、服务降级、失败重试以及超时重试
- 《程序设计技术》第九章例程
- 【win】全屏、窗口化、动态修改分辨率和获取屏幕支持的所有分辨率
- 消极和积极的道德--给亲爱的安德烈
- 第一届嵌入式电子竞赛方案设计——智能门禁系统
- python学习 -女神或者男神把微信消息撤回后好慌,有了这个妈妈再也不担心你看不到女神或者男神撤回的消息了(超详解)...
- web-VR(虚拟现实)
- python输入城市名称_python - 使用熊猫一次将多个城市名称格式化为每个城市的通用名称 - 堆栈内存溢出...
- 解读 ChatGPT 背后的技术重点:RLHF、IFT、CoT、红蓝对抗
- 初级前端小程序项目加载速度优化
- 三招必杀技 彻底清除IE内部顽固病毒(转)
- codeforces 1574 C. Slay the Dragon
- python实现2048小游戏_python—手把手教你实现2048小游戏
- 分类模型优劣分析指标
热门文章
- 基于大数据技术之电视收视率企业项目实战(hadoop+Spark)
- rails使用devise验证
- js中的经典题Foo.getName
- 夏日汽车保养 雨季汽车保养
- html怎么把字做成动画效果,用纯CSS实现文字的动态效果
- [DAX] SUM函数 | SUMX函数
- 小技巧(2):谷歌网盘容量15G不够用?不科学上网谷歌网盘下载速度太慢?试一下这个“Google teamdrive开通”+“GDIndex链接Google Drive”
- TCP状态转换图文解说
- docker redis
- 小卡的土豆园开园了~