事实表和维度表(重点)
1.事实表
事实表中的每行数据代表一个业务事件(下单、支付、退款、评价等)。“事实”这个术语表示的是业务事件的度量值(可统计次数、个数、件数、金额等),例如,订单事件中的下单金额。
每一个事实表的行包括:具有可加性的数值型的度量值、与维表相连接的外键、通常具有两个和两个以上的外键、外键之间表示维表之间多对多的关系。
每个数据仓库都包含一个或者多个事实数据表,事实表是对分析主题的度量,它包含了与各维度表相关联的外键,并通过连接(Join)方式与维度表关联。
事实表的度量通常是数值类型,且记录数会不断增加,表规模迅速增长。例如,现存在一张订单事实表,其字段Prod_ id(商品id)可以关联商品维度表、TimeKey(订单时间)可以关联时间维度表等。
2.维度表
维度表:一般是对事实的描述信息。每一张维表对应现实世界中的一个对象或者概念。 例如:用户、商品、日期、地区等。
维表的特征:
维表的范围很宽(具有多个属性、列比较多)
跟事实表相比,行数相对较小:通常< 10万条
内容相对固定:编码表
维度表可以看作用户分析数据的窗口,维度表中包含事实数据表中事实记录的特性,有些特性提供描述性信息,有些特性指定如何汇总事实数据表数据,以便为分析者提供有用的信息。
维度表包含帮助汇总数据的特性的层次结构,维度是对数据进行分析时特有的一个角度,站在不同角度看待问题,会有不同的结果。例如,当分析产品销售情况时,可以选择按照商品类别、商品区域进行分析,此时就构成一个类别、区域的维度。维度表信息较为固定,且数据量小,维度表中的列字段可以将信息分为不同层次的结构级。
事实表和维度表(重点)相关推荐
- 事实表和维度表是怎么造数据_从电商数据指标到电商数据中台
接上一篇业务洞察--从人货场提炼电商数据指标 数据指标体系已经提炼好了,接着就是想办法落地实现.现在数据中台是个流行词汇,在技术思维里,重复的逻辑会被抽象为组件.服务或者系统,系统这个层级都包不住的, ...
- BI中事实表,维度表和数据集市,数据仓库的理解
维度表(dimension)存放着一些维度属性,例如时间维度:年月日时:地域维度:省份,城市:年龄维度:老年,中年,青年:职称维度:高,中,低.它定义了可以从哪些角度分析事实表. 事实表(fact)存 ...
- 事实表与维度表的区别与关系
事实表 每个数据仓库都包含一个或者多个事实数据表.事实数据表可能包含业务销售数据,如现金登记事务所产生的数据,事实数据表通常包含大量的行.事实数据表的主要特点是包含数字数据(事实),并且这 ...
- BI中的事实表和维度表
事实表: 每个数据仓库都包含一个或者多个事实数据表.事实数据表可能包含业务销售数据,如现金登记事务. 所产生的数据,事实数据表通常包含大量的行.事实数据表的主要特点是包含数字数据(事实),并且这些数字 ...
- 理解维度数据仓库——事实表、维度表、聚合表
一.事实表 在多维数据仓库中,保存度量值的详细值或事实的表称为"事实表".一个按照州.产品和月份划分的销售量和销售额存储的事实表有5个列,概念上与下面的示例类似. 在这些事实表的示 ...
- Flink数据清洗(Kafka事实表+Redis维度表)
调研 从网上的调研来看,其实整个百度有清洗流程的只有[1]其他都是抄的[1]中的内容. 实验流程 这个流程的话,不要去研究redis的Flink SQL Client的操作方法,因为在mvn repo ...
- BI中事实表和维度表的定义+具体SQL操作(转载+自己添加实验)
1个典型的例子是,把逻辑业务比作1个立方体,产品维.时间维.地点维分别作为不同的坐标轴,而坐标轴的交点就是1个具体的事实.也就是说事实表是多个维度表的1个交点.而维度表是分析事实的1个窗口. 首先介绍 ...
- mysql 事实表 维度表_数据库的事实表与维度表
维度表示你要对数据进行分析时所用的一个量,比如你要分析产品销售情况,你可以选择按类别来进行分析,或按区域来分析,这样的按照什么分析就构成一个维度.前面的实例就可以有两个维度:类型和区域.另外每个维度还 ...
- BI中事实表和维度表的定义
一个典型的例子是,把逻辑业务比作一个立方体,产品维.时间维.地点维分别作为不同的坐标轴,而坐标轴的交点就是一个具体的事实.也就是说事实表是多个维度表的一个交点.而维度表是分析事实的一个窗口. 首先介绍 ...
- 数据仓库、事实表、维度表、DB、DW、DM、ODS、OLAP、OLTP和BI的概念理解
详情请点击 1.数据仓库 DW是一个 面向主题的,集成的,相对稳定的,反映历史变化的 数据集合 用于支持管理决策(DMS) 面向主题的:经过ETL抽数.清洗.转换加载之后,数据按不同主题存放同一个库中 ...
最新文章
- log4j2_使用log4j监视和筛选应用程序日志到邮件
- WPF 3D中多个模型如何设置某一个在最前?
- Kinect开发笔记之四检测并调试Kinect设备
- 一款简单微信小程序个人博客
- 《循序渐进学Spark》一1.7 本章小结
- 金属,塑料,傻傻分不清楚
- freemark 应用以及优势
- UEFI shell控制台向.efi文件传入参数--通过protocol实现
- 东方通php支持,应用服务器TongWeb
- ESP8266 wifi模块代码详解
- linux下cpp文件,linux怎么编译cpp文件?
- golang 支付宝小程序 登陆
- 在Excel中输入身份证号码的方法或批量改为文本格式
- SpringSecurity实现自定义登录界面
- Spring Cloud入门系列(1)- Spring生态体系发展史+全系框架介绍
- html空格的使用 emsp ensp nbsp; thinsp; zwnj; zwj;
- 歪理邪说解析架构设计师上午考试试题之一(分析2010下半年系统架构设计师上午试题01-05题)
- 函数式编程扫盲 - 转载系列1
- muck around
- 深入学习React函数组件性能优化三剑客useMemo、useCallback、memo