本博客重点总结第三章基本原理中的维度表特性。

维度表特性

代理键

星型模式中,每个维度表都分配有一个代理键。代理键仅仅是为数据仓库和数据集市创建的。代理键通常表现为整数,在星型模式加载时的获取、转换、加载(ETL)过程中产生并被管理。键值不包含内在的含义,因此对数据仓库使用者来说并无特殊的意义。维度表的每一行都包含一个唯一的代理键与之对应。将代理键作为唯一标识符的使用方法允许数据仓库对源系统发生的变化做出响应,这种方式适应了分析型系统的需求。由于维度表不依赖于自然键来区分行的唯一性,因此维度表能够维护历史信息,即使源系统不能也无所谓。为每个维度表分配一个代理键,用于唯一地区分表中的每行记录。

自然键

与代理键不同,多数维度表中都包含一个或多个自然键。自然键通常来源于源系统。它们不能唯一地区分数据仓库中的行,但能够区分来自源系统中对应的实体。与代理键键值不同,自然键键值对数据仓库使用者来说可能包含一定的意义。即使自然键不具有明确的含义,用于加载事实表的ETL例程也仍然需要它们。有时维度表的自然键包含多个列。这种情况通常发生在源系统采用多键方式区分实体时。
替换代理键的方法之一是为自然键附加一个序列号。
另外一种理论上可以替换代理键的方法是为自然键增加一个时间戳。

丰富的维度集合

维度为事实提供了环境,没有环境,事实就无法理解。维度以及维度值在多个方面增强了事实的含义:
1. 用于过滤查询或报表。
2. 用于控制聚集事实的范围。
3. 用于确定信息的顺序或排序。
4. 与事实一起构成提供报表的环境。
5. 用于定义主从结构、分组、分类汇总、汇总等。
在查询中可以使用维度的不同组合方式回答各种问题。维度涉及的属性越广,对事实表开展分析工作的方式就越多。
提供丰富和全面的维度属性集合,每个新增的属性都将会显著地提高分析的可能性。
若一个属性通常用于聚集或汇总,那它就是事实。有时作为维度的数字型属性不易识别,如价格单位,它可以用于对订单进行分组:如“以12美元或10美元分别卖了多少?”因此,此时价格单位将被划分为维度。
数字型数据是维度还是事实通常并不容易区分。在出现疑问时,一定要注意应根据应用情况分析。如果一个元素值用于过滤查询、排序数据、控制聚集、区分主从关系等,该元素通常是维度。数量单位一般是维度,数量汇总一般是事实。数量单位乘以事务数量产生的结果可以被聚集和汇总,是事实。数量单位是有用的维度,数量汇总是有用的事实。它们在维度设计中具有不同的作用。
基于事实计算得到的维度成为行为维度。

Star Schema完全参考手册读书笔记三相关推荐

  1. Star Schema完全参考手册读书笔记八

    本博客主要对书中横向钻取进行归纳总结. 横向钻取: 与对数据的上钻或下钻操作无关,它描述的是跨越一个星型模式到另外一个星型模式的步骤.该术语意在描述跨多个过程. 尽管横向钻取操作通常被称为横向钻取查询 ...

  2. Star Schema完全参考手册读书笔记五

    本博客就第三章缓慢变化维和多维数据集的有关知识进行总结. 缓慢变化维 采用维度设计方案时,确定数据源的变化情况在维度表中如何表示非常重要.这一现象称为缓慢变化的维度,简称缓慢变化维.该术语的名称反映了 ...

  3. Star Schema完全参考手册读书笔记四

    本博客主要内容为对书中第三章事实表特性的知识的总结. 事实表特性主要包括粒度.可加性.稀疏性和退化维. 事实表特性 事实分为可加事实,半可加事实和非可加事实. 每个事实表通过获取描述业务过程的度量来表 ...

  4. Star Schema完全参考手册读书笔记二

    本博客继续就书中的一些术语和概念进行总结. 数据仓库体系结构 数据仓库描述任何包含分析型数据库的解决方案,包括独立型数据集市.该术语并不表示一个中心或集成仓库. 企业数据仓库指的是企业信息化工厂的中央 ...

  5. Star Schema完全参考手册读书笔记一

    分析型数据库与维度设计 本章主要讲述星型模式中的一些基本概念,具体如下文. 为业务过程度量建模可以实现分析型数据库设计复杂的业务分析工作.业务过程的维度模型由两个组件构成:度量和度量环境.这些组件也称 ...

  6. Star Schema完全参考手册学习笔记九

    本博客主要就维度一致性进行总结. 维度一致性的基本需求 为支持成功的横向钻取对比,必须保证维度表的一致性,可以通过保证两个表相同的方法来解决.对于相同性涉及两个关键的部分:两个表必须结构相同且内容相同 ...

  7. Star Schema完全参考手册学习笔记六

    本博客就第三章的相关知识点做最后的总结. 本章讨论了星型模式的基本特性.这一主题可以分为4类: 维度表 1.维度表包含自然键和代理键.允许分析模式独立地跟踪源系统的历史. 2.维度表包含众多属性.丰富 ...

  8. Star Schema完全参考手册学习笔记七

    维度模型描述了人们对所处世界的度量.正如前面章节所强调的那样,每个星型模式都包含一个事实表,作为描述特定过程的度量.度量又称事实,通过相关的维度获得存在的环境.事实表的粒度描述了所记录的事实的细节层次 ...

  9. mysql数据库权威指南_MySQL_MySQL权威指南读书笔记(三),第二章:MYSQL数据库里面的数 - phpStudy...

    MySQL权威指南读书笔记(三) 第二章:MYSQL数据库里面的数据 用想用好MYSQL,就必须透彻理解MYSQL是如何看待和处理数据的.本章主要讨论了两个问题:一是SQL所能处理的数据值的类型:二是 ...

最新文章

  1. 替换元素和非替换元素的学习
  2. 内控体系建设五步骤_进一步完善环境保护标准体系建设 ——《国家环境保护标准“十三五”发展规划》解读...
  3. Python基础之最大公约数与最小公倍数
  4. java 日期 区间_如何实现时间区间的分割??
  5. 按频率对元素进行排序
  6. 将链表中m-n范围内的数进行倒序
  7. 点击表格弹窗获取另外一套数据之后,原表格相关数据的调用
  8. LeetCode 800. 相似 RGB 颜色
  9. 分享一些自己的学习过程和学习方法
  10. Android Studio导入model
  11. 今日博文视点大咖直播伴你读No.3:数据分析学习之道
  12. 过去的2017和已经到来的2018
  13. 中文文档保存到mysql_mysql 中文 存储
  14. JAVA实现成语大全-成语接龙,给小孩的应用
  15. 云服务器搭建Hadoop集群
  16. linux teamviewer升级,在CentOS 8系统上自动更新TeamViewer的方法
  17. 神经元图片结构图,一个神经元简图
  18. Git使用的奇技淫巧,看这篇就够了!
  19. matlab软件_MATLAB软件概述
  20. 轮播图进度条同步切换(参考漫威官网)

热门文章

  1. 5-去掉a标签下划线,禁止a标签的跳转
  2. Javascript鼠标键盘事件
  3. 使用TryParse()来执行数值转换
  4. careercup-数学与概率 7.7
  5. ADO.NET与ORM的比较(4):EntityFramework实现CRUD
  6. 19_01访问权限修饰符
  7. hdu 2191 (多重背包二进制优化)
  8. HTML5的新特性(1) -pattern
  9. Minimum Size Subarray Sum 最短子数组之和
  10. Dedecms v5.7 CKEditor编辑器回车键换行改为分段