本博客主要内容为对书中第三章事实表特性的知识的总结。
事实表特性主要包括粒度、可加性、稀疏性和退化维。

事实表特性

事实分为可加事实,半可加事实和非可加事实。
每个事实表通过获取描述业务过程的度量来表达业务过程。然而,一些事实不能被聚集。这些不可求和的事实通常可以分解到其他可求和的事实表中。
事实表记录信息的细节程度被称为粒度
尽可能将事实表的粒度设置为最详细的数据粒度级别。
将事实相加以获得对单个事实汇总的能力被称为可加性
事实表是度量业务过程的引擎。事实表存储用来描述过程的详细粒度。事实采用外键为每个度量提供维度环境。在某些情况下,事实表可以包含维度。作为过程度量的核心,事实表应包含与其描述的过程有关的所有事实,当然也可以包含从其他方面获得的一些事实。事实以特定的细节层次存储,但可以通过上卷产生各种级别的维度。由于事实具有可加性,因此这样的聚集是可能的。某些度量不具备可加性,但通常可以分解成具有可加性的组件。
常见的错误是在事实表中存储数量单位而不是存储延伸量。数量单位通常用作维度。它也可以用于计算延伸量,延伸量通常作为事实存在。只有事实才具备可加性,提供灵活的分析能力。如果没有合适的维度表用于存储数量单位,可以将它们放置于退化维中。
存在非可加事实,如利润率。汇总行中的利润率需要根据分类汇总的利润额度和订单额度的比值得到,而非通过将各个销售人员的利润率相加获得。非可加事实以可加事实的比率方式计算。 由于非可加事实并未存储在事实表中,需要注意不要丢失这些事实,应该被文档化。
出现在事实表中的组合数量远远小于可能存在的组合数量,该项特性被称为稀疏性
有时,不可能将所有与业务相关的维度分类到一个紧凑的表集合中。类似这样的情况,将一个或多个维度存储到事实表中是合适的选择。若采用了这种方法,存储到事实表中的维度列被称为退化维度,简称退化维
虽然被存储在事实表中,但该列仍应被视为维度。与其他表中的维度列一样,其值仍然可以用于过滤查询、控制聚合层次、排序数据、定义主从关系等。应该谨慎使用退化维度,因为事实表累计记录的速度很快,包含退化维度可能会造成存储空间的过度消耗。多数情况下,适合选作退化维度的维度最好放置到杂项维度中,事务标识除外。事务标识通常作为退化维度存储。它也可以作为事实表中行的唯一标识,并用于定义事实表的粒度。虽然事务标识通常作为退化维度存储,但这并不是必须遵循的规则。

Star Schema完全参考手册读书笔记四相关推荐

  1. Star Schema完全参考手册读书笔记八

    本博客主要对书中横向钻取进行归纳总结. 横向钻取: 与对数据的上钻或下钻操作无关,它描述的是跨越一个星型模式到另外一个星型模式的步骤.该术语意在描述跨多个过程. 尽管横向钻取操作通常被称为横向钻取查询 ...

  2. Star Schema完全参考手册读书笔记五

    本博客就第三章缓慢变化维和多维数据集的有关知识进行总结. 缓慢变化维 采用维度设计方案时,确定数据源的变化情况在维度表中如何表示非常重要.这一现象称为缓慢变化的维度,简称缓慢变化维.该术语的名称反映了 ...

  3. Star Schema完全参考手册读书笔记三

    本博客重点总结第三章基本原理中的维度表特性. 维度表特性 代理键 星型模式中,每个维度表都分配有一个代理键.代理键仅仅是为数据仓库和数据集市创建的.代理键通常表现为整数,在星型模式加载时的获取.转换. ...

  4. Star Schema完全参考手册读书笔记二

    本博客继续就书中的一些术语和概念进行总结. 数据仓库体系结构 数据仓库描述任何包含分析型数据库的解决方案,包括独立型数据集市.该术语并不表示一个中心或集成仓库. 企业数据仓库指的是企业信息化工厂的中央 ...

  5. Star Schema完全参考手册读书笔记一

    分析型数据库与维度设计 本章主要讲述星型模式中的一些基本概念,具体如下文. 为业务过程度量建模可以实现分析型数据库设计复杂的业务分析工作.业务过程的维度模型由两个组件构成:度量和度量环境.这些组件也称 ...

  6. Star Schema完全参考手册学习笔记九

    本博客主要就维度一致性进行总结. 维度一致性的基本需求 为支持成功的横向钻取对比,必须保证维度表的一致性,可以通过保证两个表相同的方法来解决.对于相同性涉及两个关键的部分:两个表必须结构相同且内容相同 ...

  7. Star Schema完全参考手册学习笔记七

    维度模型描述了人们对所处世界的度量.正如前面章节所强调的那样,每个星型模式都包含一个事实表,作为描述特定过程的度量.度量又称事实,通过相关的维度获得存在的环境.事实表的粒度描述了所记录的事实的细节层次 ...

  8. Star Schema完全参考手册学习笔记六

    本博客就第三章的相关知识点做最后的总结. 本章讨论了星型模式的基本特性.这一主题可以分为4类: 维度表 1.维度表包含自然键和代理键.允许分析模式独立地跟踪源系统的历史. 2.维度表包含众多属性.丰富 ...

  9. 3d游戏设计读书笔记四

    3d游戏设计读书笔记四 一.基本操作演练[建议做] 下载 Fantasy Skybox FREE, 构建自己的游戏场景 a. 在AssetStore中搜索Fantasy Skybox FREE并下载. ...

最新文章

  1. lopa分析_【风险分析方法】HAZOP、LOPA和FMEA三种分析方法,如何做到信息共享?...
  2. 刷新存储器的容量单位是什么_存储系统 半导体存储器
  3. Qt文档阅读笔记-共享库的创建与调用
  4. debian ubuntu 记录系统启动信息
  5. xutils找id报空指针异常
  6. JDK8新特性LocalDate、LocalTime和LocalDateTime
  7. Gstreamer之audio转码(二十三)
  8. SqlServer中保留小数的实现
  9. 【软件相关】CATIA v5R20使用技巧
  10. Android车载方案公司,你该何去何从?
  11. axis webservice 实验
  12. 支付对接常用:关于asp rsa加密
  13. 无法启动此程序因为计算机丢失msvcr110.dll,Win7运行程序提示计算机中丢失msvcr110.dll如何解决...
  14. 2020.8.28丨蛋白质组产品介绍、方案设计和案例解析
  15. 学习半年Java的初次经验分享
  16. 88-Spring Boot详解
  17. 2011 Asia Beijing Regional Online Contest-1004 hdu4043 FXTZ II
  18. (20)打鸡儿教你Vue.js
  19. 错别字纠错 解决方案
  20. 秒杀系统中如何动态生成下单随机URL

热门文章

  1. swiper动态加载数据滑动失效,ajax执行后swiper.js的效果消失问题
  2. SQL HQL JPQL CQL的对比
  3. HightCharts与后台交互
  4. 动态绑数据(GridView控件Header和ItemTemplate)
  5. 关于NavigateUrl中绑定Eval()方法时出现服务器标记的格式不正确的解决方法
  6. 来自微软华人的软件人生经历:功夫在身外
  7. jhipster详解
  8. TCL_事务控制语言
  9. easyUI 如何不跳转页面,只是加载替换center部分内容
  10. 交换机端口呈现err-disable的原因