数据立方体的基本计算
数据立方体计算是数据仓库实现的一项基本任务。这里介绍几种计算方法
1.多路数组聚集计算法(multiway)(计算完全方体)
(1)把数组划分成块,块是一个子立方体,它足够小可以放入立方体计算时所需的内存即可。
(2)通过访问立方体单元(即获取立方体单元的值)来计算聚集。
例:一个空间立方体(我上篇所用的那个),我们要计算它,将它划分成很小的基于内存的块。我们将其化为64块(a0b0c0(1),a1b0c0(2)...a3b3c3(64))这样我们首先计算基本方体(包含abc的所有方体,然后计算2-D方体,1-D方体,0-D(顶点)方体)
2.BUC从顶点方体向下计算冰上立方体(计算稀疏冰山立方体)
1.首先扫面整个输入,计算整个度量
2.针对方体的每一维进行划分
3.针对每一个划分,对他进行聚集,为该划分创建一个元组并得到该元组的计数。判断其分组基数是否满足最小支持度。
4.满足输出该划分的聚集元组并在该划分下对下一维进行递归调用。否则剪枝。
3.动态星型结构计算冰山立方体(star-cubing)
它是一种集成自顶向下和自底向上的立方体计算方法
如图以ABD为根的子树中的所有方体都包含维AB,我们把子树中所有方体都包含的维成为共享维。
接下来我们构建方体树,树的每一层代表一个维,每个节点代表一个属性值。构建方体树和共享维是为了方便剪枝
如果单个维A的属性值P上的聚集不满足最小支持度,则将该节点用×替换,从而进一步压缩方体树。我们称属性A中的节点P为星界定啊,使用星节点压缩的方体树称为星树。
数据立方体的基本计算相关推荐
- 【数据立方】数据立方体的有效计算、物化materialization,索引OLAP数据
一.数据立方体的有效计算 多维数据分析的核心是有效计算多个维度合上的聚集.按SQL术语,这些聚集称为group-by. 对于n维的立方体,包括基本立方体总共有(2的n次幂)个方体.(假设每个维没有分层 ...
- 5.数据立方体计算与数据泛化
1.两种不同类别的数据挖掘方法 描述性挖掘: 数据泛化 预测性挖掘:分类.回归分析 2.数据立方体的物化 3.数据立方体.闭立方体.立方体外壳和和计算策略搭档大裆..喜欢西幻 4.什么是概念描述 概念 ...
- 数据挖掘与数据仓库——数据仓库、 OLAP及数据立方体计算
数据仓库. OLAP及数据立方体计算 什么是数据仓库 有多种但并不严格的定义 与操作数据库相隔离并单独维护的一个用来支持决策过程的数据库. 一个用来对整理过的历史数据进行分析以便支持信息处理的固定平台 ...
- 数据立方体计算与数据泛化
总述:数据在经过预处理和装入数据仓库之后,下一步就是应用具体的算法来处理数据,找出其中有业务意义的部分.这一部分详细的介绍了数据挖掘相关算法的核心思想,常见问题算法的指导方向. 如何根据数据立方体的情 ...
- 【数据挖掘笔记五】数据立方体技术
5.数据立方体技术 数据仓库系统在各种粒度上为多维数据的交互分析提供OLAP工具,OLAP工具使用数据立方体和多维数据模型对汇总数据提供灵活的访问,因此重点要关注数据立方体的技术.数据立方体技术包括数 ...
- mysql构建数据立方体_OLAP数据建模工具Workbench的初步使用(数据立方体的建立)
OLAP数据建模工具Workbench的初步使用(数据立方体的建立) 概要: 1.workbench工具简介 2.workbench简单操作(附demo) 3.workbench初步使用总结 1.wo ...
- 数据挖掘:概念与技术 第五章-数据立方体技术
数据立方体技术: 基本方体的单元是皆不能单元,非基本方体的单元是聚集单元 聚集单元在一个或者多个维上聚集,其中每个聚集维用单元记号中的星号指示.假设有一个n维数据立方体,如果a中恰有m个值不是星号,则 ...
- 数据仓库、OLAP和数据立方体
文章目录 数据仓库.OLAP和数据立方体 1. 数据仓库 1.1. 数据仓库定义 1.2. 关键术语解释 2. 数据仓库和数据库的区别 3. OLAP 3.1. 基本概念 1) 维 2)操作 3.2. ...
- OLAP和数据立方体
文章目录 数据仓库 多维数据模型 事实表和维表 数据立方体和OLAP OLAP的基本操作 维和立方 数据立方体实例 数据立方体物化 数据仓库 数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决 ...
最新文章
- Your Podfile has had smart quotes sanitised
- Ubuntu14.04桥接网络设置与SSH登陆
- Delphi7的控件安装与删除
- 体验.NET5 RC1极致性能,你也要“卧槽”!
- 学生如何提高专业英文阅读能力(施一公)
- PXE-cobbler 无人值守装机------续
- Node.js+Express商业开发中的安全性考虑
- (算法)从10000个数中找出最大的10个
- android apk 在线分析,apkanalyzer
- 使用Python写登录京东商城购物,加入购物车的脚本
- E+H流量计5P3B15-BBDBAAAFADEA1S1AA1+AK
- 计算机管理组合用户,Windows2000用户和计算机帐户管理
- 头像怎么画,日系头像绘画教程
- ac68u 搭建php,华硕RT-AC68U无线路由器深度体验
- uniapp登录页面加入图片验证码
- 心跳太快对身体带来影响?4种方法来减速!
- android闪存软件测试,谷歌商店上架一款软件:专门测试华为P10闪存,一秒出结果...
- 使用flash id不拆盘查看SSD颗粒
- mysql联合索引如何创建
- 【LeetCode】【剑指offer】【剪绳子(二)】
热门文章
- Intel微处理器Uncore架构简介
- GitHub消除马赛克项目
- 前端css中常见的-moz-,-webkit-,-o-分别是什么?
- Python400集大型视频,无偿分享,从正确方向学习python,全套python入门完整视频
- 调用微信扫码实现扫一扫签到
- ERP收付款的操作与设计--开源软件诞生22
- Android平台所支持的API级别
- Android 内外边距
- 2020年全国大学生数学建模竞赛赛题 选题建议
- linux删除序号2的文件,Linux使用rm-rf删除了重要文件?不要慌,我们有恢复神器!-rm文件...