互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(五)——数据仓库维度建模实例
维度建模实例
库存管理业务建模案例
1. 选定某一业务过程,如:库存管理业务
2.根据各用户的需求(关注的主题),定义该业务处理的粒度。
主题一:矿厂中每种产品库存水平的日快照
主题二:每种特定产品的仓库库存事务每日情况
主题三:每种特定产品每日的入库装运情况
3.选定每个事实表维度
库存水平 事实表维度:日期、矿厂、产品
仓库库存事务 事实表维度:日期、仓库、产品、供应商、事务类型
入库装运 事实表维度:到货日期、检测日期、入库日期、销售批准日期、分拣日期、装箱日期、装运日期、销售批准日期、分拣日期、装箱日期、装运日期、最近回收日期、产品、供应商、仓库
4.确定每个事实表的数字型事实
库存水平 事实表数字型事实:现有数量
仓库库存事务 事实表数字型事实:事实表维度:仓库库存事务金额
入库装运 事实表数字型事实:到货量、检测量、退货量、入库量、批准销售量、分拣量、装箱量、装运量、回收量、顾客退货量
5.确定模型
星形模型
主题一:矿厂库存快照事实,周围三个维:日期维、矿厂维、产品维;
矿厂库存快照事实表包括:日期关键字、产品关键字、矿厂关键字、现有数量;其他维度表有:相应关键字及其属性。
主题二:仓库库存事务事实,周围5个维:日期维、产品维、供应商维、仓库维、库存事务类型维;
主题三:仓库库存累积事实,周围维度表有:到货日期维度、检测日期维度、入库日维度等。
电信DW建模案例
1. 明确业务需求。分解需求。
如:用户行为分析=哪些行为?时长、话费、次数...
用户行为分析=哪些角度?时间、区域、语音、主被叫
2. 确定数据存储粒度。
注:电信DW中,事实表基本是以聚焦型事实表为准,因此粒度基本上由维度决定。
当前细节级ODS:用户通话清单
轻度综合级EDS:用户每日通话汇总
高度综合级DM:用户每月通话汇总
3.确定每个事实表维度:时间、区域、语音、主被叫
时间:分析时段的通话情况,明确闲忙时段区间;
分析每日每周每月通话情况,了解市场稳定性
区域:分析用户漫游、长途通话,制定套餐调整资费
语音:分析用户语音通话行为,分析用户数据业务通话行为
4.确定每个事实表的数字型字段:时长、话费、次数
时长:通话开始时间和结束时间计算得到
话费:本地、长途、漫游;应该不包含优惠冲减话费、话费计算规则
次数:累计通话
5.确定模型
星形模型
互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(五)——数据仓库维度建模实例相关推荐
- 互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(一)——简介入门
互联网电商大数据环境 --数据分析实践培训精华笔记(一) 工作内容 项目:DW数据库建设/经分/客户精准营销/推荐系统需求/移动端数据分析 数据:流量数据/交易数据B2C/会员与活动数据/物流与配送数 ...
- 互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(六)——电商核心业务知识之订单商品模块
电商核心业务知识 订单商品模块(9张表) --订单主要信息表 drop table if exists itqsc.ods_b2c_orders; create external table itqs ...
- 互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(三)——数据仓库理论
数据仓库理论 DW定义 数据仓库是一个面向主题的.集成的.相对稳定的.反映历史变化的数据集合,用于支撑管理决策. 1.聚焦决策者的数据建模与分析,排除对决策无用的数据 2.集成异种数据源,数据一致性( ...
- 互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(二)——BI构建
BI构建 BI应用架构 BI底层:数据源--ETL--BI数据仓库 BI服务:交互式信息板.报告并发布.即席分析.预先检测和警报.离线分析.MS Office插件.Web服务 BI应用:销售.服务和 ...
- 互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(四)——维度建模基础理论
维度建模基础理论 事实表 事实表保存了大量业务度量数据(即事实)的表.最有用的事实是数字类型.可加类型. 事实表以粒度化分:事务粒度事实表(细).周期快照粒度事实表.累积快照粒度事实表(粗). 事实表 ...
- 互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(九)——电商核心业务知识之订单商品模块
商品信息汇总表 select user_id, sum(case when pay_type not in ('退货','拒收') then goods_amount end) p_s ...
- 互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(七)——电商核心业务知识之订单商品模块
订单宽表 #!/bin/bash #====== #dm_b2c_orders.sh 这里用shell来调 #订单宽表--两个表关联 #====== DT=`date -d '-1 day' ...
- 互联网电商大数据环境 ——大数飓数据分析实践培训精华笔记(八)——电商核心业务知识之订单商品模块三
订单指标表计算 #!/bin/bash #====== #dm_b2c_orders_goods.sh 这里用shell来调用SQL #订单指标表计算 #====== DT=`date -d ...
- 鸿蒙手机系统还没有开发,华为鸿蒙手机太难了!引发开发者大吐槽:为何没有自己独特风格?-互联网/电商-文章-小虾米...
[华为鸿蒙手机太难了!引发开发者大吐槽:为何没有自己独特风格?]互联网/电商-文章-小虾米 2020-12-27 11:32:02 小虾米帐号:军事科技(tabc) 关注我 举报 来源:q ...
最新文章
- 内核aio_AIO 的主要内核参数 | 学步园
- ajax 载入html后不能执行其中的js解决方法
- C语言接口的封装和设计专题
- 通宵爆肝:C语言下的平衡二叉树(Avl)原来如此简单!
- IIS7日志文件位置
- 排序-概述,插入排序(180602更新完毕)
- Vijos1755 靶形数独 Sudoku NOIP2009 提高组 T4 舞蹈链 DLX
- 03.Java多线程并发库API使用2
- Python3入门机器学习经典算法与应用 第3章 numpy 聚合操作
- 2月中国万网域名总量净增2.1万个 份额突破24%
- 免费数据集 公开数据集下载 网站
- 移动通信网络协议 — GTP-U 隧道协议
- 计算机网络——网线制作和局域网组建
- Gin框架Go Web项目实战
- 通用oa系统_点晴:免费OA系统V20,让协同办公无处不在
- android数据格式化,手机格式化了?教你找回安卓手机误删数据
- 苹果 M1芯片运行Android模拟器
- android+好用插件推荐,安卓插件推荐:安卓手机必装插件推荐
- oracle空值排到最前面或最后面
- vscode php中文乱码,vscode打开乱码怎么办
热门文章
- 外包员工为什么要往甲方员工发展
- 给简书找BUG赢好礼17.04.11——简书iOS 3.5.0 公测【 App内支持提现/创作流程优化】...
- 读取eml格式文件,并解析
- Android:恢复出厂设置
- PageOffice的初步使用Word编辑Java
- oracle 截取字符串中间_oracle截取字段中的部分字符串
- 3ds Max Loft命令详解
- 前端歌谣的刷题之路-第一题-表单类型
- 解释瑞利分布的平方、莱斯分布的平方、高斯分布的平方 服从什么分布?
- C 字符串转大小写strupr , strlowr, tolower, toupper