数据中台数据模型的分层,业界比较通用的分层方式是将数据模型分为5层:①ODS(Operate Data Store,操作数据层)、②DIM(Dictionary Data Layer ,维度数据层)、③DWD(Data Warehouse Detail ,明细数据层)、④DWS(Data WarehouseService,汇总数据层)、⑤ADS(Application Data Store,数据应用层)。

各层数据模型之间的关系如图1-1所示。

图1-1  分层模体系

第一层是ODS和DIM层。ODS层数据是数据仓库的第一层数据,是业务数据库的原始数据的复制,例如,每条产品线的用户信息、订单信息等数据一般都是原封不动地同步到数据中台的ODS层中。ODS层的作用是在业务系统和数据仓库之间形成一个隔离层,在数据中台进行计算任务时,可以以ODS层的数据为基础进行计算,从而不给业务数据库增加负担。DIM层存储的是维度数据如城市、省份、客户端等维度的数据。

第二层是DWD。DWD层数据是数据仓库的第二层数据,一般是基于ODS和DIM层的数据做轻度汇总。DWD层储存经过处理后的标准数据,需要对ODS层数据进行再次清洗(如去空/去脏数据、去超过极限的数据等操作)。DWD层的结构和粒度一般与ODS层保持一致,但是DWD汇总了DIM层的维度数据,比如在ODS层只能看到客户端的ID

《数据中台实战》:数据中台的分层建模体系相关推荐

  1. 数据中台应用实战-数据中台建设四步方法论:采、存、通、用

    前言 关于产品的系列博文,博主已经放在下面专栏,有需要的小伙伴自行订阅. 数据中台入门到精通系列讲解 https://blog.csdn.net/wenyusuran/category_9162242 ...

  2. 超30万字的中台实战100讲2.0最终版(建议收藏!)

    共3510字|阅读用时5分钟 目录V2.0终版迭代内容: 增加最近更新的中台系列文章至本目录: 根据最新热点修订并调整部分未更新内容方向: 目录V1.1迭代内容: 增加最近更新的中台系列文章至本目录: ...

  3. R语言数据包自带数据集之ISwR包的melanom数据集字段解释、数据导入实战

    R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ISwR包的melanom数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数 ...

  4. UCL葡萄酒(red white wine quality)数据集字段解释、数据导入实战

    UCL葡萄酒(red white wine quality)数据集字段解释.数据导入实战 目录 UCL葡萄酒(red white wine quality)数据集字段解释.数据导入实战 #数据字段说明 ...

  5. R语言数据包自带数据集之survival包的colon数据集字段解释、数据导入实战

    R语言数据包自带数据集之survival包的colon数据集字段解释.数据导入实战 #数据字段说明 colon数据集:B/C期结肠癌辅助化疗治疗数据 d # 患者编号 study # 所有患者都是1 ...

  6. R语言数据包自带数据集之survival包的lung数据集字段解释、数据导入实战

    R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之survival包的lung数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导 ...

  7. R语言数据包自带数据集之ToothGrowth数据集字段解释、数据导入实战

    R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 目录 R语言数据包自带数据集之ToothGrowth数据集字段解释.数据导入实战 #数据字段说明 #导入包 #导入数据 #数 ...

  8. 泰坦尼克号(titanic)数据集字段解释、数据导入实战

    泰坦尼克号(titanic)数据集字段解释.数据导入实战 目录 泰坦尼克号(titanic)数据集字段解释.数据导入实战 #数据字段说明 #导入数据 #数据字段说明 # 尽管在沉船事件中幸存下有'一些 ...

  9. 数据中台实战(一):以B2B电商亿订为例,谈谈产品经理视角下的数据埋点

    关注公众号:改变世界的产品经理,回复" 1 "获取10G产品经理学习资料. 笔者所在公司为富力环球商品贸易港,是富力集团旗下汇聚原创设计师品牌及时尚买手/采购商两大社群,通过亿订B ...

最新文章

  1. linux centos7 设置 grub2
  2. golang函数后的 {
  3. c++:栈的基本操作+实例:迷宫求解
  4. 【CyberSecurityLearning 18】ACL及实验演示
  5. php url无效,PHP解析URL并失去URL中的参数
  6. Android TextView长按复制实现,Android复制文本
  7. 重装系统失败后怎么用好系统U盘启动解决?
  8. resize属性,使textarea在ff(火狐)中禁止拉伸
  9. C#数据结构-双链表
  10. android 即时聊天工具 yq,Android 开发即时聊天工具 YQ :(四) 获取好友列表
  11. 2014年数学建模美赛题目原文及翻译[个人思路]
  12. 1微秒等于多少皮秒_秒的换算:皮秒、纳秒、微秒、毫秒
  13. Excel函数教程_COLUMN和VLOOKUP实现多字段匹配
  14. BIT计科小学期web前端开发lab1
  15. 初探 ModBus4j -简单使用指南
  16. 用好【shareinstall】 App推广转化率提升80% so easy!
  17. C# Show()和ShowDialog()
  18. 卿苏德博士:关于区块链的真正落地,这4大应用场景很靠谱
  19. 院士发声:科研人也要养家,非升即走只能做短平快的研究
  20. 工作日记 day01

热门文章

  1. 陶哲轩实分析习题17.1.2
  2. 使用Convirt 2.0.1管理虚拟机环境
  3. Leetcode1712. 将数组分成三个子数组的方案数[C++题解]:双指针和前缀和
  4. 通信原理随机信号分析
  5. Leetcode402 remove-k-digits贪心+vector模拟栈的思想
  6. 台湾国立大学郭彦甫Matlab教程笔记(8)文件读写
  7. gps卫星位置计算程序matlab_卫星空间大地测量中GPS周跳探测的四种方法
  8. java读取dcm影像文件_使用dcmtk库读取.dcm文件并获取信息+使用OpenCV显示图像
  9. python接口自动化测试面试题_Python接口自动化面试题总结
  10. apache tomcat下32还是64_JDK和Tomcat安装和配置的图文教程