一、基本概念

DW
数据仓库(Data Warehouse):是一个面向主题的(Subject Oriented)、集成的(Integrated)、相对稳定的(Non-Volatile)、反映历史变化(Time Variant)的数据集合,用于支持管理决策(Decision Making Support)。

ODS
ODS:是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需求。

那么大家可能会问ods和数据仓库的区别是什么哪?答:ods是短期的实时的数据,供产品或者运营人员日常使用,而数据仓库是供战略决策使用的数据;ods是可以更新的数据,数据仓库是基本不更新的反应历史变化的数据,还有很多,这里就不一一列举了。

ODS作为数据库到数据仓库的一种过渡形式,与数据仓库在物理结构上不同,能提供高性能的响应时间,ODS设计采用混合设计方式。

ODS中的数据是"实时值",而数据仓库的数据却是"历史值",一般ODS中储存的数据不超过一个月,而数据仓库为10年或更多.

DM(Data Mart)
为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(subjectarea)。在数据仓库的实施过程中往往可以从一个部门的数据集市着手,以后再用几个数据集市组成一个完整的数据仓库。需要注意的就是在实施不同的数据集市时,同一含义的字段定义一定要相容,这样再以后实施数据仓库时才不会造成大麻烦。

二、三种方案

如何能搭建一个体系,既能支持战略决策使用的数据仓库数据,又能兼容业务快速的变化和运营产品人员日常需求的ODS数据哪?
经过调研,发现大体上有三种方案:

1、业务数据 - ODS - 数据仓库

优点:这样做的好处是ODS的数据与数据仓库的数据高度统一;开发成本低,至少开发一次并应用到ODS即可;可见ODS是发挥承上启下的作用,调研阿里巴巴的数据部门也是这么实现的。

缺点:数据仓库需要的所有数据都需要走ODS,那么ODS的灵活性必然受到影响,甚至不利于扩展、系统的灵活性差

2、OB - ODS
优点:结构简单。一般的初创数据分析团队都是类似的结构,比如我们部门就应该归结到这一范畴

缺点:这样所有数据都归结到ODS,长期数据决策分析能力差,软硬件成本高,模块划分不清晰,通用性差

3、数据仓库和ODS并行

可见这个模型兼顾了上面提高的各自优点,且便于扩展,ODS和数据仓库各做各的,形成优势互补!可以解决现在互联网公司遇到的快速变化、快速开发等特点!特别是对于那些刚刚创建数据团队,数据开发人员紧缺的公司,可以尝试使用这个数据架构解决问题!

三、主要区别

ODS与DW的区别主要有以下几点:

1、数据的当前性

ODS包括的是当前或接近当前的数据,ODS反映的是当前业务条件的状态,ODS的设计与用户或业务的需要是有关联的,而DW则是更多的反映业务条件的历史数据。

2、数据的更新或加载

ODS中的数据是可以进行修改的,而DW中的数据一般是不进行更新的。ODS的更新是根据业务的需要进行操作的,而没有必要立即更新,因此它需要一种实时或近实时的更新机制。另外,DW中的数据是按照正常的或预先指定的时间进行数据的收集和加载的。

3、数据的汇总性

ODS主要是包括一些细节数据,但是由于性能的需要,可能还包括一些汇总数据,如果包括汇总数据,可能很难保证数据的当前性和准确性。ODS中的汇总数据生命周期比较短,所以可称作为动态汇总数据,如果细节数据经过了修改,则汇总数据同样需要修改。而DW中的数据可称为静态的汇总数据。

4、数据建模

ODS是站在记录层面访问的角度而设计的,DW或DM则是站在结果集层面访问的角度而设计的。ODS支持快速的数据更新,DW作为一个整体是面向查询的。

5、查询的事务

ODS中的事务操作比较多,可能一天中会不断的执行相同的事务,而DW中事务的到达是可以预测的。

6、用途

ODS用于每一天的操作型决策,是一种短期的;DW可以获取一种长期的合作广泛的决策。ODS是策略型的,DW是战略型的。

7、用户

ODS主要用于策略型的用户,比如保险公司每天与客户交流的客服;而DW主要用于战略型的用户,比如公司的高层管理人员。

8、数据量(主要区别之一)

ODS只是包括当前数据,而DW存储的是每一个主题的历史快照;

数据仓库DW、ODS、DM及其区别总结相关推荐

  1. 数据仓库DW、ODS、DM概念及其区别

    数据仓库DW.ODS.DM概念及其区别 一.整体结构 在具体分析数据仓库之前先看下一下数据中心的整体架构以及数据流向 数据中心整体架构 DB 是现有的数据来源(也称各个系统的元数据),可以为mysql ...

  2. DW数据仓库与ODS的区别

    这两天接触到ODS,开始很纳闷,有了DW(Data Warehouse)干嘛还要ODS(Operational Data Store),于是不查不知道,一查吓一跳,这里面还有这么多道道,这里总结一下, ...

  3. 传统数据仓库 DW/EDW/BI/ODS/DM/ETL

    DW 数据仓库 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH.数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合.它是单个数据存储,出于分析性报告和决策 ...

  4. 【转】数据仓库ODS、DW和DM概念区分

    今天看了一些专业的解释,还是对ODS.DW和DM认识不深刻,下班后花时间分别查了查它们的概念. ODS--操作性数据 DW--数据仓库 DM--数据集市 1.数据中心整体架构 数据中心整体架构 数据仓 ...

  5. 数据仓库、事实表、维度表、DB、DW、DM、ODS、OLAP、OLTP和BI的概念理解

    详情请点击 1.数据仓库 DW是一个 面向主题的,集成的,相对稳定的,反映历史变化的 数据集合 用于支持管理决策(DMS) 面向主题的:经过ETL抽数.清洗.转换加载之后,数据按不同主题存放同一个库中 ...

  6. 五十六、 白话讲解商业智能 BI、数据仓库 DW、数据挖掘 DM

    商业智能 BI.数据仓库 DW.数据挖掘 DM 商业智能BI(Business Intelligence) .相比于数据仓库.数据挖掘,它是一个更大的概念.商业智能可以说是基于数据仓库,经过了数据挖掘 ...

  7. 数据仓库与ODS的区别

    我在公司的数据部门工作,每天的订单类数据处理流程大致如下: 删除分析数据库的历史订单数据 全量更新订单数据到分析数据库.(由于订单核心数据不大,所以经受得起这么折腾) 将数据简单清洗,并生成数据集市层 ...

  8. 数据仓库之ODS层设计概要

    ODS层辨析 ODS全称是Operational Data Store,即操作数据存储. Inmon VS Kimball Bill.Inmon的定义:ODS是一个面向主题的.集成的.可变的.当前的细 ...

  9. 数据仓库与数据集市的概念区别

                                                                                                         ...

最新文章

  1. 判断字符串不包含某个字符php,java判断字符串是否包含某个字符的方法
  2. 算法分析赛:从数据中挖掘价值,72万奖金,DCIC 2020 大数据赛道来了!
  3. werkzeug源码阅读笔记(二) 下
  4. fastjson将json字符串转为Map对象,拿走不谢
  5. 双绞线传输距离_光纤传输有哪些特点 光纤传输原理介绍【图文】
  6. 初探swift语言的学习笔记三(闭包-匿名函数)
  7. html selsec 文字靠右,EDA课程设计
  8. spring cloud微服务_面试败给微服务?别怕,我带你一起手撕Dubbo,SpringBoot与Cloud...
  9. ~~约数个数(附模板题)
  10. Python实现快乐的数字
  11. 力扣题目系列:322. 零钱兑换
  12. (轉載)HDMI之EDID字段解析
  13. 如何修复uefi引导?这种方法才是最有效的解决方法
  14. python判断完美数_Python识别完美数
  15. 计算机控制技术第二版答案于微波,微波技术习题答案 2.doc
  16. 密码学|离散对数问题、计算量较大的二次方程求解(sagemath与python z3库的使用)
  17. docker学习笔记(三)镜像
  18. 【JavaScript】JS中的预解析
  19. 任正非评华为HR胡玲事件,元芳你怎么看?
  20. 完全模拟FIFA2014世界杯 原创求顶!

热门文章

  1. 【Java SE】this引用注意事项
  2. NMS 和 Soft-NMS简单介绍
  3. WSN无线传感网络-节点分簇功能python实现
  4. 以中国传统的孔子和老子的思想来分析忍者代码
  5. Docker网络解决方案 - Weave部署记录
  6. Pedestrian Collision Avoidance System for Scenarios with Occlusions--有遮挡情况下的行人避让系统
  7. gitlab使用外部nginx反向代理
  8. mysql密码过期,修改密码,设置永不过期
  9. 华为鸿蒙遭狙击,华为鸿蒙系统或遭狙击!谷歌也被迫启用新系统:将终结安卓系统神话...
  10. git 同步服务器文件,同步本地 / 服务器代码 - Git 篇