ODS 是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需 求。常常被作为数据仓库的过渡,也是数据仓库项目的可选项之一。
根据 Bill.Inmon 的定义,“数据仓库是面向主题的、集成的、稳定的、随时间变化的,主要用于决策支持的数据库系统 ”
ODS 是一个面向主题的、集成的、可变的、当前的细节数据集合,用于支持企业对于即时性的、操作性的、集成的全体信息的需 求。常常被作为数据仓库的过渡,也是数据仓库项目的可选项之一。
在 Kimball 的 << 数据仓库生命周期工具集 The Data WareHouse Liftcycle Toolkit>> ,他是这样定义的
1. 是操作型系统中的集成 , 用于当前,历史以及其它细节查询 ( 业务系统的一部分 )
2. 为决策支持提供当前细节数据 ( 数据仓库的一部分 )
因此操作数据存储( ODS ) 是用于支持企业日常的全局应用的数据集合, ODS 的数据具有面向主题、集成的、可变的和数据是当前的或是接近当前的 4 个基本特征。同样也可以看出 ODS 是介于 DB 和 DW 之间的一种数据存储技术,和原来面向应用的分散的 DB 相比, ODS 中的数据组织方式和数据仓库( DW )一样也是面向主题的和集成的,所以对进入 ODS 的数 据也象进入数据仓库的数据一样进行集成处理。另外 ODS 只是存放当前或接近当前的数据,如果需要的话还可以对 ODS 中的数据进行增、删和更新等操 作,虽然 DW 中的数据也是面向主题和集成的,但这些数据一般不进行修改,所以 ODS 和 DW 的区别主要体现数据的可变性、当前性、稳定性、汇总度上。
由于 ODS 仍然存储在普通的关系数据库中,出于性能、存储和备份恢复等数据库的角度以及对源数据库的性能影响角度,个人不建议 ODS 保存相当长周期的数据,同样 ODS 中的数据也尽量不做转换,而是原封不动地与业务数据库保持一致。即 ODS 只是业务数据库的一个备份或者映像,目的是为了使数据仓库的处理和决策支持要求与 OLTP 系统相隔离,减少决策支持要求对 OLTP 系统的影响。
为什么需要有一个 ODS 系统呢?一般在带有 ODS 的系统体系结构中, ODS 都具备如下几个作用:
1 ) 在业务系统和数据仓库之间形成一个隔离层。
一 般的数据仓库应用系统都具有非常复杂的数据来源,这些数据存放在不同的地理位置、不同的数据库、不同的应用之中,从这些业务系统对数据进行抽取并不是一件 容易的事。因此, ODS 用于存放从业务系统直接抽取出来的数据,这些数据从数据结构、数据之间的逻辑关系上都与业务系统基本保持一致,因此在抽取过程中极 大降低了数据转化的复杂性,而主要关注数据抽取的接口、数据量大小、抽取方式等方面的问题。
2 ) 转移一部分业务系统细节查询的功能
在 数据仓库建立之前,大量的报表、分析是由业务系统直接支持的,在一些比较复杂的报表生成过程中,对业务系统的运行产生相当大的压力。 ODS 的数据从粒度、 组织方式等各个方面都保持了与业务系统的一致,那么原来由业务系统产生的报表、细节数据的查询自然能够从 ODS 中进行,从而降低业务系统的查询压力。
3 ) 完成数据仓库中不能完成的一些功能。
一 般来说,带有 ODS 的数据仓库体系结构中, DW 层所存储的数据都是进行汇总过的数据和运营指标,并不存储每笔交易产生的细节数据,但是在某些特殊的应用中,可能需要 对交易细节数据进行查询,这时就需要把细节数据查询的功能转移到 ODS 来完成,而且 ODS 的数据模型按照面向主题的方式进行存储,可以方便地支持多维分析 等查询功能。即数据仓库从宏观角度满足企业的决策支持要求,而 ODS 层则从微观角度反映细节交易数据或者低粒度的数据查询要求。
在一个没有 ODS 层的数据仓库应用系统体系结构中,数据仓库中存储的数据粒度是根据需要而确定的,但一般来说,最为细节的业务数据也是需要保留的,实际上 也就相当于 ODS ,但与 ODS 所不同的是,这时的细节数据不是“当前、不断变化的”数据,而是“历史的,不再变化的”数据。这样的数据仓库的存储压力和性能压力都是比较大的,因此对数据仓库的物理设计和逻辑设计提出了更高的要求。

 

关于数据仓库 — ODS概念相关推荐

  1. 【转】数据仓库ODS、DW和DM概念区分

    今天看了一些专业的解释,还是对ODS.DW和DM认识不深刻,下班后花时间分别查了查它们的概念. ODS--操作性数据 DW--数据仓库 DM--数据集市 1.数据中心整体架构 数据中心整体架构 数据仓 ...

  2. 数据仓库ods层是啥意思_一文读懂大数据仓库建设

    文章标签: 数据仓库ods层是啥意思 版权 从传统数仓到大数据平台,MPP数据集市,Hadoop集群,还有混合架构数仓,一直在不断演进,但是万变不离其宗,大框架和方法论终归是那一套.所以本文就来分享数 ...

  3. 对数据仓库ODS DW DM的理解

    今天看了一些专业的解释,还是对ODS.DW和DM认识不深刻,下班后花时间分别查了查它们的概念. ODS--操作性数据 DW--数据仓库 DM--数据集市 1.数据中心整体架构 数据中心整体架构 数据仓 ...

  4. 数据仓库——ODS/stg层数据漂移问题

    数据仓库--ODS/stg层数据漂移问题 数据漂移是ODS数据的一个顽疾,通常是指ODS表的同一个业务日期数据中包含前一天或后一天凌晨附近的数据或者丢失当天变更数据. 数据漂移的处理方式: 1)多获取 ...

  5. 数据仓库的概念与体系结构

    数据仓库的概念与体系结构 前言 数据管理技术的发展 人工管理阶段 文件系统阶段 数据库系统阶段 数据库技术与分析性应用结合的问题 数据仓库的基本概念 元数据 数据粒度 数据模型 ETL 数据集市 数据 ...

  6. 数据仓库基本概念介绍

    目录 1.数据仓库所处环节 操作层 数据仓库 数据集市 个体层 2.数据仓库概念 面向主题的 集成的 随时间变化的 非易失的 3.一般架构 STAGE层 ODS层 MDS层 ADS层 DIM层 ETL ...

  7. 数据仓库ods层是啥意思_数据仓库中的ODS、EDW、和DM层是什么?(系列3)

    在第一节内容,提到了数据仓库和数据库的区别,数据仓库作主要面向分析场景的数据库,又进行了"分层"的设计,因此出现了ods层.edw.dm层的设计(也有的公司会使用超过3层的设计模式 ...

  8. 数据仓库ods层是啥意思_数据仓库和数据分层

    数据仓库,Data Warehouse,可简写为DW或DWH.是面向主题的.集成的(非简单的数据堆积).相对稳定的.反应历史变化的数据集合,数仓中的数据是有组织有结构的存储数据集合,用于对管理决策过程 ...

  9. 数据仓库--基本概念

    0x00 前言 整理一些数据仓库中的常用概念.大部分概念不是照搬书上的准确定义,会加入很多自己的理解. 0x01 概念 数据仓库(Data Warehouse) 数据仓库,英文名称为Data Ware ...

最新文章

  1. href=#与href=javascript:void(0)的区别
  2. Python网络编程:IO多路复用
  3. canvas基础-绘制矩形(1)
  4. TypeError系列之:TypeError: 'tuple' object is not callable.
  5. 产业链人士:存储芯片平均售价有望在明年一季度停止下滑 随后趋于稳定
  6. 【Oracle】用户管理
  7. shell编程学习笔记之特殊变量($0、$1、$2、 $?、 $# 、$@、 $*)
  8. 99乘法表c语言显示坐标,C语言打印九九乘法表
  9. 定时任务cron表达式
  10. 阿里云服务器价格表 ECS最新价格优惠汇总
  11. Bootstrap网站模板
  12. LIN自动雨刮:雨量传感器原理与安装
  13. iOS高德地图路径选择
  14. 微信边写边译功能怎么开启
  15. 利用DHT网络,爬取bt种子。
  16. 15.unsafe类的CAS是怎么保证原子性的?
  17. 轻松入门Python爬取基金数据
  18. 基于R语言的Meta分析【全流程、不确定性分析】方法与Meta机器学习技术应用
  19. python_傅里叶变换(DFT、FFT、STFT)
  20. 从月薪2300块的女工,到年薪80万的程序员:那些习惯“随大流”的人,后来都怎么样了?...

热门文章

  1. 常见信息泄露类漏洞风险与解决方案
  2. python将数据做直方图_用python 制作直方图
  3. C语言中【变量】的存储类型共有4种类型
  4. Android开发之最新Android Studio推送代码到最新GitHub教程 | Android Studio绑定GitHub | AS令牌登录GitHub | 创建GitHub令牌
  5. iperf和iperf3测速使用
  6. 三方协议的服务器,电子口岸电子支付签定三方协议是怎么操作的
  7. 钉钉机器人给指定人发消息
  8. Java Scanner findInLine()方法与示例
  9. 杨凌职业技术学院计算机专业宿舍,杨凌职业技术学院宿舍怎么样
  10. python中ifelse语句怎么写_pythonifelse语句怎么写