数据仓库基础理论

  • 一、数据仓库
    • 1、概念
    • 2、数据仓库分层结构
    • 3、为什么要分层
  • 二、数据集市
  • 三、数据湖
    • 1、数据湖和数据仓库

一、数据仓库

1、概念

数据仓库(Data Warehouse, DW):一个面向主题的、集成的、非易失的、反应历史变化的、用来支持企业管理决策的数据集合。

2、数据仓库分层结构

缓冲层、贴源层、基础明细层、数据服务层、集市层

贴源层ODS: 业务系统数据的集合;
基础明细层DWD层:基于ODS层,进行统一范式建模,规整基础数据;


数据中间层(DWM层):对一些基础指标进行汇总;
数据服务层(DWS层):以企业视角,建立多个主题域模型;
数据集市层(DM层):为特定主题提供定制化服务;

3、为什么要分层

  • 复杂问题简单化:每层的职责明确;
  • 减少重复开发:规范数据分层,减少重复计算量,增加计算结果的复用性;
  • 隔离原始数据:使真实数据与最终统计数据解耦;
  • 空间换时间:通过大量的预处理来提升系统的用户体验、分析效率;

二、数据集市

数据集市:是一个针对某个主题、某个部门或者某些特殊用户而进行分类的数据集合,也称为“小数据仓库”或“部门级数据仓库”

  • 满足特定部门或用户需求;
  • 能够聚焦特定主题;
  • 统一的高质量数据;
  • 数据仓库的子集;

独立型数据集市(自下而上开发):先做独立的数据集市,当达到一定规模后,再从各个数据集市进行数据的整合建立企业级的数据仓库。

  • 不能以全局视角分析数据,可能产生大量冗余数据
  • 搭建快,成本低

从属型数据集市(自上而下开发): 先建立企业级数据仓库,然后从数据仓库中为各个部门抽取必要的数据建立部门级的数据集市。

  • 可提高数据分析的质量
  • 体系结构更稳定
  • 实施周期长、难度大、风险高

三、数据湖

1、数据湖和数据仓库

数据湖的核心是:提供一个统一的数据存储模式。

数据湖主要提供一个统一的数据存储模式,分析类应用(数据中台、数据仓库)可以在其基础上搭建。

狭义的数据湖只是一种底层的数据存储模型,而广义的数据湖包括了数据集成,数据治理,数据处理与分析,数据挖掘,安全管控,质量检验等。

一、数据仓库基础理论相关推荐

  1. 数据仓库基础理论笔记

    from:https://blog.csdn.net/china_demon/article/details/51891873 第一节 互联网电商大数据环境 如果你真正进入这个行业了! 入职后你所在部 ...

  2. 数据仓库电商建模_真实电商数据仓库全流程开发详解,资源教程下载

    课程名称 Hadoop大数据视频教程-第一季:真实电商数据仓库全流程开发详解(共46讲),资源教程下载 课程目录 第一部分:数据仓库基础理论与技术圈 第一章:互联网电商大数据环境 第二章:商业智能与数 ...

  3. 数据仓库建设Best Pratice学习

    学前准备 数据仓库是什么? 从字面上理解,说白了就是把数据存在一个地方,类似于现实生活中的仓库,之所以叫数据仓库,也是由于它的一些特性 数据仓库的作用,可以分为以下几点: 存储:数据仓库将接收和存储来 ...

  4. 华为、蚂蚁金服等都在招聘的大数据开发,需要具备哪些技能

    今日给大伙儿详细介绍"最受欢迎"的职位大数据开发技术工程师的规定. 往往说受欢迎关键是应用场景2个缘故,一由于许多应届毕业生或是想转到大数据行业的同学们,全是期待从业"大 ...

  5. 数据挖掘相关岗位分析及规划

    目录 相关岗位情况 个人能力要求 具体计划实施 相关岗位情况 资料来源如下,以及一些招聘网站. 岗位详细介绍https://www.zhihu.com/question/50538518/answer ...

  6. 漫谈数据仓库之维度建模

    2019独角兽企业重金招聘Python工程师标准>>> 0x00 前言 下面的内容,是笔者在学习和工作中的一些总结,其中概念性的内容大多来自书中,实践性的内容大多来自自己的工作和个人 ...

  7. 数据仓库、商业智能的体系结构

    来源:http://ajava.org/readbook/db/dbgcsks/12413.html 16.2  数据仓库.商业智能的体系结构 如图16-5所示是数据仓库/商业智能的完整的体系结构图, ...

  8. 大数据分块_空间数据库基础理论 GIS空间数据处理分析涉及的基本概念

    <空间数据库>课程整理汇总,106篇课程,内容太长,学习中,把一些关键点,汇总记下笔记 地理空间 GIS中的地理空间(Geo-spatial)是指经过投影变换后,在笛卡尔坐标系中的地球表层 ...

  9. 数据仓库建模方法/范式建模法/维度建模法/事实表/维度表/优缺点/建模流程/概念建模/逻辑建模/物理建模

    常见的有 范式建模法.维度建模法.实体建模法等,每种方法从本质上将是从不同的角度看待业务中的问题,不管是从技术层面还是从业务层面,都代表了哲学上的一种世界观. 1 范式建模法(Third Normal ...

最新文章

  1. Unity 2021人工智能导论 Introduction to Artificial Intelligence in Unity 2021
  2. 设计模式三—抽象工厂模式
  3. Kong APIGW — Overview
  4. java加法器_javacc例子:加法器
  5. 工程和模块的关系以及继承和依赖的概念
  6. Vue + SpringBoot跨域
  7. 矩池云上cifar10使用说明
  8. sql返回刚添加的数据的自增id
  9. Zabbix 4.0.0 新功能介绍
  10. 我的老板给我推送了这篇文章,之后我成为了顶级码农!
  11. 190527每日一句,励志| 为了成功,约束自己;有时候“再等等”,就再也等不到了
  12. JxBrowser 与 JavaFX WebView
  13. Vux使用Swiper遇到的问题
  14. 优秀logo,最基础的设计技巧(四)
  15. 书论92 侯仁朔《侯氏书品》
  16. 文件服务器 ip白名单,如何将百度云加速的IP段加入到服务器IP白名单中
  17. 结构,是指事物自身各种要素之间的相互关联和相互作用的方式
  18. PMO、QA、EPG各自的职能划分及关系是什么?
  19. 索马里ECTN/BESC/CTN证书 我司办理
  20. 合约安全(2):Bancor Network权限配置错误漏洞

热门文章

  1. Mac不同应用之间切换使用不同输入法
  2. 电商名词sku和spu的区别
  3. html 与 css 画哆啦A梦
  4. OHIF记录(二)——Viewers和React-vtk工具包互联
  5. 一种简洁的流式推送文件分享法
  6. imx8mqevk OPTEE 全系统构建
  7. SpringCloudGateway路由定义存至Mysql数据库
  8. 阿里云服务器没有公网IP
  9. 谈谈我的信息安全学习经历
  10. Kubernetes 安全专家(CKS)必过心得