数据仓库是企业级的,能为整个企业各个部门的运作提供决策支持;而数据集市则是部门级的,一般只能为某个局部范围内的管理人员服务,因此也称之为部门级数据仓库。

1、两种数据集市结构

数据集市按数据的来源分为以下两种

(1)从属数据集市

所谓从属,是指其数据直接来自于中央数据仓库。该结构能保持数据的一致性。

一般为那些访问数据仓库十分频繁的关键业务部门建立从属的数据集市,能提高查询反应速度。

(2)独立数据集市

独立数据集市的数据子集来源于各生产系统,许多企业在计划实施数据仓库时,往往处于投资方面的考虑,首先建成独立数据集市,用来解决个别部门较迫切的决策问题。

2、数据仓库与数据集市的区别

(1)数据仓库:基于整个企业的数据模型建立,面向企业范围内的主题;

数据集市:按照某一特定部门的数据模型建立的,由于每个部门有自己特定的需求,因此,他们对数据集市的期望也不同。 部门主题与企业主题之间可能存在关联,也可能不存在。

(2)数仓存储整个企业内非常详细的数据;数据集市数据详细程度低一些,包含概要和综合数据多一些。

(3)数据集市的数据组织一般采用星形模型。大型数仓的数据组织,星形或雪花形都可以。

(4)数据集市较少保留历史数据。

@二东东
RE: (3)数据集市的数据组织一般采用星形模型。大型数仓的数据组织,星形或雪花形都可以。

在云上数据仓库时代(Redshift, BigQuery, Snowflake 出现的2016年之后)数据集市的数据组织一般采用宽表Wide Table就好了 因为:
宽表可以直接用于BI或者分析师进行分析 (他们习惯于直接分析一个二维表格,而不是拿星形模型再去join)星形模型的cost优势不存在了 因为在云上数据仓库时代 贵的是人工而不是数据存储 所以最省时省力可直接分析的的宽表 在成本上才有优势至于星型模型的另外两个优势performance and understandability 也是不如宽表的
综上 在这个时代 数据集市的数据组织应该是宽表

数据集市与数据仓库的区别相关推荐

  1. 独家 | 一文盘点数据集市和数据仓库的差异(附链接)

    作者:By Gilad David Maayan 翻译:王雨桐 校对:丁楠雅 本文约1600字,建议阅读10分钟. 本文从基本定义入手分析数据集市和数据仓库的差异,并分析了各自的适用情况. 当一家企业 ...

  2. 数据仓库和数据集市的概念、区别与联系

    1.为什么会出现数据仓库和数据集市? "数据仓库"的概念可以追溯到80 年代中期.从本质上讲,最初数据仓库是想为操作型系统到决策支持环境的数据流提供一种体系结构模型,并尝试解决和这 ...

  3. 数据集市是什么?数据集市和数据仓库有什么区别

    前言 本文隶属于专栏<100个问题搞定大数据理论体系>,该专栏为笔者原创,引用请注明来源,不足和错误之处请在评论区帮忙指出,谢谢! 本专栏目录结构和参考文献请见100个问题搞定大数据理论体 ...

  4. 【数据中台】数据集市和数据仓库之间有什么关系

    文章目录 1.数据仓库与数据集市的区别 1.1 数据仓库 1.2 数据集市 1.3 主要区别 2.如何建立数据集市 1.数据仓库与数据集市的区别 1.1 数据仓库 数据仓库是一个面向主题的.集成的.相 ...

  5. 数仓和mysql的区别_数据库和数据仓库的区别和联系

    数据库与数据仓库的区别和联系https://www.zhihu.com/video/1252167793992593408 在以往我们和客户的沟通过程中,大家经常会问到这样的一个问题,数据库和数据仓库 ...

  6. 星型模型 3nf的区别_数据库和数据仓库的区别和联系

    数据库与数据仓库的区别和联系https://www.zhihu.com/video/1252167793992593408 在以往我们和客户的沟通过程中,大家经常会问到这样的一个问题,数据库和数据仓库 ...

  7. 政府信息化与电子政务、企业信息化与电子商务、数据库和数据仓库的区别、商业智能系统处理过程、数据仓库结构图、数据挖掘、数据仓库和数据湖的对比

    政府信息化与电子政务.企业信息化与电子商务.数据库和数据仓库的区别.商业智能系统处理过程.数据仓库结构图.数据挖掘.数据仓库和数据湖的对比 政府信息化与电子政务 企业信息化与电子商务 1.企业资源计划 ...

  8. 数据湖和数据仓库的区别?

    简介 数据湖这个概念和数据仓库这两个概念一直搞不清楚,之前感觉区别就是数据湖是数据仓库的父集.数据湖是个伪命题,平时生活中也用不到,然后今天听了我的一个师哥的讲解,然后简单总结下. 常见的问题 1 数 ...

  9. 数据库和数据仓库的区别

    简而言之,数据库是面向事务的设计,数据仓库是面向主题设计的. 数据库一般存储在线交易数据,数据仓库存储的一般是历史数据. 数据库设计是尽量避免冗余,一般采用符合范式的规则来设计,数据仓库在设计是有意引 ...

最新文章

  1. 10个迷惑新手的CocoaObjective-c开发问题
  2. python是什么语言汇编_编程语言及python介绍
  3. 给大家推荐对Redis分析讲解比较详细的大牛
  4. 关于微信分享的一些心得之recommend.js(直接复制就行)
  5. (转)dp动态规划分类详解
  6. dao层和service层和control_最受欢迎Java数据库访问框架(DAO层)
  7. 丁磊:网易在元宇宙技术和规划上已经做好准备
  8. 黑马程序员---java基础-Java之GUI
  9. RHEL5中配置vsftpd搭建FTP服务器
  10. forever不重启 node_利用forever确保nodejs在后台运行,不会down掉
  11. Citrix 桌面云 XenApp_XenDesktop_7.15 部署系列(九)客户端使用
  12. COPY NAV导航网格寻路 -- 光照射线法
  13. [USACO2008 Mar]土地购买
  14. 硬盘文件系统系列专题之二 NTFS
  15. 文件服务器杀毒软件推荐,服务器上装什么杀毒软件好?
  16. Unity新创建的物体是灰色的,而且无法通过白色材质球给予纯白色(结果还是灰色)
  17. 分享基于HTTP长连接的Web端即时通讯技术
  18. 如何做述职报告/职级跃阶报告
  19. 老虎过河编程java_2017年拓展游戏《老虎过河》
  20. 中软国际万人基地项目落户高新区软件新城(组图)

热门文章

  1. 计算机图形学入门(二)-线性代数部分知识2视图变换和投影变换
  2. CSAPP Lab2 实验记录 ---- Bomb Lab(Secret Phase彩蛋解析)
  3. Android P中的AVB校验(二)
  4. Java 8 辣么大(lambda)表达式不慌之-----(一)Function
  5. php怎么设置浏览器提示错误,浏览器怎么显示php错误
  6. 5分钟了解单片机数据、地址、控制总线结构
  7. 将word文档转化为html(代码)
  8. [Unity3D]Unity3D游戏开发之仿仙剑奇侠传角色控制效果
  9. opensuse常用软件安装
  10. FaceRecognitionDotNet人脸识别项目发布到linux服务器docker容器详细教程