大家好,我是大D。

这篇文章跟大家一起聊下数仓中比较容易混淆的两个概念——数据域、主题域。有的公司对二者的界限并不明显,都统一称为数据域或者主题域;也有的公司两者是区分开使用的,那么数据域和主题域有什么区别呢,根据自身工作经验,聊下自己的见解。

数据域

数据域是指面向业务分析,将业务过程或者维度进行抽象的集合。它是以业务系统的角度,对业务过程进行归纳,抽象出来的数据域。

业务过程可以概括为一个个不可拆分的行为事件,比如在电商业务中店铺商品浏览、网页区块点击、加购物车、下单、订单支付、确认收货等行为事件都属于业务过程,然后对这些业务过程产生的数据进行抽象提炼,可简单理解为对这些数据分类到不同的数据域中,要求所划分的数据域既能够涵盖当前所有的业务需求,又能将一个新业务无影响地被包含进来,或者扩展出一个新的数据域。

在电商业务中,对业务系统输出的数据进行数据域划分,可以有商品域、日志域、交易域、用户域、服务域等。

商品域:商品库存、上架、下架等;

日志域:店铺商品的浏览、点击等;

交易域:加购、下单、支付、确认收货、退款等;

用户域:注册、登录、信息修改等;

服务域:申诉、投诉、纠纷、评价等。

主题域

对于数据仓库的定义是这样的,它是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。

可以把数据仓库类比为图书馆,集合中的数据就是书架上摆放的书籍。一个好的数据仓库,在其中取数就应该如同在图书馆中查找书籍一样准确快速,这就要求数仓有一个良好、规范的组织结构,能够对集合中的数据进行有序、有结构地分类组织和存储。如若不然,数仓就会沦为数据沼泽,使用和维护的成本都将会很高。

而主题题域在数仓建设中则是按照数据分析应用的角度进行划分的,通常是联系较为紧密的数据主题的集合。可以根据业务的需求特点,将从业务系统划分的数据域重新划分至不同的主题域。如同图书馆面向社会不同群体的需求,对图书划分为经济类、医学类、哲学类、管理类等多个主题。

数据域与主题域区别

数据域是自下而上,以业务数据视角来划分数据,一般进行完业务系统数据调研之后就可以进行数据域的划分。

主题域则自上而下,以业务分析视角来划分数据,一般进行完业务需求调研之后才可以进行主题域的划分。

例如,商品数据域是面向数据的,对数据的分类,数据驱动业务,更好地赋能业务;商品主题域是面向主题的,根据业务需求分析,从业务驱动进行分析场景的建设。

举个更形象点的例子,建设数仓就像饭店做菜一样,数仓在面向业务系统数据根据其特点划分出数据域,如同厨房根据采购的食材特点将它们摆放在不同货架区,如肉禽区、果蔬区、调味区等。而数仓在面向业务分析根据其需求划分出主题域,如同饭店根据不同食客群体的口味需求将食材做成了不同菜系,如江浙菜、鲁菜、川菜等。

大家还有什么问题可以在下方留言,或者加入交流群一起探讨。

本文由mdnice多平台发布

聊聊数据域和主题域的区别相关推荐

  1. 数仓建设:数据域和主题域是什么关系?

    为什么会有域的概念呢? 首先来看看数据仓库的定义吧,数据仓库是一个面向主题的.集成的.相对稳定的.反映历史变化的数据集合,用于支持管理决策. 主题域已经体现出来了 主题域用于将数据集市按照分析视角进行 ...

  2. 谈笑间学会数仓—主题域数据域

    谈笑间学会数仓-主题域&&数据域 在之前的文章里虽然没有按照顺序来,但是基本上都介绍了数据仓库建设的大概流程,比如技术架构方案设计.建模方法论.数仓分层.开发规范.数仓建设中的各种事实 ...

  3. 「数仓面试」如何确定主题域?

    作者:一哥 来源:数据社 全文共1759个字,建议7分钟阅读 大家好,我是一哥,前几天跟一个朋友聊了一些数据中台建设的内容,针对数据仓库中主题域如何划分这个话题聊了很多.其实数据仓库建设的理论大家已经 ...

  4. 数据仓库专题(6)-数据仓库、主题域、主题概念与定义

    一.数据仓库 关于数据仓库概念的标准定义业内认可度比较高的,是由数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的"Building the Data Warehouse&qu ...

  5. 大数据环境下数据仓库的实践(四)—— 主题域的划分及任务和工作流的组织方式

    主题域的划分 由于数据仓库跨部门,所以必然存在某些数据关系密切,而某些数据相互比较独立.于是相关的一组数据往往被划成一个个主题域.主题域是为了更好地组织数据仓库. 我们以一个普通的买卖为例,这里的主题 ...

  6. 数据仓库、主题域、主题概念与定义

    一.数据仓库 关于数据仓库概念的标准定义业内认可度比较高的,是由数据仓库之父比尔·恩门(Bill Inmon)在1991年出版的"Building the Data Warehouse&qu ...

  7. 数据仓库主题域如何划分

    1.关于主题: 数据仓库中的数据是面向主题组织的,主题是在较高层次上将企业信息系统中的数据进行综合.归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域.如财务分析就是一个分析领域,因此 ...

  8. 数据治理系列:数仓建模之数仓主题与主题域

    背景: 数据仓库之父 Bill Inmon 将数据仓库描述为一个面向主题的.集成的.稳定的.反应历史变化的数据集合,用于支持管理者的决策过程. 从上面的引言里面,我们其实可以知道主题在数仓建设里面绝对 ...

  9. 数据仓库的模型设计 A. 数据建模方法论 数据仓库模型设计遵循“自顶向下、逐步求精”的设计原则。 模型设计分为三个阶段: 1,概念模型 对业务的范围和使用,从高度上进行抽象概括,也就是划分主题域。 一

    感谢分享!http://blog.itpub.net/23659908/viewspace-1118762/ 数据仓库的模型设计 A. 数据建模方法论 数据仓库模型设计遵循"自顶向下.逐步求 ...

最新文章

  1. A damn at han’s Windows phone book 笔记(2:Flashlight)
  2. 设置mysql的字符编码解决中文乱码问题
  3. CodeForces - 1311D Three Integers(暴力)
  4. OpenGL:carmer
  5. 前台一键备份数据库+PHP实现方式
  6. 怎么样让用户认为产品更有价值?让他们DIY吧!
  7. Sr Software Engineer - Big Data Team
  8. ROS学习笔记02:ROS架构与基础
  9. 再谈矩阵分解在推荐系统中的应用
  10. 亲测Trimble X7三维扫描仪
  11. linux ip转发 丢包,sendto频率过快导致发送丢包
  12. 关于Label Bais 最好的解释方式
  13. Java编程题(3)
  14. 冬季送暖!实用围巾打法!(图)
  15. 18届大专实习生2020总结
  16. html中video视频播放
  17. 那些著名网站的90年代(转)
  18. HTB walkthrough -- Admirer
  19. etcd+skydns构建私有域名解析服务器
  20. 你知道GPU对Ansys Fluent仿真有多重要吗?

热门文章

  1. Taro API封装
  2. APS-C画幅三强宾得K3、佳能70D、尼康D7100关键参数对比
  3. 经典JsonPath表达式
  4. 居然在 Bloody Monday 这部日剧里看到 Python 代码了
  5. 崔西凡JavaWeb笔记day13-day15(2016年8月30日22:36:30)
  6. 为什么大家都觉得前端自学比培训好?
  7. Linux之 如何查看文件是`硬链接`还是`软链接`
  8. 易维帮助台助力盟广信息践行高效IT服务管理
  9. vim搜索及高亮取消
  10. LayaAir基础(4) 之 list容器