1.主题的概念

主题(Subject)是在较高层次上将企业信息系统中的数据进行综合、归类和分析利用的一个抽象概念,每一个主题基本对应一个宏观的分析领域。在逻辑意义上,它是对应企业中某一宏观分析领域所涉及的分析对象。例如“销售分析”就是一个分析领域,因此这个数据仓库应用的主题就是“销售分析”。

面向主题的数据组织方式,就是在较高层次上对分析对象数据的一个完整并且一致的描述,能刻画各个分析对象所涉及的企业各项数据,以及数据之间的联系。所谓较高层次是相对面向应用的数据组织方式而言的,是指按照主题进行数据组织的方式具有更高的数据抽象级别。与传统数据库面向应用进行数据组织的特点相对应,数据仓库中的数据是面向主题进行组织的。例如,一个生产企业的数据仓库所组织的主题可能有产品订货分析和货物发运分析等。而按应用来组织则可能为财务子系统、销售子系统、供应子系统、人力资源子系统和生产调度子系统。

主题是根据分析的要求来确定的。这与按照数据处理或应用的要求来组织数据是不同的。如在生产企业中,同样是材料供应,在操作型数据库系统中,人们所关心的是怎样更方便和更快捷地进行材料供应的业务处理;而在进行分析处理时,人们就应该关心材料的不同采购渠道和材料供应是否及时,以及材料质量状况等。

数据仓库面向在数据模型中已经定义好的公司的主要主题领域。典型的主题领域包括顾客、产品、订单和财务或是其他某项事务或活动。

2.主题域的获取

主题域是对某个主题进行分析后确定的主题的边界。分析主题域,确定要装载到数据仓库的主题是信息打包技术的第一步。而在进行数据仓库设计时,一般是一次先建立一个主题或企业全部主题中的一部分,因此在大多数数据仓库的设计过程中都有一个主题域的选择过程。主题域的确定必须由最终用户和数据仓库的设计人员共同完成。

比如,对于Adventure Works Cycle这种类型的公司管理层需要分析的主题一般包括供应商主题、商品主题、客户主题和仓库主题。其中商品主题的内容包括记录超市商品的采购情况、商品的销售情况和商品的存储情况;客户主题包括的内容可能有客户购买商品的情况;仓库主题包括仓库中商品的存储情况和仓库的管理情况等,如图3-31所示。

图3-31  根据业务情况确定的分析主题

确定主题边界实际上需要进一步理解业务关系,因此在确定整个分析主题后,还需要对这些主题进行初步的细化才便于获取每一个主题应该具有的边界。对于图3-31的4个主题及其在企业中的业务关系可以确定边界如图3-32所示。

图3-32  主题域的划分

3.确定主题的内容

主题虽然在信息包图中只占据标题的位置,但是却是信息打包方法中最重要的部分,当主题定义好之后,数据仓库中的逻辑模型也就基本成形了。此时,需要在主题的逻辑关系模式中包含所有的属性及与系统相关的行为。数据仓库中的数据存储结构也需要在逻辑模型的设计阶段完成定义,需要向里面增加所需要的信息和能充分代表主题的属性组。以Adventure Works Cycle这类公司数据仓库为例,如表3-7所示可以分别在“商品”、“销售”和“客户”主题上增加能够进一步说明主题的属性组。

表3-7  主题的详细描述

主  题  名

公 共 码 键

属  性  组

商品

商品号

商品固有信息:商品号,商品名,类型,颜色等

商品采购信息:商品号,供应商号,供应价,供应日期,供应量等

商品库存信息:商品号,库房号,库存量,日期等

销售

销售单号

销售单固有信息:销售单号,销售地址等

销售信息:客户号,商品号,销售价,销售量、销售时间等

客户

客户号

客户固有信息:客户号,客户名,性别,年龄,文化程度,住址,电话等

客户经济息:客户号,年收入,家庭总收入等

4.主题的使用

由于数据仓库的设计是一个螺旋发展的过程,在刚开始,没有必要在数据仓库的数据库中体现所有的主题,选择最重要的主题作为数据仓库设计的试金石是很有必要的。因此使用主题首先是找到需要分析的主题域。

例如在AdventureWorksDW数据仓库的概念模型设计中,在对需求进行分析后,认识到“商品”主题既是一个销售型企业最基本的业务对象,又是进行决策分析的最主要领域,因而把“销售分析”主题域定义为要首先建立的主题。通过“商品”主题的建立,经营者就可以对整个企业的经营状况有较全面的了解。先实施“商品”主题可以尽快地满足企业管理人员建立数据仓库的最初要求,所以先选定“商品”主题进行实施。

通过将主题边界的划分应用到已经得到的关系模型上还能形成原始的概念模型。这一模型是把主题域的划分和事务处理数据库中的表结合起来的模型,例如在上面的例子中,商品主题可能涵盖的关系表有商品表、供应关系表、购买关系表和仓储关系表;仓库主题可能涵盖的关系表有仓库关系表、仓库表、仓库管理关系表和管理员表。把这些表的键和字段联系起来,就可以形成如图3-33所示的原始概念模型图。

图3-33  划分了主题域的原始概念模型

转载于:https://www.cnblogs.com/yulu080808/p/8794218.html

数据仓库--主题和主题域相关推荐

  1. 数据仓库建设——主题和主题域的划分

    数仓主题是什么 数据仓库主题是指透过"上帝视角"将企业不同业务流程信息进行汇总.分类然后对其进行分析利用的一个抽象化的概念.也是指企业中某一分析领域具体的分析对象,这样一来,每一个 ...

  2. 数据治理系列:数仓建模之数仓主题与主题域

    背景: 数据仓库之父 Bill Inmon 将数据仓库描述为一个面向主题的.集成的.稳定的.反应历史变化的数据集合,用于支持管理者的决策过程. 从上面的引言里面,我们其实可以知道主题在数仓建设里面绝对 ...

  3. 数据仓库建设之主题划分

    今天聊一下数仓主题设计,其实不同行业不同领域模型设计的都有些不同,本次主要整理一下工作以来遇到的几种典型案例. 关于主题: 数据仓库中的数据是面向主题组织的,主题是在较高层次上将企业信息系统中的数据进 ...

  4. 数据仓库十大主题;TeraData金融数据模型

    Teradata天睿公司(纽交所代码:TDC),是美国前十大上市软件公司之一.经过逾30 年的发展,Teradata天睿公司已经成为全球最大的专注于大数据分析.数据仓库和整合营销管理解决方案的供应商. ...

  5. R语言ggplot2可视化设置不同的图像主题(theme):使用各种不同的主题(theme)可视化数据、单的黑白主题theme_bw主题(theme)、默认的主题(theme)可视化数据

    R语言ggplot2可视化设置不同的图像主题(theme):使用各种不同的主题(theme)可视化数据.单的黑白主题theme_bw主题(theme).默认的主题(theme)可视化数据 目录

  6. CorePress-v4.5网站主题 WordPress主题

    简介: CorePress是果核剥壳站长开发的一款WordPress主题,适合个人网站,极客网站,CMS等多种站点使用. 主题特色: 超小体积 主题体积小于2m,代码精,功能全,颜值高,兼容好. 无框 ...

  7. 二次元风格Kratos-pjax主题 WordPress主题

    介绍: 本主题为 Kratos 2.5.8 的二开版. 不欢迎版权狗使用此主题. 如果发现 bug 请先确认主题为,并确认此问题非个例,然后前往 github 提交 issue. 如果您使用了此主题, ...

  8. 学习如何使用电脑客户端和ESP8266客户端来连接MQTT服务端以及订阅主题发送主题操作

    MQTT原理与应用 学习如何使用电脑客户端和ESP8266客户端来连接MQTT服务端 本文章学习借鉴于太极创客团队,以表感谢.官网[http://www.taichi-maker.com/] 文章目录 ...

  9. 寻找 漂亮主题 桌面主题

    寻找 漂亮主题 桌面主题 谁知道下面使用的是什么主题.请告诉一下.谢了.

最新文章

  1. SQL函数设计——临时表的使用
  2. [python爬虫] selenium爬取局部动态刷新网站(URL始终固定)
  3. Execute SQL Task 参数和变量的映射
  4. Linux数码管和点阵程序,随笔:python turtle绘制八段数码管和共阳极8x8led点阵
  5. Cesium工作笔记001---地理位置信息js展示框架_Cesium介绍
  6. 使用grafana4的alert功能
  7. Kafka HWLEO概念入门
  8. TCP 实战抓包分析
  9. 联想微型计算机v1.0,联想Energy Management
  10. 【读取GPS星历文件】读取GPS的星历文件,并动态显示卫星移动效果
  11. Ubuntu安装NVDIA显卡驱动,CUDA及cuDNN
  12. Jenkins ERROR: Server rejected the 1 private key(s)
  13. js 京东关闭广告 pink
  14. 故宫买票显示服务器开小差,比春运车票还难抢的故宫灯会 预约系统直接崩溃...
  15. 【整蛊系列大合集】整蛊又有新套路,遇到这种情况你会怎么办?看完笑死爹了。
  16. 论文阅读:RICAP: Random Image Cropping and Patching Data Augmentation for Deep CNNs
  17. 几个有创意有趣的网站推荐
  18. java聊天室代码实训总结_java实训聊天系统报告总结
  19. 收藏,核心期刊的投稿、审稿、出刊流程详解
  20. 当且仅当函数依赖a→b在r上成立_数据库第06章关系数据理习题课.ppt

热门文章

  1. java match正则不生效_[Java教程]正则表达式match()函数
  2. 华为交换机ipv6默认路由配置_静态路由和默认路由的配置
  3. java udp 工具类_java基于UDP实现图片群发功能
  4. 【JQuery】ajax 调用
  5. geth bootnodes
  6. 智能车改舵机中值步骤_飞思卡尔智能车摄像头组新手指南(10)--控制算法进阶篇之舵机3...
  7. layui导入模板数据_实物资产管理软件操作手册(数据接口)
  8. c语言游戏编程网盘下载,C语言游戏编程 计算器(5分下载)
  9. 怎么看python程序卡在哪里_Python程序卡住了
  10. 傅里叶变换处理音频c++_KWS-SoC——基于Wujian100的音频流关键词检测SoC拓展开发笔记之一...