元数据(Meta Data),主要记录数据仓库中模型的定义、各层级间的映射关系、监控数据仓库的数据状态及 ETL 的任务运行状态。一般会通过元数据资料库(Metadata Repository)来统一地存储和管理元数据,其主要目的是使数据仓库的设计、部署、操作和管理能达成协同和一致。元数据是数据仓库管理系统的重要组成部分,元数据管理是企业级数据仓库中的关键组件,贯穿了数据仓库的整个生命周期,使用元数据驱动数据仓库的开发,使数据仓库自动化,可视化。

  构建数据仓库的主要步骤之一是 ETL。这时元数据将发挥重要的作用,它定义了源数据系统到数据仓库的映射、数据转换的规则、数据仓库的逻辑结构、数据更新的规则、数据导入历史记录以及装载周期等相关内容。数据抽取和转换的专家以及数据仓库管理员正是通过元数据高效地构建数据仓库。

用户在使用数据仓库时,通过元数据访问数据,明确数据项的含义以及定制报表。数据仓库的规模及其复杂性离不开正确的元数据管理,包括增加或移除外部数据源,改变数据清洗方法,控制出错的查询以及安排备份等。

一、元数据类型

  元数据可分为技术元数据、业务元数据和管理过程元数据。

  1、 技术元数据为开发和管理数据仓库的 IT 人员使用,它描述了与数据仓库开发、管理和维护相关的数据,包括数据源信息、数据转换描述、数据仓库模型、数据清洗与更新规则、数据映射和访问权限等。

  2、 业务元数据为管理层和业务分析人员服务,从业务角度描述数据,包括商务术语、数据仓库中有什么数据、数据的位置和数据的可用性等,帮助业务人员更好地理解数据仓库中哪些数据是可用的以及如何使用。

  3、 管理过程元数据指描述管理领域相关的概念、关系和规则的数据,主要包括管理流程、人员组织、角色职责等信息。

二、元数据功能

  1、血缘分析:向上追溯元数据对象的数据来源。血缘分析可以帮助您轻松回答:'我正在查看的报告数据来源是什么?'以及'对当前分析的数据应用了哪些转换处理?'等问题。这样的机制及对这些问题的回答确保了对所分析的数据更高的信任水平,并有助于实现许多行业(包括医疗、金融、银行和制造业等)对所呈现数据的特殊监管及合规性要求。

  2、影响分析:向下追溯元数据对象对下游的影响。影响分析可以让您轻松应对变更可能产生的影响,自动识别与其相关的依赖项和潜在的影响还可以跟踪所有对象及其依赖关系,最后我们还提供数据全生命周期的可视化显示。例如,如果您的某一信息系统中准备将“销售额”从包含税费更改为不包括税费,则SE-DWA将自动显示所有使用了“销售金额”字段,以便您可以确定有哪些工作需要完成,并且建议您在更改前完成该工作。

  3、同步检查:检查源表到目标表的数据结构是否发生变更。

  4、指标一致性分析:定期分析指标定义是否和实际情况一致。

  5、实体关联查询:事实表与维度表的代理键自动关联

三、元数据应用

  1、ETL自动化管理:使用元数据信息自动生成物理模型,ETL程序脚本,任务依赖关系和调度程序。

  2、数据质量管理:使用数据质量规则元数据进行数据质量测量。数据质量根据设定的规则帮助您过滤出有问题的数据,并智能分析数据质量缺陷。

  3、数据安全管理:使用元数据信息进行报表权限控制。可以方便查看用户和访问权限,并启用对象级和行级安全管理。对象级安全性确保通过身份验证的用户只能访问他们被授权查看的数据、表或列,其它数据则不可见。基于行的安全性会更进一步,可以限制特定的组成员只可以访问表中特定的数据。

  4、数据标准管理:使用元数据信息生成标准的维度模型。

  5、数据接口管理:使用元数据信息进行接口统一管理。多种数据源接入,并提供多种插件对接最流行的源系统。应该可以简单方便获取数据。

  6、项目文档管理:使用元数据可以自动、方便的生成的健壮全面的项目文档,其以帮助您应对各种对于数据合规性要求。读取元数据模型,并生成pdf格式的描述文件。生成文档您查看每个对象的名称、设置、描述和代码。

  7、数据语义管理:业务用户在自助服务分析中面临的挑战他们不了解数据仓库从而无法正确解释数据,使用元数据可以语义层建模,使用易于业务用户理解的描述来转换数据。

四、总结

  由上可见,元数据不仅定义了数据仓库中数据的模式、来源、抽取和转换规则等,而且是整个数据仓库系统运行的基础,元数据把数据仓库系统中各个松散的组件联系起来,组成了一个整体数据仓库解决方案。

数据仓库-6.元数据管理相关推荐

  1. qstring 属于元数据类型吗_数据仓库的“元数据管理”

    作者 | 李谦恒 数据工程师.逻辑重于代码,高效胜过勤奋.崇尚life work balance. 引言 元数据管理是企业数据治理的基础,是数据仓库的提升:作为一名数据人,首要任务就是理解元数据管理. ...

  2. 数据仓库与元数据管理

    数据仓库与元数据管理 1. 前言 在事务处理系统中的数据,主要用于记录和查询业务情况.随着数据仓库(DW)技术的不断成熟,企业的数据逐渐变成了决策的主要依据.数据仓库中的数据是从许多业务处理系统中抽取 ...

  3. 数据仓库(五)元数据管理

    概述 元数据通常定义为"关于数据的数据",在数据仓库中是定义和描述DW/BI系统的结构,操作和内容的所有信息.元数据贯穿了数据仓库的整个生命周期,使用元数据驱动数据仓库的开发,使数 ...

  4. 面试,数据仓库的元数据包含哪些?

    小B是一名数据分析师,他问小A XXX的所有指标项给我一下,小A"鄙视的"给了我一份文档-- by小AA 元数据知多少 小B作为一名数据分析师,为什么自己没能去找到数据呢? 这就要 ...

  5. mysql 数据仓库 元数据_数据仓库中的元数据管理

    1. 引言 元数据是数据仓库中的一个重要组成部分,元数据管理系统则是构建,管理,维护和使用数据仓库系统的核心部件. 2. 基础知识 2.1 元数据的定义 元数据是指来自企业内外的所有物理数据和知识,包 ...

  6. 数据仓库-元数据管理

    一.什么是元数据 元数据(Metadata),又称中介数据.中继数据,为描述数据的数据(data about data),一组用于描述数据的数据组,该数据组的一切信息都描述了该数据的某方面特征,则该数 ...

  7. 数据仓库-数据仓库元数据管理

    目录 数据仓库元数据管理 数据仓库元数据管理 元数据(Meta Data),主要记录数据仓库中模型的定义.各层级间的映射关系.监控数据仓库的数据状态及ETL的任务运行状态.一般会通过元数据资料库(Me ...

  8. 学习笔记2 - 利用元数据管理数据质量

    大数据Clouder:利用元数据管理数据质量 元数据 ①定义:元数据(Metadata),又称中介数据.中继数据,为描述数据的数据(data about data),主要是描述数据属性(propert ...

  9. 【收藏】关于元数据(Metadata)和元数据管理,这是我的见过最全的解读!

    本文主要从元数据的定义.作用.元数据管理现状.管理标准和元数据管理功能等方面讲述了我对元数据(Metadata)和元数据管理的认知及理解. 元数据管理 一.元数据的定义 按照传统的定义,元数据(Met ...

最新文章

  1. mysql 织梦 索引_Mysql索引详解 建立索引的优势劣势以及索引规范
  2. PowerShell脚本遇到的问题汇总
  3. opencv 图像分割 阈值分割 图像二值化 灰度图
  4. BZOJ4401:块的计数(乱搞)
  5. MySQL数据库备份工具mysqldump的使用(转)
  6. css设置字体颜色、文本对齐方式、首行缩进、文本装饰、列表样式、鼠标样式、禁止文本域拖拽、轮廓线、块级元素对齐方式、文字溢出设置
  7. 排行榜上用C++写局域网聊天程序
  8. 【python科学计算发行版】
  9. html动图放大太模糊怎么调,如何解决图片放大画质失真问题
  10. 最长回文子串_【每日编程142期】最长回文子串II
  11. 千万级分页存储过程结合Repeater+Aspnetpager7.2实现
  12. ELK 使用小技巧(第 5 期)
  13. ubuntu16.04安装caffe教程(仅cpu)
  14. 单层感知机模型及其学习算法
  15. FPGA学习笔记(1)简单的时序逻辑电路——流水灯
  16. 计算机网络属性设置知识,系统属性设置快捷键
  17. 记毕业季——回忆四年大学,青春无悔【正能量】
  18. UVA10859 放置街灯 Placing Lampposts(树状DP)
  19. 基于MSP430F5529单片机的ADS1115
  20. Java调用TSC打印机进行打印

热门文章

  1. pip包离线下载安装(亲测可用)
  2. node.js使用Sequelize实现多表连接查询
  3. veket linux应用软件,Veket下载_Veket Linux(开源Linux操作系统)V5.192D完整版
  4. 安装SQL Server和SQL Server Management Studio(SSMS)
  5. 食饵-捕食者模型matlab,食饵-捕食者模型解读.ppt
  6. shell awk命令详解
  7. 11个相似图片搜索网站(以图找图)[转]
  8. 数据结构——折半查找法
  9. Spring Cloud Gateway 集成Sa-Token
  10. MySQL Java JDBC