数据管理、数据治理、数据资源等概念的定义
数据管理 Data Management
是规划、控制和提供数据及信息资产的一组业务职能,包括开发执行监督有关 数据的计划、政策、方案、项目、流程、方法和程序,从而控制、保护、交付和提高数据和信息资产的价值。——DMBOK 1.0
数据治理 Data Governance
作为数据管理的其中一个核心职能,是对数据资产管理行驶权力和控制的活动集合(规划、执行和监控),指导和其它数据管理职能如何执行,在高层次上执行数据管理制度。——DMBOK 1.0
数据资源 Data Resource
广义上是指对一个企业而言所有可能产生价值的数据,包括自动化数据和非自动化数据。 ——Wikipedia
数据资产 Data Asset
是指由企业拥有或企业控制的,能够为企业带来未来经济利益的,以物理或电子的方式记录的数据资源,如文件资料,电子数据等。在企业中,并非所有的数据都构成数据资产,数据资产是能够为企业产生价值的数据资源。——DMBOK 1.0
参考数据
参考数据是用于将其他数据进行分类或目录整编的数据,通常来说参考数据值是几个允许值之一(允许值的数据集是一个值域)。在所有的组织中,参考数据几乎都虚拟存在于整个组织的每一个数据库中。——DMBOK 1.0
数据字典 Data Dictionary
是一种用户可以访问的记录数据库和应用程序源数据的目录,用规范化的,无二义性的语言表达数据流程图的各组成部分,是对数据流程图各个组成部分的详细数据说明,也是表达新系统逻辑模型的主要工具之一。包括主动数据字典(active data dictionary)和被动数据字典(passive data dictionary),前者是指指在对数据库或应用程序结构进行时,其内容可以由DBMS自动更新的数据字典,后者是指修改时必须手工更新其内容的数据字典。 ——DMBOK 1.0
数据目录 Data Catalog
作为一种主动数据字典,用以帮助用户找到满足自身需求的数据来源并且帮助他们理解利用数据源进行挖掘的过程,同时也帮助企业在现有的数据源下实现更多的收益。多数关系型DBMS铲平将数据目录设置为关系型表格的形式。——Wikipedia
数据血缘 Data Lineage
通常是数据生命周期的一种,包括数据的起源以及到当前位置的完整路径描述,帮助用户分析信息的使用过程并且追溯在每一个节点上有特定用途的信息。——DMBOK 1.0
血缘分析 Linage Analysis
也即血统分析,是通过对数据处理过程的全面追踪,从而找到以某个数据对象为起点的所有相关数据对象以及这些元数据对象之间的关系。它是对数据对象内在关系的一种映射,同时,还结合了时间顺序、递次关系,也能够反映出一定的相关性和因果关系。——Wikipedia
影响分析 Influence Analysis
不同于血缘分析(血统分析)通过回溯的方式找到所有元数据对象以及这些元数据对象之间的关系,影响分析是基于某个数据对象,寻找依赖于该对象的处理过程或其它数据对象,并在某些数据对象发生变化或者需要修改时,评估其影响范围。 ——Wikipedia
非结构化数据 Unstructured Data
用来描述具有高度可变数据类型和格式的任何数据(尚未标记或记录于行和列的数据),如文件、图形、图像、文字、报表、表格、视频、或录音,具有数据格式多样、数据冗余度高、数据规模大等特点。——DMBOK 1.0
数据仓库 Data Warehouse
是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合用于支持管理决策。其主要功能是将组织透过资讯系统之联机事务处理(OLTP)经年累月累积的大量资料,透过数据仓库理论所特有的资料存储架构,作一有系统的分析整理,以利各种分析方法如练级分析处理(OLAP)、数据挖掘(Data Mining)之进行,并进而支持如决策支持系统(DSS)、主管资讯系统(EIS)之创建,帮助决策者能快速有效地自大量资料中,分析出有价值的资讯,以利决策拟定及快速回应外在环境变动,帮助构建商业智能(BI)。——《Building the data warehouse》W.H.Inmon
数据集市 Data Mart
是企业级数据仓库的一个子集,他主要面向部门级业务,并且只面向某个特定的主题,按照多维的方式进行存储,包括定义维度、需要计算的指标、维度的层次等,生成面向决策分析需求的数据立方体。——Wikipedia
数据地图 Data Mapping
数据地图作为数据融合的第一步,指在数据仓库中使用一系列严格定义的数据连接不同的数据模型。数据定义可以为任意的原子单位,比如一个单位的元数据,而数据的连接遵从一系列依赖于该模型阈值的标准。——Wikipedia
数据湖
数据湖是以其自然格式存储的数据的系统或存储库,通常是对象blob或文件。数据湖通常是企业所有数据的单一存储,包括源系统数据的原始副本,以及用于报告、可视化、分析和机器学习等任务的转换数据。数据湖可以包括来自关系数据库(行和列)的结构化数据,半结构化数据(CSV,日志,XML,JSON),非结构化数据(电子邮件,文档,PDF)和二进制数据(图像,音频,视频)。——Wikipedia
数据管理、数据治理、数据资源等概念的定义相关推荐
- 数据治理-理论-1-基本概念
数据治理-理论-基本概念 为什么需要数据治理 数据治理概念 数据治理的目标 数据治理体系框架 数据治理管理措施 数据治理技术措施 转载 https://www.sohu.com/a/152614302 ...
- 数据资产运营 = 数据资产盘点 + 数据治理 + 数据价值实现
略去大数据分析背景与价值部分,言简意赅的介绍如何进行数据资产管理运营. 数据资产管理运营 = 数据资产盘点 + 数据治理 + 数据价值实现 管理和运营是一个全流程的事情,首先我们需要知道有哪些数据(盘 ...
- 数据治理-数据质量-数据质量的概念和维度
大数据质量的基本概念 数据是表示事物各种属性的基本元素,通常情况下,只要符合数据应用的需要,就可以将它视为合格数据,即数据质量合格.结合质量的定义分析可知,数据质量就是"一组固有特征满足表示 ...
- 数据治理|数据资产中心
01 前言 我们来聊聊数据治理最最核心的部分--数据资产治理,本文主要阐述数据资产治理的策略和工具建设思路. 02 基本概念 广义的数据资产涵盖一切非结构化.半结构化和结构化数据,狭义的数据资产主要包 ...
- 数据治理-数据质量-数据质量实施方法
质量实施方法 数据质量领域研究学者和专家结合自身实践,先后提出了一系列质量管理得项目实施方法,其中以全面信息质量管理.全面数据质量管理.数据管理十步法.六西格玛等. 与传统数据质量管理 ...
- 数据治理-数据生命周期管理-大数据采集
大数据采集 为满足企业或组织不同层次的管理与应用的需求,数据采集分为三个层次. 第一层次,业务电子化.为满足业务电子化的需求,实现业务流程的信息化记录,在本阶段中,主要实现对于手工单证的电子化存储,并 ...
- 数据治理——数据质量管理
目录 数据质量保障原则 完整性 准确性 一致性 及时性 常见的数据监控原则 单表数据量监控 单表空值检测 单表重复值检测 单表值域检测 跨表数据量对比 在当今这个大数据时代,数据质量对于数据的价值有着 ...
- 数据治理-数据质量-数据质量管理方法和工具
常用质量管理工具 目前,在质量管理领域,有一系列常用的数据质量管理工具,主要分为传统的质量管理工具.新的质量管理工具和其他质量管理工具. 传统的质量管理七大工具 传统的七种工具包含分层法.检查表.帕累 ...
- 大数据治理.数据储存技术
1. HIVE & HBase hive是基于Hadoop的一个数据仓库工具,用来进行数据提取.转化.加载,这是一种可以存储.查询和分析存储在Hadoop中的大规模数据的机制.hive数据仓库 ...
最新文章
- pandas使用nunique函数计算dataframe每个数据列的独特值的个数(count number of unique values in each column of dataframe)
- Java 消息机制之回调详解
- 【Android开发】毛玻璃效果
- java怎么把数据封进对象里_(Java)想把数组中一条一条的数据全部放入对象中去..要怎么做呢...
- 02.CSS基础笔记及导入
- 腾讯PHP工程师面试题两份
- silverlight下多线程处理
- python绘制动态心电图_可穿戴设备中测心电图这样功能能达到医用标准吗?未来前景如何?在医用和便携之间是否还有市场?...
- java excel 复杂表头_【分享】使用一个Excel模板就能搞定Excel复杂表头样式
- 计算机在课程中的应用,计算机科学技术在计算机教育中的应用
- 汽车电子行业入门指南「主要国内新能源车销量」
- 二叉树的几个基本性质
- ajax请求或者计算造成浏览器崩溃解决办法
- csr_matrix详细解读
- php程序员 合川_PHP程序员将何去何从?
- Windows PowerShell 中启动 Nginx 报错解决方案
- logback 中文手册
- MacOS开源视频播放器
- Java(网络编程)
- 雨流计数法的matlab实现