谈谈对数据治理的理解

  • 一、什么是数据治理?为什么要做数据治理?
    • 1、数据标准
    • 2、数据模型
    • 3、元数据
    • 4、主数据
    • 5、数据质量管理
  • 二、怎样做数据治理

一、什么是数据治理?为什么要做数据治理?

数据治理可以理解为对杂乱、无规范数据的治理,目的就是为了让数据有序,就像是秦始皇统一度量衡一样,“车同轨,书同文“就是最早的一项数据治理工作。治理好了有什么用?能够方便系统间的集成,能够对企业数据统一管理,能够支持报表、数据分析、数据挖掘等数据应用。现在的数据治理工作包含了数据标准管理、数据模型管理、元数据管理、主数据管理、数据质量管理、数据安全管理、数据生命周期管理等内容。数据标准是数据治理的一项基础工作内容,数据模型依赖于数据标准用于指导数据开发工作,而数据质量也依赖于数据标准,需要根据数据标准进行各项数据质量的筛查。元数据是数据治理工作的核心和基础,它就像是将军手中的地图,能够快速掌握各个数据表的所在,以及使用情况、流向情况。主数据是一个企业中和核心基础数据,能够支撑系统跨部门、跨系统的数据融合应用。

1、数据标准

什么是数据标准?
数据标准工作是数据治理中重要的基础性工作,可以定义为:是对数据的表达、格式及定义的一致约定,包括数据的业务属性、技术属性和管理属性的统一定义。
DCMM中将数据标准分为了:业务术语标准、参考数据和主数据、数据元标准、指标数据标准。

为什么要做数据标准?
为了使组织外部使用和交换的数据是一致的、准确的。

2、数据模型

什么是数据模型?
数据模型是指对现实世界数据特征的抽象,用于描述一组数据的概念和定义。

为什么要做数据模型?
为了解决架构设计和数据开发不一致,而对数据开发中的表名、字段名等规范进行约束。数据模型在数据标准和数据开发之间起到一个承上启下的作用,即数据模型需要依赖数据标准指导数据开发中的表名、字段名等标准规范的落地。

3、元数据

什么是元数据?
元数据是数据治理工作的核心和基础。 元数据可以理解为表的户口簿,包括了:表名、表别名、表的所有者、主键、索引、表中的字段、表间关系等。

为什么要做元数据?
目的是建立一个数据的全景图,有了数据全景图,就可以知道有哪些种类的数据;有哪些信息系统、数据库、表、字段;数据全量是多少,增量是多少;数据分布情况;数据间流向关系等等。

4、主数据

什么是主数据?
主数据是用来描述企业核心业务实体的数据,是企业核心业务对象、交易业务的执行主体,是在整个价值链上被重复、共享应用于多个业务流程的、跨越各个业务部门和系统的、高价值的基础数据,是各业务应用和各系统之间进行数据交互的基础。
主数据举例:组织单元、客户、员工、金融产品等。

为什么需要建设主数据?
不同的应用系统之间,主数据的定义、属性编码存在众多不一致,影响了系统和数据之间的融合与集成。

5、数据质量管理

数据质量?
准确性:描述数据是否与对应客观实体的特征一致。
完整性:表中是否存在缺失记录,记录中是否存在缺失字段。
一致性:描述同一实体同一属性的值在不同的系统中是否一致。
有效性:描述数据是否满足用户定义的条件或在一定的取值范围内。
唯一性:描述数据是否存在重复记录
及时性:数据的产生和供应是否及时。
稳定性:描述数据的波动是否稳定,是否在有效范围内。
连续性:描述数据的编号是否连续
合理性:描述两个字段之间的逻辑关系是否合理。

为什么要进行数据质量的工作?
为了让报表、分析、应用更加准确。

二、怎样做数据治理

制定数据标准是开展数据治理工作的前提和基础。 做数据质量检查时,参考的规则就来自于数据标准,做数据清洗时参考的清洗规则也来自于数据标准。数据标准要根据企业要求及业务变化进行实时更新。

数据治理工作的开展,需要成熟软件平台的支撑,如数据质量管理系统、元数据管理系统、数据标准管理系统、数据安全管控平台、数据资产中心。

数据治理是一项长期的工作,面对复杂的系统现状,需要整体规划,分步实施,突出重点,逐步推广。可以从业务最关心的数据、最重要的数据入手,逐步推广。

参考文章
[1] 数据中台:让数据用起来

谈谈对数据治理的理解相关推荐

  1. 谈谈实施数据治理时常犯的10大错误

    未能解决数据文化问题 01 1.错误描述 我所见过的最大的错误就是企业没有将文化变革纳为数据治理举措的一部分.到目前为止,这个错误是最大和最常见的错误,它最终可能导致数据治理计划的彻底失败.常见的情况 ...

  2. 谈谈制定数据治理战略路线图的方法

    对于商业世界最具前瞻性思维能力的发展来说,如数据分析.机器学习和人工智能,高质量的数据是一个关键的成功因素.因此,当涉及到数字化转型时,数据发挥着至关重要的作用. 然而,如果没有适当的数据治理,组织最 ...

  3. 谈谈大数据时代企业如何进行数据治理体系建设

    随着云计算.物联网.移动互联网等新一代信息技术的快速发展,人类产生的数据量呈指数级增长.据资料显示,2012年,全球数据量达到2.8ZB,预计到2020年,全球数据量将达到40ZB.大数据蕴含着巨大的 ...

  4. 关于数据治理的读书笔记 - 什么是数据治理?

    <关于数据治理的读书笔记 - 数据治理.数据管理和数据管控的理解>我们了解了有关数据治理.数据管理和数据管控,这几个名词之间的区别和联系,回到数据治理的话题上,数据治理究竟是什么? 站在不 ...

  5. 【数据科学】数据治理与数据认责概述

    一.本文预期读者: • 企业领导 • 各主要业务部门领导 • 技术执行管理人员:在客户数据治理路线规划.设计和实施当中,需要资 深的管理人员支持. • 数据管理相关部门:负责客户数据管理和监管报送相关 ...

  6. 数据治理:认识数据治理

    参考<一本书讲透数据治理>.<数据治理>等 数据治理是什么 笔者自我理解就是:对数据进行任何规整处理,包括从数据从业务系统接入到最后被业务系统查询应用的这其中整个过程,都是数据 ...

  7. 政府大数据治理体系的框架及其实现的有效路径

    政府大数据治理体系的框架及其实现的有效路径 安小米1,2,郭明军1,洪学海3,魏玮1 1 中国人民大学信息资源管理学院,北京 100872 2 数据工程与知识工程教育部重点实验室(中国人民大学),北京 ...

  8. 数据治理【框架介绍】

    目录 1.什么是数据治理? 2.为什么需要数据治理? 3.DMBOK的数据治理框架 4.数据治理框架的理解和解读 4.1 数据治理的对象 4.2 数据治理的时机 4.3 谁来实施.谁来主导 4.4 数 ...

  9. 高校数据治理如何倒逼业务部门参与

    高校数据治理:如何倒逼业务部门参与数据治理 背景 高校数据治理面临一个难题在业务部门(这里说的业务部门是指职能部门,如:人事处.学工部.科技处.财务处等,二级院系,如:数学学院.物理学院等学院),业务 ...

最新文章

  1. VS2015+openGL配置
  2. python在财务上的应用-python 与财务
  3. 一道经典的JavaScript面试题
  4. 【HTML5】Canvas画布
  5. 分布式 基本理论 BASE
  6. 让你的网页更精彩 - Javascript 调用MSAgent (转)
  7. CISP 考试教材《第 1 章 知识域:信息安全保障》知识整理
  8. 一款开源Linux开发板使用心得
  9. 致移动开发的后10年
  10. 手机计算机国二支付,“刷手机”时代悄然来临 手机支付呼唤国家标准(二)...
  11. MATLAB基于形态学的目标检测(一)简单图形统计
  12. 测绘资质分级标准-工程测量、界线与不动产测绘
  13. 智慧园区一体化信息管理平台设计方案
  14. java随机点名器_Java实现简单随机点名器
  15. 拉丁超立方抽样的Python3实现
  16. excel多列合并成一列加符号_Excel中如何将每行空格数据隔开为多列,以及如何合并多列数据为一列...
  17. GNS3 完全使用手册
  18. android外接手机模拟器,HBuilderX 连接网易mumu手机模拟器进行App开发
  19. 操作系统文件系统设计实验报告
  20. oracle instr函数(oracle 用instr 来代替 like)

热门文章

  1. 万众电子期刊在线阅读系统(awd复现)
  2. Gitlab修改服务端及客户端密码方式方法
  3. bigemap批量添加第三方在线地图浏览
  4. 夜曲歌词 拼音_矢野真纪《夜曲》罗马拼音歌词
  5. 送给1985年左右的朋友 怀念小时候的我们
  6. scrapy ,Selenium 企查查模拟登录
  7. 微信小程序扫一扫和微信自带的扫一扫 获取二维码的url包括参数数据
  8. 3w最简单led灯电路图_一款简单实用的LED灯驱动电路
  9. 通用Excel数据导入功能模板
  10. 中国电子学会2022年python六级考试真题大题 类与对象练习题