随着科学技术及企业业务发展,数据的价值越发被重视,数据治理作为提炼数据价值的重要方法,发挥着不可替代的作用。主数据管理作为数据治理的重要工作,是数据治理成果的基础之一。

图1-1数据治理架构(DAMA)
所谓主数据,是指用来描述企业核心业务实体的数据,是企业核心业务对象、交易业务的执行主体。主数据在整个价值链上被重复、共享应用于多个业务流程的、跨越各个业务部门和系统的、高价值的基础数据,是各业务应用和各系统之间进行数据交互的基础。
由于主数据的高价值、高共享性、相对稳定的特定,因此在建模时既要保证数据通用性、安全性,又要符合企业的业务需求。主数据建模管理包括数据组织建模和操作建模,其中数据组织建模包含分类管理及结构管理,数据操作建模包括数据提取和数据应用两部分。
数据组织建模
一般的主数据分类以业务为核心,包括员工、客户、供应商、产品、物资、会计科目、银行账户等,而更高层次的分类则以实体(所谓实体,是指真实存在的,可以唯一确定的,但不一定存在实物)为基准,可分为人、事、物、组织、信息五大类,每个大类下又包含不同小类,如人包含员工、客户等,物包含资产、物料、账号等。

不同类别的主数据表结构描述了各自主数据的特点,在设计主数据表结构时,除了数据库设计的基本原则之外,还需从主数据的特点进行分类设计,主数据表字段可以总结归纳为四大类,分别为基础属性、业务属性、公共属性、标签属性。
基础属性:基础属性字段描述了主数据的基本信息,同一类型的主数据的基础属性具有相同的维度,依照不同主题,基础属性可以进一步进行划分,例如人员的基础属性可以分为基本信息(姓名、身份证号等)、生物信息(年龄、性别、血型等)、教育信息(学历、毕业院校等)、职业信息(职位、工作单位等)等维度,不同企业可根据实际业务需求对基础属性进行筛选应用。
业务属性:业务属性与业务具有强相关,不同行业、不同客户的业务属性字段各不相同,以人员为例,公安关注人员的违法犯罪情况,学校关注学生的学习成绩情况,企业关注员工的证书业绩情况,不同企业可根据自身业务需求进行业务属性字段的添加及应用。
公共属性:公共属性不以主题类型变化而变化,公共属性字段以数据操作建模为基础,业务需求为补充进行设计,常见的公共属性字段包括记录编码、入库时间、操作时间、置信度等。
标签属性:标签属性是对主数据的进一步提炼,是利用标签规则对主体的概括性描述,如根据人员的年龄进行年龄段描述、根据上网行为进行上网习惯描述,通过对标签属性与基础属性、业务属性的不同组合(标签画像的构建),可以对主体进行群体划分,从而采取不同的业务策略。
数据操作建模
数据操作建模是根据设计好的主数据表结构进行数据的提取并最终对外提供服务,包括增删改查多种操作,涉及数据治理中的数据标准、数据处理、数据服务等多个模块工作,本文主要说明主数据的提取及应用。
主数据提取需要一方面要考虑尽可能多的提取到主数据相关字段,另一方面要考虑去提取到的数据去伪存真,可以采用“原子化”方式对主题数据进行提取,具体操作方式如下:

图1-2主数据提取流程
第一步:数据分析,分析主数据来源表,为后续主数据属性提取做准备。
第二步:根据主数据特点进行主键归一化,如员工可以以工号为全局主键,将源表中员工主键切换为工号,确保后续所有提取均以工号作为唯一依据。
第三步:根据不同源表数据情况,设置定时策略将源表中涉及主数据的字段按照key-value格式进行提取到中间表,其中key由主键类型跟主键值构成(如人员是“工号”+工号值),value由属性名跟属性值构成(如“姓名”+姓名值、“血型”+血型值),中间表除了上述字段要求,还应保留源表名、源表数据生成时间等公共字段。
第四步:对第二步中间表中的数据进行置信度计算(依照各属性结果采集的次数、数据源的可靠性、数据生成时间三个维度),取每个属性置信度最高的结果作为最终结果,得到所有主体的所有属性唯一值。
第五步:对第三步得到的结果进行关联操作,得到最终的主题表并提供服务。
数据按照设计的规范进行了提取后,需要对外进行应用,该部分主要工作依靠数据服务模块进行实现。主数据的应用以数据查询为核心、应用统计为辅助,业务提升为目标进行,对于各业务系统,仅支持对主数据的查询操作,禁止对主数据进行增删改操作,在服务期间,会根据业务查询的情况及业务部门的反馈结果,不断对主数据的设计、提取过程进行优化改进,从而最大程度发挥主数据的相关价值。

数据治理之主数据建模管理相关推荐

  1. 企业数据治理之主数据管理

    本篇文章为亿信华辰<决战数字化转型>系列直播中<企业数据治理之主数据管理>视频直播稿件.如需获取相关资料,可登录亿信华辰官网社区进行直播回看或下载PPT. 主数据大家肯定都不陌 ...

  2. 大数据平台数据治理体系建设和管理方案

    1. 范围 1 2. 规范性引用文件 1 3. 术语.定义和缩略语 5 4. 总体说明 8 4.1. 概述 8 4.2. 目标 9 4.3. 原则 9 5. 数据治理体系 10 5.1. 总体框架 1 ...

  3. 数据治理【主数据管理】

    目录 1.摸家底 1.1 数据资源普查 1.2 主数据识别 1.3 数据管理能力评估 2.建体系 2.1 组织体系 2.2 标准体系 2.3 制度与流程体系 2.4 技术体系 2.5 安全体系 3.接 ...

  4. 数据治理系列:数据标准管理

    目录 数据标准: 数据标准建设方法和流程 01 什么是数据标准? 02 为什么需要数据标准? 1.数据共享难以实现 2.数据同名不同义导致错误 3.沟通成本增加 4.数据来源不明 03 数据标准分类 ...

  5. 通俗理解数据治理之主数据

    1)如需数据治理-元数据材料可前往(狗头.gif) https://download.csdn.net/download/u010763324/87589200https://download.csd ...

  6. 【数据治理】数据治理之主数据管理

    1.什么是主数据? 主数据(Master Data,MD):指满足跨部门业务协同需要的.反映核心业务实体状态属性的基础信息. 主数据的5跨特征 (1)跨部门.各个职能部门都需要的公共数据,可以简称为& ...

  7. 数据治理之主数据管理MDM

    目录 一.概念 主数据(Master Data): 主数据管理(MDM ,Master Data Management): 二.特点 三.主数据管理的关键活动: 1.主数据管理计划: 2.主数据管理执 ...

  8. 数据治理管理平台功能模块与特性

    数据治理中的元数据就是数据的数据,讲究从数据的全生命周期:产生/采集.存储.加工和展现等环节进行描述与分析.元数据体现数据的各类关系和属性,可从技术.业务.管理3个维度对元数据进行划分,从而帮助用户对 ...

  9. 元数据管理——企业数据治理的基石

    ​数字化时代,不少企业开始数字化转型,开始收集整理数据,但在使用途中,通常会发生数据泄露,安全没办法得到保障:数字管理混乱,查找困难,无效失效数据偏多:数据流程复杂,流程不畅,无法有效赋能业务. 这些 ...

最新文章

  1. linux支持sshd救援模式,单用户、救援模式、克隆、两机互联
  2. UILabel设定行间距方法
  3. 选址问题java_学习使用分治算法来解决邮局选址问题(Java实现)
  4. android安全 报告,Android安全检测报告
  5. Android官方开发文档Training系列课程中文版:键盘输入处理之指定输入的类型
  6. mysql一对多增删改查_SpringBoot+MySql+ElementUI实现一对多的数据库的设计以及增删改查的实现...
  7. 对一个“世纪数学难题”的重新思考
  8. 地方商城门户网页模板-商城模板
  9. oracle 图像包,完美简单详细,图形安装Oracle11g(Oracle Linux系统)
  10. Spring学习笔记之AOP配置篇(一) 注解配置
  11. 权限细粒度管理(转)
  12. 学python能做什么-学了Python都能干什么,哪个最赚钱?
  13. oracle日期处理完全版
  14. txt转excel 处理数据
  15. 关于mvn repository的one more step人机验证问题的解决
  16. python跳过本次循环_python跳过循环
  17. 博途TIA Portal V15 下载与安装教程
  18. Golang Append()详解
  19. 咕泡P6:ElasticStack高级开发与架构(实战班)二期
  20. vue 使用gtm代码代替ga代码作谷歌分析

热门文章

  1. 新数据经济的民主化:科技巨头如何窃取我们的数据以及我们如何夺回控制权
  2. 淘淘商城---8.7
  3. [整理]Mac安装Meld,并使用Meld作为git diff tool的工具
  4. 分时线的9代表什么_股票早上快速拉高然后慢慢下跌,意味着什么?看完才知道套路...
  5. 连接线是计算机硬件吗,音箱线怎么连接电脑?有源音箱和无源音箱连接电脑教程...
  6. centos7 串口配置修改_Linux串口参数设置
  7. 最新上海个人养老保险缴费信息查询步骤
  8. 软件测试工程师面试如何描述自动化测试是怎么实现的?
  9. 达人评测 i5 13500h和1240p选哪个好 i5 13500h和1240p对比
  10. 医依通小程序项目总结