主数据——共享数据的核心,数据资产的灵魂
原创: 金融科技之道 金融科技之道 12月1日

一面湖水 扎西平措 - 中国新歌声第二季 第2期

在本系列的第23篇(风控体系建设、数字化转型、金融科技应用前,您是如何看待数据问题的?)中,作者介绍了行业数据(包括主数据)问题、原因、现状,并呼吁行业应对数据问题高度重视并持续采取行动。本周末,趁着雾霾天,作者与您聊聊众多数据问题中需要关注的重点内容之一——主数据管理。作者2007年曾有幸参加一家大型集团数据治理与主数据管理的国际化项目,积累了一定的实践经验,加上,主数据的重要性在大数据时代更加突出,基于项目实践和行业洞察,分享以下内容,供您参考。

一、数据治理VS数据管理

在开讲之前,先解答一个常见疑问,即数据治理与数据管理的关系。虽然当前数据治理的词频热度高于数据管理,但数据治理只是数据管理的一部分,不管是软件能力成熟度模型集成协会(CMMI)发布的数据管理成熟度模型(DMM),还是数据管理协会(DAMA)发布的数据管理知识体系(DMBOK),都有相关说明,比如DMM明确了数据管理工作体系框架,包括数据战略、数据质量、数据运营、平台和架构、数据治理等5大核心域(如下图所示)。

虽如此,但数据治理是数据管理不可或缺的重要组成部分。数据治理强调如何让数据资产长期、可持续的发挥价值,因此需要明确职责、流程、权限角色、规范、标准等;而数据管理范围更广,强调通过人员、流程、技术等方面的协同实现公司层面的数据共享并充分发挥数据价值,数据管理贯穿数据生成、存储、使用、共享、归档、销毁的全生命周期。不同类型的数据比如元数据、主数据等都需要数据治理。

二、数据分类与主数据概念

在理解主数据、解决数据问题之前,首先,我们要明确到底有哪些数据或哪几类数据?当然,数据按照不同维度、不同语境可以分为不同的类,比如结构化和非结构化化、交易和非交易数据、行业数据和公司数据等。从数据治理或信息化项目的角度,数据一般分为:数据元、元数据、主数据、参考数据、常规数据等。

数据(data):根据《信息技术数据元的规范和标准化》(GB/T18391.1-2002),数据是指对事实、概念或指令的一种形式化标示,适用于以人工或自动方式进行通信、解释和处理。

数据元(data element)指用一组属性描述定义、标示、表示和允许值的数据单元。在特定的语境中,可以认为是不可再分的最小数据单元,也可以直观理解为数据库表的列,对象、特征、表达是数据元的三要素,比如“今天股市收盘是2500点”数据元,其中“今天股市”就是对象,“收盘”是特性,“2500”是表达。

元数据(MetaData)指描述数据的数据,也指帮助查找、存取、使用和管理信息资源的信息。为便于理解元数据和数据元,作者举个例子,比如我们要向中证金融报送两融数据,数据报送接口规范中有许多表,每个表有许多列,每个列有填报要求比如类型、是否为空。每个填报字段可以认为是数据元,而每个填报字段的填报要求可以认为是该字段的元数据,而每个字段可以认为是该表的元数据。也即数据元和元数据本身也是数据,在不同的上下文有不同的定义和理解,本身都是个相对的概念,意识到这点才能很好理解两者的关系。现实中,元数据常见用于描述数据库中所有数据的语境,而数据元通常用在行业标准制定。

参考数据(reference data)指数据可能的取值范围及其解释,也即我们常说的数据字典。数据字典虽然很好理解,但行业现实中,由于每个系统有不同的数据字典,甚至同一系统内也有不同数据字典,而且没有统一标准,间接造就了大量的数据孤岛,也需要加强治理。

常规数据(作者自己定义),是与每日业务开展或每个业务人员最为关注的那些数据,比如交易、审计、采购订单、销售订单、报表等等数据,

主数据(master data),通常是不随或很少随时间变化的静态数据,并且与个体活动或流程无关,比如客户、证券标的、金融产品、会计科目等信息,这些信息构成了公司的业务。主数据掌控交易数据如何被处理并决定着决策的精准度。主数据管理,本质上是各业务人员利用IT工具进行协作,来协调、清理、发布和保护企业需要共享的数据资产,保证企业核心信息的一致、准确和安全。主数据也是大数据建设中的重点内容。

为便于大家只管理解四类数据区别,作者画了一个见图如下,

元数据和参考数据一般与系统或数据库底层设计有关,相对变化频率非常低;而主数据与技术有关,当与业务关系更为密切,相对变化频率较低,也是常规数据的基础;而常规数据则变化频繁,只要展业基本都会累加,且实时性要求较高。基于以上分类和分析,作者认为,由于主数据与业务联系紧密且是一般数据基础,加上又有一定变化(频率很低),数据治理的重点领域是上述四类数据中的主数据,这应该也是SAP、ORACLE等国际巨头反复打磨并推出主数据管理解决方案的原因。

三、为什么说主数据管理是突破口或抓手

  1. 跨部门协同

数据资产的维护需要站在公司的高度,协同各个部门共同完成,主数据是在各个业务部门被重复使用的数据,其管理兼具技术和业务的双重因素,方法论上也需要公司层面整体把控,多部门协同参与。

  1. 见效快

主数据管理项目初期不涉及交易系统改造。主数据问题解决好了,公司的数据资产框架就理顺了,数据质量、数据及时性等将明显提升,便于继续开展其他数据治理、信息化、数字化工作。

  1. 时机好

一是当前金融科技应用、监管科技要求等,都需要数据为基础,也对经营机构的数据质量提出了较高的要求;二是随着移动互联网普及、金融科技应用,行业数据增长处在一个拐点期,此时开展主数据管理是很好的时机;三是不少经营机构现存众多子公司,也已开始在境外或其他国家开展业务,经营机构集团化趋势明显,而集团层面统一主数据管理则至关重要。

  1. 数字化转型的需要

数字化转型需要以客户需求为出发点,各部门通力协作,而当前行业技术业务分割明显,主数据管理过程也锤炼了跨部门的协同,通过加速科技和业务的融合,建立公司范围内通用的主数据规范,以保证数据的一致性和管理报表的合并,这是公司进行其他业务变革成功的基础之一。

四、主数据管理的建议

1.组织架构

如果说数据治理不是技术部门或某一个部门的职责,那么主数据管理更是如此。通过在公司层面成立数据治理小组或机构,比如内嵌在IT治理委员会之中,明确不同部门的主数据管理工作职责,形成主数据管理敏捷团队;建立统一的主数据管理使用规范,合法利用外部数据。

2.建章立制

建立覆盖主数据全生命周期的制度和流程,比如《主数据管理流程》《主数据管理办法》《数据治理制度》等;明确主数据管理相关的清晰角色和职责,建立KPI考核机制。

3.立即行动

主数据管理和经营机构大小无关,且机构越大,主数据管理补起课来,越费力。当然,也不能指望监管机构先出台行业标准或指南,而公司、集团、各个部门在一开始就意识到主数据管理的重要性。需要强调的是,主数据治理与业务关系密切,需要所有业务部门人员参与。

4.系统管理

即便是同一行业,不同公司对主数据的定义也不可能完全一样,主数据的实际范围需要结合公司实际应用和需要来商定。如果主数据管理工作较重或主数据管理已经很精细化,则有必要借助平台或系统来完成主数据的申请、确认、审批、发布等流程。

《金融科技之道》第27篇

2018年12月1日于北京

题外话本文草稿写于11月初。上两篇为做好对大摩、小摩的金融科技战略分析,作者查阅大量一手文献,深度体会反思,几乎用尽了所有碎片化时间,加之本周工作异常忙碌,实在疲惫,精力有限,所以没有对主数据管理展开论述,意犹未尽,敬请谅解,以后择机分享。

对您的支持,深表感谢!

主数据——共享数据的核心,数据资产的灵魂相关推荐

  1. 【数据中台】数据中台架构搭建百科全书

    0.前言 当前,大部分企业不再建设从源数据采集到分析应用的烟囱式系统,更倾向于数据集中采集.存储,并应用分层建设.这种方式一方面有利于应用系统的快速部署,另一方面也保证了数据的集中管理与运营,体现数据 ...

  2. 大数据之父舍恩伯格:大数据的核心要义在于共享

    8月25日,2016IEBE(上海)国际电子商务博览会暨互联网+科创应用展"智享生态联接未来"高峰论坛在上海举行.大数据之父舍恩伯格出席了本次论坛,他与参会者探讨了大数据时代电子商 ...

  3. 「名词」数据管理、数据治理、数据中心、数据中台、数据湖、数据资产等

    以下内容仅供参考: 随着信息技术的不断涌现和普及,业务发展加快了数据膨胀的速度,行业内衍生了较多的新名词,如数据治理.数据管理.数据资源管理.数据资产管理等名词的定义很多,概念容易混淆,本文对这些名词 ...

  4. 数据元、元数据、主数据、交易数据、主题数据、数据资源、大数据、数据湖等数据相关概念理解和总结

    1.数据元 1.1 标准定义 [GB/T 18391.1-2002,定义3.14] ,用一组属性描述定义.标识.表示和允许值的数据单元,数据元由三部分组成:对象.特性.表示. 1.2 我的理解 数据元 ...

  5. 企业数据质量管理核心要素和技术原则

    主要大纲: 1. 数据质量管理的三个要素 2. 数据质量管理的技术关键点 3. 数据质量管理实战 "十三五",规划提出了国家的大数据战略,指出了企业实现以数字化驱动业务发展,实现数 ...

  6. 数据中台离数据资产“价值变现”还有多远?

    大数据.数据治理.数据湖.数据中台--连绵不绝的数据技术和热词(Buzzword)让企业信息化部门疲于跟踪.构建和维护新的数据管理系统.都说"数据是石油",是企业核心资产之一,那么 ...

  7. 【2017年第3期】面向共享的政府大数据质量标准化问题研究

    洪学海1,王志强2,杨青海2 1.中国科学院计算技术研究所,北京 100190 2. 中国标准化研究院,北京 100191 摘要:回顾了国内外数据质量研究与实践的进展,重点对ISO 8000数据质量国 ...

  8. 什么数据可以成为“数据资产”?数据资产化又该如何实现?

    数据资产化已成为企业数据资产管理的最重要的环节,怎样识别数据资产.利用现有的数据资产创造价值,将是企业不得不面临的一个课题. 何为资产? 我们来看一下资产的概念: "资产是指由企业过去的交易 ...

  9. 数据有价——数据资产定价研究初探

    数据(Data)是一项资产的观念形成虽然时间不长,但已经成为人们的共识.成为资产的两个基本前提条件是能够确权和定价.确权是确定谁拥有什么权利或权益,定价使得资产具备可转让性.相比其他资产类别,数据资产 ...

  10. 【大数据】大数据思维的十大核心原理

    感谢博主,转自:https://blog.csdn.net/supermapsupport/article/details/78741774 一.数据核心原理 从"流程"核心转变为 ...

最新文章

  1. Visual Studio 字体抗锯齿插件 Text Sharp
  2. 英文 电气与计算机工程学报,ei来源刊分为哪三大类?如何区别compendex和ei page one的文章?...
  3. linux子进程父进程例子,linux 子进程访问父进程
  4. Python中的random库
  5. sqlserver 字符转数值_PLC根据寄存器数值查询MySQL/SQLServer数据库,将数据到寄存器...
  6. emoji隐藏表情_MacBook 7大隐藏功能曝光!强大到逆天!
  7. 【安装记录】安装 pyzmq ==19.0.2 报错记录
  8. ZigBee入门-CC2530-实验(一)-流水灯代码
  9. 变桨距风力发电机液压系统设计
  10. 数据库迁移工具flyway
  11. HTTPS的原理与具体实现过程及HTTP服务的虚拟目录简介
  12. 2022年最该收藏的8个数据分析模型
  13. 游戏开发的专业术语整理
  14. android sdk引入 微信分享_Android分享 ShareSDK微信分享详解
  15. winscp登录主机拒绝_winscp连接被拒绝怎么解决
  16. 小米路由器安装花生壳实现外网映射
  17. 华为路由器ws5200虚拟服务器,华为路由器配置dhcp怎么弄?华为路由WS5200设置DHCP服务器方法...
  18. SVN服务端安装与配置
  19. 【转】网站流量UV是什么意思?什么是流量UV?
  20. 天空之城 单音版

热门文章

  1. 日志文件管理者:Logrotate
  2. 轻松搭建docker应用的mesos集群
  3. HDU 2531 (BFS搜索)
  4. RedHat 5.6_x86_64 + ASM + RAW+ Oracle 10g RAC (六)
  5. android 多线程 handler使用方法
  6. CF1083(Round #526 Div. 1) 简要题解
  7. 自己制作博客园打赏功能
  8. 20145235 《Java程序设计》第8周学习总结
  9. 【ImageMagick】ImageMagick命令行工具
  10. js里apply用法