大家好,我是独孤风,一位曾经的港口煤炭工人,目前在某国企任大数据负责人,公众号大数据流动主理人。

在最近的两年的时间里,因为公司的需求,还有大数据的发展趋势所在,我开始学习数据治理的相关知识。

首先给大家打点鸡血,目前数据治理的相关岗位已经越来越多了。而有一定大数据技术基础,数据分析基础也更容易从事数据治理的相关岗位工作,待遇也是会提高很多。而数据相关从业人员也是数据治理的从业人员的主要来源,因为目前也没有直接大学毕业就从事数据治理工作的,也都是通过学习转过去的。

这是某大厂对于数据治理的岗位要求,大家可以简单看一下。而且目前很多公司对于数据架构师的要求,也包含了数据治理的相关能力要求。数据架构师一直都是未来一段时间高薪的岗位之一。

在数据治理实践方面,元数据管理平台(如Datahub,Atlas)是我主要研究的一个方向。但是数据治理理论方面的学习,我也一直在继续,因为我一直相信大数据、数据治理终有一天会融合发展,大数据技术也将与数据治理理论相结合,而我们只有将两者融会贯通,才能在企业的大数据与数据治理发展中大显身手。

所以,今天就来聊一聊数据治理理论该如何学习。

本文共5000字,将从数据治理概述、数据治理国内外学习框架、数据治理认证考试三个方面来进行介绍,希望能帮助您对数据治理有一个初步的了解。

文章结构如下:

一、数据治理概述

随着业务的不断发展和信息化的不断深入,需建设的业务系统越来越多,

随着业务系统的数据种类不断丰富完善, 数据量的不断增大,如果不采取有效手段解决问题,

随着信息化建设的深入,下列的问题会越积越多。

数据治理的定义有很多。国际数据管理协会(DAMA)给出的定义是:“数据治理是对数据资产管理行使权力和控制的活动集合。”

国际数据治理研究所(DGI)给出的定义是:“数据治理是一个通过一系列与信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来执行,该模型描述了谁(Who)能根据什么信息,在什么时间(When)和情况(Where)下,用什么方法(How),采取什么行动(What)。”

“数据治理”的历史可以发展分为三个阶段。

第一阶段早期探索,早在1988年由麻省理工学院的两位教授启动了全面数据质量管理计划(TDQM),可以认为是数据治理最初的雏形,同年,DAMA(国际数据管理组织协会)成立。时间一直走到2002年,数据治理概念首次出现在学术界,美国两位学者发表题为《数据仓库治理》的研究探讨了Blue Cross和Blue Shield of North Carolina两家公司的最佳实践,由此拉开了“数据治理”在企业管理中的大幕。

第二阶段理论研究,在美国学者发表《数据仓库治理》的第二年,2003年DGI(国际数据治理研究所)成立,研究数据治理理论框架,与ISO国际标准化组织对数据管理与数据治理进行定义。直到2009年,DAMA国际发布DMBOK《数据管理知识体系指南》[15](以下简称《DAMA指南》),至此数据治理的理论框架基本固定。2020年DAMA国际发布DMBOK《数据管理知识体系指南原书第二版》[16](以下简称《DAMA指南第二版》)。

第三阶段广泛接受与应用,伴随着数据仓库的建设,主数据管理与BI的实施,国内也逐步开始接受并利用数据治理的概念进行推广实践。我国数据治理之路在DMBOK基础上不断延伸和扩展,里程碑事件为在2015年提出了《数据治理白皮书》国际标准研究报告。

这里基本都是定义一些概念性的东西。

2018年6月7日,国家市场监督管理总局和国家标准化管理委员会发布《中华人民共和国国家标准公告(2018年第9号)》,批准《信息技术服务治理第5部分:数据治理规范》国家标准发布实施,标准号为GB/T 34960.5-2018,实施日期为2019年1月1日。《数据治理规范》是我国信息技术服务标准(ITSS)体系中的“服务管控”领域标准,属于《信息技术服务治理》的第5部分。

这个规范之前也有过分享。

金融等行业也在实践的过程中形成了自己的治理体系,比如银行在2018年发布了《银行业金融机构数据治理指引》,这也标志着数据治理在我国银行金融机构中全面实践时代的到来,华为2020年出了本书《华为数据之道》,可以看到数据治理在企业中也开始发挥出越来越重要的作用。

上面提到的这些资料和文件,之前我也都做过分享,随着数据治理的发展,这些政策法规文件也会不断的颁布,我们也是保持持续的关注。

二、数据治理国内外学习框架

相信学过不同领域知识体系的同学会比较熟悉学习框架这个词。对于特别复杂的知识体系来说,学习难免会枯燥、找不到方向、出现遗漏。那么这个时候框架就显得尤为重要。在数据治理的发展过程中,国内外也形成了很多种学习框架。

国际数据治理框架

国际上,主流的数据治理框架主要有ISO数据治理标准、DGI数据治理框

架、DAMA数据管理框架等。对国际主流数据治理框架的理解有助于我们建立

符合企业自身业务需求的数据治理体系。

ISO/IEC 38505标准的数据治理方法论

该标准提出了数据治理的“E(评估)-D(指导)-M(监督)”方法论,通过评估现状和将来的数据利用情况,编制和执行数据战略和政策,以确保数据的使用服务于业务目标,指导数据治理的准备和实施,并监督数据治理实施的符合性等。

DGI(数据治理研究所)是业内最早、最知名的研究数据治理的专业机构。

DGI于2004年推出DGI数据治理框架,为企业根据数据做出决策和采取行动的复杂活动提供新方法。

DGI数据治理框架的设计采用“5W1H”法则,将数据治理分为人员与治理组

织、规则、流程3个层次,共10个组件。

DAMA(国际数据管理协会)是一个由全球性数据管理和业务专业的志愿

人士组成的非营利协会,致力于数据管理的研究和实践。其出版的《DAMA数

据管理知识体系指南》(简称DAMA-DMBOK)一书被业界奉为“数据管理的

圣经”,目前已出版第2版,即DAMA-DMBOK2。

国内数据治理

在数据治理框架和标准体系的研究方面,国内起步相对较晚,目前主要有

GB/T 34960和DCMM两个标准。

我国发布的信息化标准GB/T34960《信息技术服务治理》中包含五部分内

容。

第1部分:通用要求。

第2部分:实施指南。

第3部分:绩效评价。

第4部分:审计导则。

第5部分:数据治理规范。

其中,第5部分《数据治理规范》(GB/T 34960.5—2018)中提出了数据治

理的总则和要求,为企业数据治理体系的建设提供了参考。

GB/T 36073—2018《数据管理能力成熟度评估模型》(Data Management Capability Maturity Assessment Model,DCMM)是在国家标准化管理委员会指导下,由全国信息技术标准化技术委员会编制的一份国家标准,于2018年发布并实施。

DCMM按照组织、制度、流程、技术对数据管理能力进行了分析和总结,提炼出组织数据管理的8个过程域,即数据战略、数据治理、数据架构、数据应用、数据安全、数据质量、数据标准、数据生存周期。

DCMM将组织的数据能力成熟度划分为初始级、受管理级、稳健级、量化管理级和优化级共5个发展等级,以帮助组织进行数据管理能力成熟度的评价。

一些理论方面的东西,这里不做赘述。但是目前最权威,也最接地气的,还是DAMA数据管理体系,这也是大家在学习数据治理的时候,为什么会频繁的听到DAMA相关词汇的原因。

作为最权限的数据治理框架,我们只要掌握了DAMA相关知识,最结合实践。做到数据治理的最基本入门是没有问题的,在经过几年企业中的积累,您也可以成为数据治理专家。

三、数据治理认证考试

虽然说有些考试过于形式化,但是有一个证书确实对于证明你在数据治理相关领域的专业度很有帮助。

其实现在关于数据治理的认证很多,我之前也分享过一些。比如某数据治理认证、某某数据管理师认证等等。

由于目前我们国家工信部还没有出大数据或者数据治理的专业资格认证,类似于注册**工程师这种,所以现在比较权威的数据治理认证还是国际的数据治理认证,这个国外国内都是比较认可的。

DAMA数据管理专业认证CDMP

也请大家一定要记住这个拼写CDMP,这个才是国际专业的数据治理认证。

一共分为四级,当然大部分公司对于等级没有要求,拿到A级就是很高的水平了。

这四级的区别如下:

目前招聘企业对于CDMP的认证也逐渐增多了起来,以下截取某公司招聘信息(隐藏了关键信息),其中对CDMP证书有了直接的要求。

这门考试考的内容也比较干货,也就是说在准备考试的过程中,确确实实能学到很多的数据治理知识。

当然,近几年随着数据治理的发展,及与大数据的融合,大数据方面的知识也在逐年增加,这也是我们的优势。

最后提醒一下大家,这门考试需要在国外的CDMP网站认证进行,需要有一些方法访问该网站,考试中也有很多英文,有一定难度。考试的费用是311美元,证书有效期三年。当然这个是官方限定的有效期,通过考试的话,可以得到这样的一个证书,这其实足以证明你在数据治理方面的学习能力了。

考试通过后,将得到该认证证书,证书长这样:

大家可以自己报名参加考试,也可以参加国内的一些培训。由于需要获取国外的一些信息,在流程上有一些难度,还需要做一些翻译插件的设置。

所以,我这边的建议是如果大家想考这个证书,你本身英文不错,自学能力和自制力都很强,完全可以自学通过该考试。

我这边也组织了一个CDMP自学交流群,仅限想学习数据治理的同学和有意参加CDMP认证考试的同学加入

我自己本身自制力太差,所以我选择了报了一个班,这个也是DAMA官方的一个培训班。也借这个机会系统的学习一下自己比较薄弱的 数据建模、主数据和参考数据、元数据管理、数据质量、数据安全方面的知识。

这里也跟他们要了一些优惠,优惠仅限本公众号粉丝。 除了完整的课程以外,还有教材讲义,在线答疑,考试报名等服务。  大家有兴趣也可以报班和我一起学习,共同拿证,有一个数据治理的敲门砖。

报名后私信我一下,拉你进培训班交流群,他们给的优惠券数量有限,如果扫码没有了,不用着急原价付费,联系我走一下优惠价格。

这里包含了培训费和报名费全部费用

热门文章推荐

开源数据质量解决方案——Apache Griffin入门宝典

滴滴被罚,数据安全该怎么做?——大数据安全入门宝典

一站式元数据治理平台——Datahub入门宝典

数据质量管理工具预研——Griffin VS Deequ VS Great expectations VS Qualitis

万字长文——Datahub离线安装手册

大数据流动:大数据、实时计算、数据治理,数据可视化实践类自媒体。定期发布数据治理,元数据管理落地技术实践文章,分享数据治理实践落地相关技术与资料。

提供大数据入门,数据治理,Superset,Atlas,Datahub等学习交流群。

大数据流动,对大数据技术学习永不止步。

长按,识别二维码,关注我们吧!

5000字详解数据治理如何入门(附国际数据治理认证考试-CDMP学习群)相关推荐

  1. 大数据治理入门系列:数据治理

    在信息经济时代,数据是企业的一大关键资产.为了制定科学.有效.合理的决策,企业需要收集大量的数据并进行各种数据分析,为决策提供依据.在此过程中,收集数据的速度.数据的质量和可靠性.对数据的分析过程.合 ...

  2. 【数据科学】小数据治理靠“人工”,大数据治理靠“智能”

    摘要 本文把小数据和大数据的基本概念,小数据治理与大数据治理的范围.区别.方法及主要特征介绍比较清晰. (1)小数据治理靠"人工",小数据的治理十五字方针:理数据.建标准.接数据. ...

  3. 小数据治理靠“人工”,大数据治理靠“智能”

    01 什么是小数据治理 谈小数据治理,首先说一说什么是小数据.在百度百科上我们可以查到小数据的定义是:"小数据(small data),或称个体资料,是指需要新的应用方式才能体现出具有高价值 ...

  4. 关于数据治理的读书笔记 - 企业数据治理的“道、法、术、器”

    读书笔记的历史文章, <关于数据治理的读书笔记 - 数据治理.数据管理和数据管控的理解> <关于数据治理的读书笔记 - 什么是数据治理?> 数据治理的本质是管理数据资产,改善数 ...

  5. 行业数据治理和社会面上的数据治理的主要内容有哪些?

    行业数据治理和社会面上的数据治理是两个不同的领域,主要内容如下: 行业数据治理:指在特定行业中,对数据的收集.处理.存储.共享和使用进行规范和管理的过程.其主要内容包括: 1.数据质量管理:确保数据的 ...

  6. 5000字详解数据安全治理

    2010年,针对数据安全治理,微软提出了专门强调隐私.保密和合规的数据安全治理框架(DGPC),希望企业和组织能够以统一的跨学科的方式来实现目标,而非组织内不同部门独立实现.DGPC框架能够与企业现有 ...

  7. 6500字详解数据中台,一份完整的数据中台手册!

    内容索引: 1. 数据中台定义 2. 数据中台价值 3. 数据中台VS业务中台 4. 数据中台功能架构 5. 数据中台技术架构 6. 数据中台构建的三大路径 7. 数据中台构建5步法 数据中台定义 数 ...

  8. 数据治理(二):数据治理功能方面

    文章目录 数据治理功能方面 一.主数据管理 二.元数据管理 三.数据标准管理 四.数据质量管理 五.数据集成管理 六.数据资产管理 七.数据安全管理 八.​​​​​​​数据生命周期管理 九.​​​​​ ...

  9. 谈谈医疗行业数据治理的四个关键阶段【后附医院数据治理案例】

    数据是推动医疗行业的改进,驾驭不断变化的医疗行业环境的必要资源.它使医疗行业组织能够评估医疗的提供和支持方式.患者参与和教育的方式,以及支付者和提供者如何共同努力提高价值.但是医疗行业数据很复杂,而且 ...

最新文章

  1. 青羊区光华中心机器人_北京大学招收机器人工程本科生
  2. Science:人类迎来目前最为全面的癌症染色质可及性图谱
  3. python安装步骤图解-Python安装-小白图文教程(精)
  4. 在CentOS 5.5下用OpenSSH构建SSH服务器(上)
  5. codevs 1082 线段树区间求和
  6. 数据库系统概论期末复习以及知识整理
  7. 方法论:写好一份产品需求的系统化思考模型
  8. Encapsulate Field
  9. [BZOJ2048] [2009国家集训队] 书堆
  10. myeclipse 创建work set 后不显示的解决方法
  11. SHELL判断文件是否包含某个字串
  12. cnpack多国语言控件帮助
  13. firemonkey mysql_FireMonkey下画图线条的大小
  14. TP5和TP3.2区别
  15. 超算入门笔记:大型机上如何运行WRF模式?一文总结(并行运算、Linux基础、作业调度、WRF运行)
  16. 《JAVA: 学习导图》
  17. 神经网络文本分类技术实践总结
  18. bzoj1202 狡猾的商人[并查集]
  19. 在树莓派上定时播放语音
  20. AppWidget开发

热门文章

  1. 【2023秋招】10月26日华为机试三道题题目
  2. 台式计算机cpu是什么,台式电脑CPU怎么看好坏?台式电脑处理器好坏从这几个方面判断...
  3. 选一条路,坚持走下去 | 专访芮臻赟润咨询创始人 Margaret Yao
  4. 耳鸣患者应该注意哪些生活上的问题
  5. 推荐《创京东》——做市场的同学,应该读一下
  6. 《瞿葩的数字游戏》T3-三角圣地,洛谷P2675,Lucas定理
  7. 微信公众号开发-公众号被动回复用户消息
  8. SAP HR获取工资结果
  9. C语言 gets() '\n'
  10. 抖音SEO,抖音seo关键词排名靠前操作