DataOps作为一种企业提升数据分析质量和效率的方法论随之兴起。基于DataOps,企业数据中台可以实现更高效的运转,优化数据质量、加快生产周期,实现更好的数据运营、管理、应用。那么,运用DataOps如何能够最大化帮助数据团队运营数据,与业务高效协同?DataOps适合什么样的企业和团队?对于DataOps未来的演进方向是什么?

自2014年大数据首次写入政府工作报告起,我国大数据产业飞速发展,需求旺盛、供给强劲。在国家大数据相关政策的护航下,我国的大数据产业已进入深化阶段。随着发展的不断深入,企业数智化转型逐渐到达了瓶颈,各类矛盾浮出水面。

一是效率与管理之间的矛盾。数据项目寻求快速交付,那么管理就难以贯彻落实。在执行上往往就出现了管理和实施两张皮的现象,许多基础工作遭到了忽视,从而产生了诸多的质量问题;

二是业务与技术之间的矛盾。以前我们技术水平落后,面对的是巧妇难为无米之炊的问题。现在技术发展迅猛,但在业务和技术的衔接上出现了问题,难以有的放矢。

三是需求与供给之间的矛盾。现在的技术发展迅猛,面对企业提出的需求,供给侧能够给出各式各样的解决方案。需求方精力都用在识别和对比,缺乏对需求的深入思考,远离了问题的本质。

在数智化转型的大背景下,企业逐步意识到数据的重要程度空前。各行各业加速建设企业内部信息系统,加快数据平台构建。但在朝数智化转型迈进的过程中,总是存在着一些问题,阻挡着企业完成数智化蜕变。

从企业角度来看,在数据项目的开发、维护、管理的过程中,普遍会遇到一些典型的问题,例如数据项目的人工依赖度高、团队协作配合困难、需求响应时间低于预期、开发流程不够顺畅、管理要求难以贯彻等问题。

已有研究数据报道:99%的企业数字化转型以失败告终,84%的数字化转型项目未能达预期。

在数智化转型这一阶段,企业的业务正处于发展的关键时期,组织内的数据意识已经逐渐成熟,数据相关的需求在这一阶段激增。但是这一阶段,技术引擎的动力略显不足,数据项目的成本高、数据准备的时间长、数据需求的响应不及时。种种问题阻碍住了企业完成数智化蜕变。也是与此同时,DataOps以破局者的身份出现在大家的视野当中,为企业的数据引擎换挡。

DataOps的概念最早在2014年由国外学者提出,随后业界逐步对其内涵进行补充。在2018年DataOps正式被纳入Gartner的数据管理技术成熟度曲线当中,由此进入了国际的视野当中。2022年中国信通院正式牵头启动了DataOps的标准建设工作,以此为基础推动我国大数据产业的多元化发展,助力企业完成数智化蜕变。

从发展上看,自2018年被Gartner纳入到数据管理技术成熟度曲线以来,DataOps热度逐年上升,在21年处在一个从萌芽期到爆发期的关键过渡阶段,预示着未来2-5年内DataOps将得到广泛的实践应用。

从定义上看,Gartner、IBM、Wikipedia争相对DataOps提出了自己的定义。普遍认同DataOps具有敏捷、协作、自动化等特点。并且也提到了人员、流程、技术三者融合协作的重要性。

实践上看,欧美国家的一些公司在DataOps的探索和发展上要早于中国。现阶段,我国有更广阔的发展空间和挖掘潜力,在制度保障、人才培养、技术储备发展上都有着长期优势。

在国外。有如Twitter、Google等公司使用面向未来的数据架构,有如IBM公司也在多年前就开始研发了诸如Knowledge catalog、DataStage、Cloud Pak for Data等符合DataOps理念的解决方案,也有像StreamSets公司这样以DataOps思想来引领开发的工具产品。

在国内。也有很多的企业先驱者,通过敏锐的嗅觉和强大的管理执行力去探索DataOps的实践。如中国工商银行、农业银行、平安银行等多家银行机构,联通数科、广东移动、江苏移动、浙江移动等通信企业,阿里、腾讯、浩鲸、数造科技等科技公司,都在积极探索并尝试用DataOps的理念来推动我国数据文化的建设和发展。

DataOps标准的建设意义在于在于三定:

确定DataOps概念意义、明确DataOps实施流程、把握企业发展阶段和方向。

再有就是通过标准引领的方式,引导企业快速接纳DataOps文化,尽快完成数智化转型,释放数据要素价值。

DataOps的标准体系涵盖了7大模块,分别是研发管理、交付管理、数据运维三项核心过程,价值运营、系统工具、组织管理、安全风险四项保障措施

标准细分为25大能力、70余项能力要求和200余个动作环节。

目前,标准整体框架达成共识,并完成第一个模块“研发管理”的主体内容和要求。

该标准对DataOps的定义和能力特征达成了共识。

定义:数据研发运营一体化(DataOps)是一种面向数据全生命周期,以价值最大化为目标的最佳实践。聚焦于协同从数据需求输入到交付物输出的全链路过程,明确研发运营目的,细化实施步骤,在系统工具、组织模式、安全风险管理的支撑下,实现数据研发运营的一体化、敏捷化、标准化、自动化、智能化、价值显性化理念

在级别上划分上由低到高分为入门级、进阶级、优秀级、卓越级、引领级5个级别大项。

每个级别大项中又分为3个级别小项。从管理能力、技术能力、动作关联情况以及其他重点四大维度为企业把脉。便于企业更精准掌握现状。

在7大模块中,第一个模块研发管理,已经就主体部分达成基本共识,DataOps研发管理模块包含了4项能力,12个能力项、42个动作环节、210条等级要求和600余项条款要求。

企业可以通过以评促建的方式,掌握当前发展现状,明确未来发展方向。

以下《DataOps实践初探》分享来自联通大数据公司尹正军:

Q: 对DataOps的理解认识,特别是DataOps解决的核心命题是什么?

A: 先说一个小体会吧,咱们行业搞数据仓库或数据平台工程化的,包括我们的算法工程师、数据科学家等,大家都喜欢吐槽,说自己是搬砖的、填坑的、挖煤的等等,这里面其实说明了很多问题。

似乎有很多没啥技术含量、相对模式化的工作正在折磨着大家,大家的工作幸福指数好像并不高,那DataOps,能搞定这个问题吗?答案是肯定的,DataOps核心要解决的问题,就是要围绕相对复杂的数据处理流水线,基于数据驱动的方法,帮助数据组织不断改进数据活动实施层面的协作效能。

所以,简单一点说,DataOps可理解为在数据运维和数仓开发活动中找到敏捷精益的方法实现系统性降本增效。以联通大数据的应用实践为例,我们内部数据治理疏整促工程和集群治理“巡山”工程的相关实践,这是相对狭义的微观的视角,更大一点的目标是在复杂数据处理流水线上通过自动化工具链真正做到数据开发运维建模治理一体化。

比如我们内部的数据开发平台和数据云平台的相关实践,如果从更宏观的视角看,就是通过数据资产运营和数据智能方法论来驱动业务发展和企业数字化转型,比如像我们通过联通大数据能力开放平台开展的数据生态运营及合作实践。

Q:DataOps与数据中台、数据资产管理等概念的区别与联系?

A: 可以说,DataOps是数据中台落地实践过程中的加速器,是数据平台开发运维和数据治理活动实施的润滑剂,是数据科学建模分析和数据资产运营管理的催化剂。具体来看,就像下面这张图,其中橙色部分就是DataOps的价值域,重点就是不断提升数据组织和数据系统之间的协同效率问题。

Q: DataOps在企业中的实践,是否可以举具体案例说明解决了哪些问题?

A: 我先分享一下DataOps在联通大数据公司内部实践过程中的三个要点吧:

1) 借鉴DevOps持续集成与交付方法论,建立数据治理基础框架,实现数据采集、加工、运维、服务过程一站式、体系化、规范化、自助化的流水线管理模式,消除数据生命周期管理、数据质量管理、数据安全管理等方面的隐患。

2) 基于大数据集群健康评分机制,实现数据平台降本增效,从数据计算、存储、调度等各个方面洞察平台效能和数据资源冗余使用画像,实现数据平台、模型和应用的快速部署与开发,使用AI辅助数据治理手段,为上层数据分析和智能化应用提供稳定高效算力和算法支持。

3) 实现数据驱动业务,建立数据资产运营体系,通过技术数据双中台底座,让数据资产能力开放运营过程更加安全、敏捷、服务化和智能化。

具体来说,DataOps可以在我们数据开发、运维、治理、运营、安全这五大领域发挥出非常大的实用价值:

Q:DataOps的理念是否适合在传统行业推行?

A: 关于DataOps的理念,大家看到在互联网公司、创新独角兽企业,以及我们通信运营商领域,确实都有一些实践心得有一些小成绩,但是你要说是否适合在传统行业进行推广,我个人认为跟企业属性或业务范围没有特别大的关系,主要取决于团队对DataOps概念的接受程度和给企业带来价值的目标预期。

从过去的交流经验来看,大家也容易陷入一些误区,DataOps确实不是简单的买买工具或者通过自研产品就一定能解决的问题,相反,这些工具或产品会变成“枷锁”甚至是“刑具”,应该优先从数据组织和文化入手,深度思考,围绕数据流水线、数据组织、数据活动三个关键点,找到数据开发、数据运维、数据治理、数据运营、数据安全五大价值域的突破口,可以尝试各个击破、快速迭代优化,最终实现数据组织协作效能最大化。

Q:展望DataOps未来发展,DataOps理念本身是否会有演进?

A: DataOps理念和具体的方法论确实还在不断演进中,业界还没有标准框架和实施层面的通用工具集,但是相对于数据中台更容易落地,因此,我很看好DataOps未来的发展,我相信通过产业界的不断努力,后续DataOps应该是能够显著提升数据组织的幸福指数,提高数据仓库、大数据中心和数据中台等平台类系统工程建设的ROI,最终帮助企业实现数智化转型的大目标。

DataOps 标准体系能力框架及实践相关推荐

  1. 智慧产业园区标准体系总体框架

    导读: 智慧产业园区类似一个"城市",是一个包括产业发展.技术开发和学术研究在内的综合体.各组成部分协调运转.良性循环.相互促进,最终激发企业创新活力和产业市场潜力.智慧产业园区不 ...

  2. 城市大脑标准体系与评价指标总体框架研究

    来源:城市大脑全球标准研究组 根据城市大脑标准的前期研究和中国指挥与控制学会(CICC)<城市大脑建设规范>标准启动会的专家意见,形成城市大脑标准体系与评价指标总体框架(如图1所示),供各 ...

  3. 信息技术专业标准体系框架设计研究与思考

    为了支撑企业数字化转型智能化发展工作,近期对信息技术专业标准体系进行了简单的梳理,借助ChatGPT进行分类设计分析,并对国际.行业及其他公司的信息技术专业标准体系进行了调研学习,最终形成了信息技术专 ...

  4. BC:带你温习并解读《中国区块链技术和应用发展白皮书》—区块链标准体系框架

    BC:带你温习并解读<中国区块链技术和应用发展白皮书>-区块链标准体系框架 目录 区块链标准体系框架 区块链标准化重点方向 区块链标准化实施方案 区块链标准体系框架 1.基础标准 2.业务 ...

  5. 万字好文 | 数字化转型之道——数据治理体系能力提升

    这篇是蔡春久先生直播的文字摘录,这场直播获得了满堂喝彩,讲的非常好,整篇文章大概10000字,建议大家看完. 来源:蔡春久-<帆软·决胜数字化转型>直播 文章整理:grace 蔡春久:中国 ...

  6. 【华为云动态】华为云DevCloud助力DevOps标准体系建设

    日前,DevOps 标准体系之系统和工具第四次研讨会在杭州召开.研讨会由TC608云计算标准和开源推进委员会主办.工信部中国信息通信研究院牵头.高效运维社区支持.DevOps 标准工作组负责组织,作为 ...

  7. 【智能制造】工信部:《国家智能制造标准体系建设指南(2018年版)》(征求意见稿)

    据工信部1月15日消息,为加快推进智能制造综合标准化工作,加强顶层设计,构建智能制造综合标准体系,发挥智能制造标准的规范和引领作用,工业和信息化部.国家标准化管理委员会组织开展智能制造综合标准化体系建 ...

  8. 互联网P2P优化管理标准体系研讨会召开

    2008年5月4日消息 随着互联网新技术的不断发展和互联网新应用的不断涌现,互联网已经成为电视.广播.报纸等传统媒介之外的另一个重要的内容传播渠道.近几年来,以P2P技术为代表的互联网内容传播新技术突 ...

  9. 政府大数据治理体系的框架及其实现的有效路径

    政府大数据治理体系的框架及其实现的有效路径 安小米1,2,郭明军1,洪学海3,魏玮1 1 中国人民大学信息资源管理学院,北京 100872 2 数据工程与知识工程教育部重点实验室(中国人民大学),北京 ...

最新文章

  1. 顺时针打印矩阵 python
  2. mac安装jmeter
  3. 如何datagrid分页保持每页先前选择的checkbox的状态?
  4. 电脑屏幕变黄如何调整_如何调整电脑屏幕比例
  5. C语言按行和列求平均成绩代码(指针,二维数组)
  6. 长沙营智:PolarDB助力长沙营智提速资讯搜索业务
  7. 【数据库基础知识】plsql安装及配置
  8. android 绘制按钮,Android:使用xml定义创建一个三角形的按钮(可绘制)
  9. 随想录(从技术到业务的转变)
  10. iOS开发网络篇—大文件的多线程断点下载
  11. codejock 用法记录
  12. 《码出高效---java》PDF,有学习java的小伙伴可以看看,阿里巴巴出版的书籍
  13. R数据分析:竞争风险模型的做法和解释
  14. matlab 彩色图片分解,MATLAB 彩色图像分割
  15. FCN全卷积神经网络
  16. 无线路由器服务器连接线,无线路由器连接有线路由器怎么设置?
  17. RPC框架系列——Avro
  18. Android安全编码规范
  19. 科大奥瑞物理实验——光纤传感器实验
  20. My feelings

热门文章

  1. 最终幻想14服务器不稳定,最终幻想14排队出现2002错误详细解决办法_FF14连接大厅服务器发生错误解决办法_求知软件网...
  2. 6、MySQL 中索引的介绍
  3. oracle 物化视图 重建,Oracle物化视图:创建最简单物化视图-开发技术
  4. jsp mysql火车票预定系统_jsp784火车票毕业设计售票系统mysql
  5. Windows10 设置鼠标右键在此处打开cmd和Powershell窗口
  6. LDUOJ 时间锁链 (状压+线段树 )
  7. CentOS 7.7 基于Apache部署seafile 7.1.5
  8. Xftp7对Linux远程上传/下载文件
  9. Orchard基本概念快速理解
  10. 「GoCN酷Go推荐」基于泛型的 Golang lodash 库 — samber/lo