数据的权威性和重要性,伴随着时代的发展而来,已经不需要我们再论证了。

"去年,我们计划通过数据分析带来3千万美元的收入,到去年底,实时上我们做到了1.05亿美元" -- Hilton CDO

"如果没有数据,那你顶多算是一个持有不同观点的人而已。我们相信上帝,除此之来,都请用数据说话" -- W.Edwards Deming,质量管理之父。

"我们会收集所有数据,即使我们现在还不知道该怎么使用它!"-- 贝索斯,Amazon CEO

什么是数据民主化,为什么它很重要?

企业内,要实现数字化转型的话,塑造企业数据文化是当务之急。数据的民主化,就是为了让数据大众化,让所有用户都可以平等的接触和使用数据,如:

  • 财务分析、HR 人力资源分析、运营分析
  • 数据科学家进行的数据洞察

所谓”旧时王谢堂前燕,飞入寻常百姓家“。要实现数据民主化,必须极大的降低数据门槛,让本来只有IT专家可以做的事情,变的简单:让那些需要数据的人,都可以自助的发现、收集、并分析数据。

这是大数据最好的时代,这也是大数据最差的时代

多年摸爬滚打后,我们才逐渐认识到,基于事实的、数据驱动文化对一家公司是何等重要!

在这个基础上,数据在逐步的资产化,并在向货币化演进。这么一个不争的事实被认可了:

随意丢弃过时的旧数据,曾经是多么错误的决定

数据可以帮助我们发现反直觉的真相、找出生产链中低效的环节、发展潜在的商机。目前,数据已经是企业控制成本、提升利润,向精益运营转型的重要手段

大数据已经是大势所趋,不可逆转的潮流。然而,如何真正实现洪流落地、赋能商业,面临的挑战却也是前所未有的:

  • 数据安全与个人隐私如何解决?
  • 企业发展多年,数据孤立严重,如何找到并唤醒这些数据?
  • 打通数据孤岛后,部门之间利益如何重新平衡?
  • 企业内数据文化如何培养?

这些问题,个个都是致命的要害,任何一个,都可以让你的公司退变成数据荒漠。

一个数据公民的工作桌面

下图,是一个普通数据分析师或数据科学家的工具箱,和日常工作的一部分:

从数据准备、数据建模、到数据训练各个环节,数据科学家们已经装备了十八般武器,从python到Tableau。

再看看数据科学家的日常是如何工作的:

从数据流向的角度来看,科学家处在中下游,要想拿十八般兵器开练,还需要原料的支持,那就是数据。

而数据从生产系统生成、到采集、入湖、清洗、建仓,这些环节,都是数据科学家鞭长莫及的。

我们发现,数据科学家们欠缺的不是工具,而是数据,如何高效、方便、安全的获取数据,才是他们的痛中之痛

数据科学之殇

再精良的装备,也无奈糟糕的数据。我们在一丝不苟的做着数据分析和数据挖掘,若数据没有保障的话,又有谁敢说我们做的不是一件"garbage in garbage out"的事呢?

从数据这个角度出发,从数据查找、理解数据、到分析数据,每一步都像是在迷宫里探索,运气好,才能撞出去...

如何破解数据科学之殇-数据迷宫呢?答案就是引入现代化的Data Catalog

为什么需要现代化的Data Catalog

我们从数据分析师的例子讲开。从有想法、到数据验证的整个周期内,寻找合适数据、理解数据、信任数据、使用数据这四个环节的耗时分布大致如下:

令人惊奇的是,这四个阶段上耗费的时间,呈漏斗状分布。我们仅用了几个小时去分析数据,但是却用了数天、甚至数周去寻找这些数据!这也从侧面印证了我们之前的论断:分析工具集已经不是数据公民们最薄弱的环节

现代化的Data Catalog需要和其他数据工具一样,作为数据科学家工作桌面上的必备选项之一

为什么要强调是现代化的Data Catalog呢?主要还是从目标出发,传统的数据目录工具已经不少,但都无法很好的解决发现和理解数据的问题,因为:

  1. 传统Data Catalog是从管理的角度来归集数据的
  2. 传统Data Catalog的目标不是数据民主化,不是为了赋予从数据公民平等的使用权

现代化的Data Catalog则不同,主要是:

  1. 现代化的Data Catalog以人为中心,人才是数据资产的核心,治理数据的最终目的是理顺人与人之间的关系
  2. 从数据治理的角度,现代化的Data Catalog,认为数据是活的,数据之间的关系、数据与人之间的关系与数据本身同等重要,这是大数据的本质

通过人-人、人-数据、人-知识、数据-数据之间的关系,可以把整个公司的数据资产构建成知识图谱。

通过关系,把数据、人、知识、之间的关系构建起来,它是数据资产间流通的血液,这个基于关系打造的图谱,就是现代化Data Catalog的核心引擎。

现代化的Data Catalog可以做什么?

新入职的员工

新入职的员工,急需了解公司的数据全貌和某领域细节,现代化的Data Catalog需要提供关联的专题导引


可快速与最合适的人交流

相信数据分析师们都不会反对这个结论:向懂的人请教一分钟,可以节省自己一整天的时间。关键是如何找到最懂的人?

通过现代化Data Catalog的核心图谱引擎,我们可以还原出:

  • 是谁生产的这份数据,找到数据负责人
  • 都有哪些人使用过这份数据,是在什么时候,以及都是怎么用的,从而找到数据专家

然后,通过内置接口,当场唤起沟通工具进行交流:

  1. 问答社区,内容全员可见,方便全员协作
  2. IM,定向交流,可快速解决问题
  3. 知识库,查看专家留下的宝贵经验。知识库可以通过智能问答机器人提供更具引导性的建议。

别人对这份数据的态度

“随大流 不挨揍”, 话糙理不糙。在大数据时代,就不要做少数派啦....

在使用一份数据之前,看看是不是有其他人用过,以及反馈如何,是省时省力的方法。现代化的Data Catalog需要提供这方面的支持。

我们可以通过反馈、备注、聊天记录、知识库、TAG、FLAG等不同方式,把用户在这份数据上的行为和体验沉淀下来,这就是这份数据的画像。

数据复用

有现成的,谁不用啊!在大数据领域更是如此,因为分析师们周而复始的、重复类似的数据需求,现代化的Data Catalog不仅需要支持经验的沉淀,更需要支持结果的直接复用!

众包模式

独乐乐,不如众乐乐。数据负责人,就是有三头六臂,也没有办法完善所有的数据描述。现代化的Data Catalog需要引入众包模式,根据实际经验来完善数据描述、使用案例等。

这个特性,是与传统Data Catalog理念明显不同之一。我们没有站在管理的角度,而是相信公民都是贡献者,强调了索取与奉献共存。

写在最后

值得留意的是,在企业数字化转型中,你的工具箱中,不缺少数据分析和加工的利器,即使缺少这类工具,你一眼就能识别出来。

但如果缺少合适的Data Catalog,它不但难以识破,而且会导致你迟迟走不到数据驱动的爆点。

看了这么多,还是不知道如何寻找找适合您企业的Data Catalog产品?

点击查看全滴滴都在用的Data Catalog

作者:张彦龙(公众号:数据老铁匠)

  • 滴滴云全线标准型云服务器限时特惠,注册即送新手大礼包
  • 新购云服务1月5折 3月4折 6月低至3折

滴滴云-为开发者而生

实现企业数字化转型,你只差一味药引子相关推荐

  1. 为什么中台是传统企业数字化转型的关键?

    相比于信息化来说,数字化的本质不同是什么?中台主要解决了企业转型过程中的哪些关键问题?传统企业的原有数据质量是否会影响转型进度? 2月25日,世界四大汽车生厂商之一的大众汽车宣布成立新的数字与服务部门 ...

  2. MobTech观察 | CSDN:企业数字化转型如何提升段位?杨冠军畅谈企业数字化前世今生

    近日,MobTech袤博科技合伙人.首席数据官杨冠军受邀撰写的文章<企业数字化转型的前世今生>登刊CSDN最新一期<新程序员 003:云原生和全面数字化实践>.该杂志由 50 ...

  3. 企业数字化转型:聊聊数据思维!

     关注ITValue,看企业级最新鲜.最价值报道! 作者丨石秀峰 笔者在<深入聊一聊企业数字化转型这个事儿>一文中给出了数字化转型的定义,即:通过应用数字化技术来重塑企业的信息化环境和业务 ...

  4. 【企业数字化转型】数字化转型的本质(学习笔记)

    摘要:数字化转型的本质是:在 "数据+算法" 定义的世界中,以智能数据服务的流动,化解复杂系统的不确定性,优化资源配置效率,构建企业新型竞争优势.我们要换一个视角,我们从一种静态思 ...

  5. 企业数字化转型:IT部门的未来!

    企业数字化转型:IT部门的未来! 作者丨石秀峰 全文共4078个字,建议阅读8分钟 01.传统企业,IT部门的现状 我们先看是一个实例,这是某生产企业对其IT部门的职能定义(当时是写入红头文件发布的) ...

  6. 【经验分享】打通“任督”二脉——企业数字化转型中如何构建DevOps能力体系?

    一.企业数字化转型背景 企业数字化转型(Enterprise Digital Transformation)的概念在过去二十年持续升温.2020年8月21日,国务院国资委办公厅下发了<关于加快推 ...

  7. 企业数字化转型最难的是什么?就这两个字

    导读:<华为数字化转型之道>读后感. 作者:木羊同学 来源:大数据DT(ID:hzdashuju) 企业数字化转型大家应该都有所耳闻,这是当前行业非常热门的话题.为什么大家都关注这个话题呢 ...

  8. 企业数字化转型-- 企业数字化解密

          在这个最好的时代,我们用软件定义了网络,用软件定义了新零售,用软件定义了"人货场",用软件定义了"供销存",用软件定义了数字经济.既然我们是用软件定 ...

  9. 企业数字化转型这盘大棋,Hybrid-Wan从中扮演了什么角色?

    "数字化转型",一个近二十年里持续升温的概念,尤其在后疫情时代,企业数字化转型的热度再一次升到了新高.而对于数字化转型的概念本身,每个行业却都带着各自不同的解读,有些偏向于技术领域 ...

最新文章

  1. 提前半年博士毕业,一作发顶刊论文11篇,这位“科研学霸”的秘诀是?
  2. 教你认识动态链接库DLL文件
  3. Apache 下更改 DocumentRoot 和新建虚拟目录
  4. Text模式和PDU模式短信的区别
  5. BZOJ - 2244 拦截导弹 (dp,CDQ分治+树状数组优化)
  6. [ROBOT] python library 如何能获取到ROBOT框架里面的全局变量,例如${OUTPUT DIR}等
  7. python 简单socket_Python 简单socket
  8. Java基础---认识正则表达式
  9. linux 访问文件软件,Linux下访问文件的基本模式
  10. SAP License:你是工程师还是顾问
  11. VMware虚拟机安装CentOS6.4、部署web项目全过程(设置固定IP、安装JDK、Tomcat、Redis、部署项目)...
  12. 编译Caffe错误:libpython3.5m.a(abstract.o): relocation R_X86_64_32S against
  13. 【2022PMP最全总结-敏捷专题课】
  14. Scratch(三十八):八大行星
  15. 关于传奇自动触发的几个常用脚本OnKillMob、StdModeFunc、等触发事件
  16. 固态硬盘扩展分区合并主分区方法
  17. php脚本爬取头像图片
  18. 怎样用Java求水仙花数和水仙花数的数量
  19. ME2188A33M3G 高效、同步的PFM升压直流-直流转换器
  20. 微信引流的方式 PC控制手机的方式

热门文章

  1. seo小白掌握必备常用seo工具以及seo工具的使用
  2. 机器学习神书推荐 Hands on Machine Learning
  3. 目标追踪与定位学习笔记10-SiamMOT论文阅读
  4. linux mdadm 脚本,Linux下用mdadm实现软件RAID
  5. Git下载到idea代码被删除后如何进行还原
  6. ansible免密登录
  7. Apache Hue:安装步骤
  8. View的进阶,自定义一款自带动画的雷达图
  9. 射频功率放大器在超声导波技术管道损伤检测研究中的应用
  10. 3D转换、动画的学习与使用