数据智能服务——活数据:流动创造价值

摘要:机器智能将推动绝大部分的商业快速智能化,这将决定大部分企业的未来生死。而实现机器智能的核心是创造性得把你的核心业务在线化,从而实现数据化、算法化和产品化的三位一体,让你的商业拥有数据智能这一核心引擎。

引言:网络协同和数据智能双螺旋驱动

在越来越多的领域里面,基于数据智能和网络协同,将产生更多的创新企业。
【行动者网络理论】:https://www.jianshu.com/p/a97bfb683de9

原来公司高管大部分的精力都用在管理、盯人上。但实际上, 怎样提供一个平台,让创造者之间能够有更多的互动,甚至是跨界的交流,让整个团队产生更好的创造力,这是组织创新方面非常重要的新领域。这需要大家花非常多的心思去探索和琢磨,也会是企业之间竞争力一个重要的分水岭。

工业时代基于科层制管理的公司制度正在逐渐丧失它的生命力,在创造力时代基于赋能的组织创新方兴未艾,也是大家未来最需要努力的方向。

数据智能:未来商业的核心

先透露一个阿里的小秘密,大家都可能经历过每年双十一的狂欢,过去七年双十一的成交额都在创纪录,去年超过了1200亿人民币。
但是你可能不知道的是过去七年,每年的双十一,阿里巴巴的大部分人要做的事情却越来越少,甚至有越来越多的阿里同学会发现那天根本无事可做。我们客服曾经是压力最大的部门,去年破天荒第一次不用加班。

原因是什么呢?因为在这一整天里客户该看到什么产品,他们挑选了什么产品,他们的收藏夹里选了什么产品,下次他们再登录淘宝该给他们推荐什么商品,这些过程完全都是由机器自动完成。去年80%的客户服务是通过机器人完成的,不再是人工服务。

其实不光是双十一,每一天大家表面上看到的淘宝是一个网站,但是它最核心的其实是一个巨大的搜索和推荐引擎,让每一个人上来都能得到个性化的服务。每天上亿人在淘宝挑商品、做买卖,这些个性化的服务如果都由人来完成,那么淘宝雇再多的人无济于事。这就是我们这个时代第二个最重要的特征,由机器取代人进行决策、提供服务。越来越多的场景只有靠机器、靠人工智能才能完成以前靠人没有办法完成的海量服务和个性化的服务。淘宝的核心推荐引擎就是人工智能的运用,它由很多种复杂的算法糅合在一起,每天进行海量数据的自动处理。它是一个庞大的机器集群,不仅仅是一批人,更重要的是有一个巨大的人工智能的支持,才能完成大家今天体验到的这些服务。

这两年大家才开始听到大数据、人工智能这些热门得不能再热门的词,但实际上认真想一下,互联网最成功的这几家企业,本质上都是基于人工智能和大数据。你在谷歌上输入任何一个关键字,不到一秒的时间,它就能把全网相关的信息推送给你,这完全是超出人的想象的一种服务,只有靠机器才能做到。

未来商业会全面智能化

什么叫智能化呢?就是未来商业的决策会越来越多地依赖于机器学习,依赖于人工智能。机器将取代人,在越来越多的商业决策上扮演非常重要的角色,它能取得的效果远远超过今天人工运作带来的效果。

当然大家可能对于人工智能的发展未来有很多种不同的理解,这是一个相对来说比较新的领域。

随着AlphaGo在最古老的围棋上面打败了人类,人工智能的概念今天已经非常普及了,人工智能毫无疑问是未来最重要的一个趋势。当然对于人工智能未来的技术变化有很多种不同的观点和争论,比如说人工智能到底能不能够在根本上取代人,挑战人的存在,或者退一步,人工智能在多大程度上可以像人一样思考。

今天人工智能的技术核心,其实是机器用笨办法去算,它的所谓学习是通过概率论的方法,不断地去通过正反馈来优化结果,而不是像人一样去思考和学习。这种机器学习的方法必须基于海量数据的校验,必须基于算法的一个不断反馈过程。所以我把这个阶段人工智能带来的商业价值,它所实现的路径叫做数据智能。

因为到今天为止小孩是怎么学语文的,小孩是怎么学会算法的,这些东西我们都没有任何理解,更谈不到把这种理解变成机器可以去实现的智能。所以我们今天在看得见的未来,这也许是5年、也许是10年,甚至更长一点的时间内,我们讲到的人工智能都是机器智能,是机器基于海量数据能够快速迭代优化,做到比人更好的效果。

最近最典型的案例就是谷歌翻译。传统上我们想用人的学习方法去做翻译,机器怎么都做不过人,但是过去十几年用所谓的深度学习方法,其实就是机器智能的方法。通过所有的人提供海量的数据,机器现在能够快速提高它的准确率,从几年前百分之四五十,快速提升到今天百分之九十几以上,完全能够达到商用的水平。

所以谷歌翻译成了今年非常热门的一项服务,越来越多的基于机器智能的服务,会成为我们生活中离不开的服务,它的本质是用机器做到了人做不到的事情。

接下来你大概就想知道这个看起来很高大上的叫做数据智能的东西,要怎样才能融入到具体的商业里面去呢?

三位一体:大数据化、AI算法化和产品化

简单来说,就是要做数据化、算法化和产品化这三件事情。

先讲数据化的概念。由于互联网的存在,由于广泛的连接,淘宝其实是能够准确地记录下来所有用户全部的在线行为的,而这些数据本身可以用于优化他下一次来淘宝的体验,所以没有这个数据化的积累就没有后面的一切。

第二个算法化。算法这个词可能一般的人听了会懵,其实讲算法之前先要讲一个概念叫建模型。一个人在某个场景下会怎么决策,先要把他抽象成一个模型,然后要找到一套数学的方法,让它能够收敛,用模型去优化他的决策。然后第三步才是把这个算法用计算机能够理解的程序写下来。

大家一般讲的算法是指第三步,用代码写下来的一套回归的程序。但它前面有两个关键的概念, 一个是建立模型,第二个是这个模型要用某种数学方法解决,能够得到一个可以收敛的结果。然后第三步才是计算机的程序。算法可能是这个时代创造巨大价值的一个新概念,值得展开讲。

我们还是回到历史上最出名的一个算法叫做PageRank,这个算法支撑了谷歌这个5000亿美金公司的起步。想想看我们一开始讲到的那个案例,你上网在一个搜索框输入一个关键字,全网的信息就能按照关联度推荐给你。

怎么组织全网这个信息?怎么去理解相关性?怎么把最相关的信息给你推送出来?谷歌最早的创始人在斯坦福读博士的时候就想到了一种模型,这个模型根据网站跟网站之间的链接和指向,来代表这个网站的相对重要性。然后他把所有网站的链接都记录下来,这就完成了数据化。但更大的挑战是你怎么来算它的相关性?他就设计了一套算法,一套数学的公式,这个相关性就是根据这个公式来推导的。

然后才是第三步,由于计算能力的大发展,能够把全网的数据都通过这个数学公式马上计算出一个结果。你输入关键字,通过了这个巨大的搜索引擎,实际上它的核心就是这个算法,就能给你一个特定的结果,这就是算法起的作用。

算法要真正发生作用,离不开第三个关键的词,就是产品化,你一定要建立产品跟客户的直接连接。这个产品在我们刚才讲到的搜索案例,就是搜索结果页,更完整地讲是一个搜索框加上你看到的那个搜索结果。

搜索结果页这个产品建立了智能引擎和用户之间互动的桥梁,你的每一次点击,你看了这个搜索结果之后你是点了第一条还是第三条,还是甚至翻到了第五页。用户的行为通过数据化的方式告诉了这个机器智能的引擎说,你给我的结果相关性够不够高,智能化程度够不够高,机器再根据这个结果去优化它的算法,给出一个更好的结果。

但是机器跟人不一样,它可以永远不知疲倦的24小时以秒级的速度在更新它的结果,所以它的进化速度非常非常快,从一个开始并不很精确的结果,很快就能达到一个非常精确的结果。产品化是非常重要的一个环节,因为它提供了一个反馈闭环,而反馈闭环是任何学习的一个前提条件。

反馈闭环这个词用得稍微有点专业,但实际上大家都有非常深刻的切身体会。你无论学什么,比如说学打羽毛球,你动作对不对,一定要教练给你一个反馈,你改了以后是往正确的方向更对了,还是纠偏纠得更错了,教练要再给你一次反馈。这实际上就是学习、修正、调整、反馈。过程中你就能够学习、进步、提升,人是这么学习的,机器也是这么学习的。

机器能够有智能的唯一原因,就是笨机器用笨方法学,但是因为它计算能力强,数据量足够大,最后可以比人更快速地达到一个效果的优化。通过数据算法和反馈闭环,机器就能学习,机器就能进步,机器就能拥有智能,而商业就能够实现智能化升维。

看到这里你可能会有点担心,说我是一个很传统的企业,那些算法我也不懂,海量的数据计算我也不懂,那么多数学天才我到哪儿去找?

实际上对于大部分的传统企业来说,你不用担心这些。就像云计算,谷歌、阿里巴巴、亚马逊这些企业都在把它当成一个公共服务在提供,所以将来你不用去担心算法、计算这些,这些都会成为智能时代的基础设施。

你要做的是什么呢?你怎么赶上这个智能化的浪潮?其实核心在于你能不能够创新地实现产品化,把你的核心业务流程在线化,这样的话数据才能被记录下来。然后你可以在这些大互联网企业提供的算法工具包里,去挑一个合适你的算法。三位一体,产品提供反馈闭环,数据作为原料,交给算法去处理,你的业务就变成了一个智能业务。你就能比你的竞争对手每天都越跑越快。这是未来竞争能够脱颖而出最重要的一个秘诀。

到底怎么帮助一个企业在数据方面取得足够的成功,怎么样去利用数据智能真正把自己的企业变成一个精准商业的模型?

在网络协同和数据智能方面,要完成在线化和数据化是一个很大的挑战,这也正是一个最大的机会。

活数据

这一讲重点介绍一个在实操方面很有价值的新概念,叫做活数据。

活数据这个词也是我创造的,大家听到比较多的一个概念叫大数据。大数据对于描述扑面而来的海量数据有很大的帮助,大数据的标准定义是由英文的四个词组成的,对应中文的意义是大量、多样、快速、高质量。

但是这四个词是在描述一个事实,描述数据之大、之快,它并不能帮助我们更好地做商业决策,到底怎么用数据?数据足够大就行了吗?

我后来发现,活数据这个概念可能能帮助大家更好地把数据用起来。活数据还有两个概念:第一个数据是活的,也就是说数据是在线的,可以随时被使用;第二数据必须是被活用的,也就是说数据是在不断地被消化、处理,产生增值服务,同时又产生更多的数据,形成数据回流。

活数据的特征

接下来讲讲活数据的几个重要特点。

首先,活数据是全本记录而不是样本抽查。

虽然按照统计方法一个随机样本可以相当程度上推导出全局的特征,但是商业的环境是动态的、不断变化的。一个隔很长时间才收集到的样本,无论如何也只能描述静态的一部分。

大家都很熟悉,传统时代收集数据是一件很麻烦的事情,你要有问题,再设计问卷调查,再去找人专门填问卷,然后才能收集到一些数据。

但互联网的第一步是连接、是在线,只要你把你的业务在线了,你就会得到巨大的好处。也就是说用户的行为在互联网上都能留下清晰的印迹,而这些行为直接记录下来,就是你对这个客户全面的了解。

淘宝并不需要去抽样调查,去问客户对淘宝的服务是否满意。淘宝所有的用户,他们每一天或者说他每一次上淘宝,所有的行为都会被记录下来,他们看了哪些商品,在某一个商品的详情页上停留了多久,他们最后购买了什么,这些数据都会自动地记录下来。所以活数据的一个前提是数据记录的成本大幅下降。

第二,先有数据后有洞察。

以前的调查方法都是先要制定一个问题,你想了解一个什么问题,想测试某一个假设,那么你就要根据那个问题去收集相关的数据。这中间最麻烦的是,只要你发现自己遗漏了什么,或者你想问什么新的问题,几乎就必须一切重来,再去收集相关的数据和信息。

但是在活数据的时代,整个做法是颠倒过来的。也就是大家听到的另外一句话,我们重视的是相关性而不是因果性,而且由于数据存储和计算的成本足够低,我们可以把所有相关数据都记录下来,然后在业务的发展过程中去看哪一些数据的使用能够带来洞察,帮助我们重新去决策商业。

先有数据记录,然后才有分析和洞察,最大的好处是避免了事后希望了解某些问题,然后再重新设计问卷、收集数据,这样的传统方式所带来的巨大成本。

第三,就是活用,数据一定要被活用。

数据就是决策,或者说数据智能的引擎机器要直接做决策,而不是传统的利用数据分析来支持人的决策。只要是数据被用来支持人的决策,活数据的闭环就断线了。

大家到淘宝上输入一个关键字搜寻你想要的商品,那么你会看到什么?你的第一次点击之后再给你看什么?这些其实都是机器在做的,没有任何人的干预,是数据智能的算法自动形成的,如果靠人来完成这样的决策几乎是不可能的。

这三个特征结合在一起也就是反馈闭环的概念,活数据让整个反馈闭环能够跑起来。

数据智能的落地

你的业务跑的时候自然会产生数据,数据被记录下来,数据被算法处理,然后直接形成决策,指导你的业务,然后通过客户反馈不断地优化你的决策。这样的话,整个企业的业务发展就走上了活数据反馈闭环的正循环,也就是走上了智能商业的发展道路。

从活数据的角度来考虑商业运营的话,感受会很不一样。比如有人一听到大数据就会觉得好像跟自己没有太大的关系,我就是个小公司,数据量也不大,你们讲的那一套人工智能什么的跟我都没关系。

但是如果从活数据的角度来看,就会很快理解数据量的大小是个相对的概念。让数据在你的业务中成为它的自然组成部分,让机器成为你决策中的一个环节,你的商业就会走入智能化的快道。

第二个非常重要的概念就是刚才讲到的, 活数据一定是要直接让机器来做决策的,不能够让人来做决策,因为只要人一决策它就形成了一个闭环的短路。

举个例子,这个概念就是说很多企业不太理解数据工程师跟BI分析师的差别。BI就是Business Intelligence,稍微大点的公司都有这个部门,他们也就是所谓商业分析部门,他们最核心的也是做数据,但是它是把数据分析成一个一个报告。

然后核心又是回到我们讲的那个管理概念,支持高管做决策。他们的数据其实是离线的,目的是支持决策。但真正的活数据一定是要用数据本身产生的洞察来直接变成商业的决策。

我给大家举个例子,这一点其实很不容易理解,我们也是花了好大的学习成本才意识到这个差别。

早期我们的数据部门想帮助淘宝卖家变成数据化运营,所以我们给淘宝的卖家后台不断地推送数据分析报告,但是发现使用率非常低。因为大部分的卖家并不知道怎么用这些数据分析报告,而且产生的实际效果也不好。

我们后来意识到其实卖家真正需要的不是去理解这些数据,而是让数据直接帮助他们更快更好地做决策,让他们的整个运营效率有一个质的飞跃。

所以我们第一个比较成功的产品说起来非常简单,就是给卖家的后台装了一个行动按钮,告诉他按一下这个按钮,整个店铺的陈列展现就会被自动优化,然后自然会带动你多少销售额的提升。

对于卖家来说,要做的非常简单,就按一下这个按钮,它就是个决策。这个行动其实就是淘宝的后台通过活数据的运营,对海量数据的算法分析,智能化地帮助卖家自动优化他的店铺展现。但是如果这个决策不是由数据、由机器直接做的话,它是达不到这个效果的。

要想让自己的企业智能化,有很重要的两步:第一个,是看以前强调的你的核心业务有没有在线化;第二个,你的业务环节中间有没有任何一个环节可以被机器决策所取代,而不再是人做决定。

只要这两步跑起来的,不管你企业的大小,也不管你所在的领域,你就是一个互联网时代的新物种,你就能踩上智能商业的快车,比别人要加速演化。

小结

这一讲从活数据的角度来示范数据智能的落地。

摘自:曾明·智能商业20讲(收藏版)
https://www.jianshu.com/p/02096efb5658


Kotlin 开发者社区

国内第一Kotlin 开发者社区公众号,主要分享、交流 Kotlin 编程语言、Spring Boot、Android、React.js/Node.js、函数式编程、编程思想等相关主题。

越是喧嚣的世界,越需要宁静的思考。

【企业数字化转型】网络协同和数据智能双螺旋驱动——活数据:流动创造价值...相关推荐

  1. 科天云会议产品升级,打造企业数字化转型办公协同新基建

    2020年11月24日,科天云会议宣布升级科天章鱼云并发布科天aPaas办公协作中台.依托科天aPaas办公协作中台核心技术架构,科天章鱼云10大音视频通讯核心能力,科天云会议将以便捷轻量的SaaS+ ...

  2. 企业数字化转型方法论

    用区块链从新定义生产关系,用云量.用数量.移动指数.物联网指数.数据的应用和开放能力重新定义生产力,实现现代企业的五化管理工作移动化.数据产品化.分析可视化.管理云化.业务社交化.笔者认为这就是企业数 ...

  3. 河南发文明确!这类企业数字化转型有了“时间表”

    促进"双碳"目标实现,河南又有大动作.近日,河南省制造强省建设领导小组办公室印发了<2022年河南省水泥钢铁焦化行业数字化转型工作方案>.其中明确,"到202 ...

  4. 企业数字化转型,失败率80% ,大批CTO被裁...

    作者| Mr.K   编辑| Emma 来源| 技术领导力(ID:jishulingdaoli) 麦肯锡发布的一份报告显示,中国企业数字化转型的成功率仅为20%.也就是说,假如你所在的企业要进行数字化 ...

  5. MobTech观察 | CSDN:企业数字化转型如何提升段位?杨冠军畅谈企业数字化前世今生

    近日,MobTech袤博科技合伙人.首席数据官杨冠军受邀撰写的文章<企业数字化转型的前世今生>登刊CSDN最新一期<新程序员 003:云原生和全面数字化实践>.该杂志由 50 ...

  6. 数字孪生:企业数字化转型的支点

    数字孪生:企业数字化转型的支点 文 | 龙小昂 摘要: 随着物联网.大数据.人工智能等技术的发展,新一代信息技术与制造业正在深度融合,人们与物理世界的交互方式正在发生转折性的变化.数字化转型,正在成为 ...

  7. 【报告分享】中国数据智能应用趋势报告:解码数据中台最佳实践,企业数字化转型新引擎.pdf(附下载链接)...

    大家好,我是文文(微信:sscbg2020),今天给大家分享爱分析于2020年10月份发布的报告<中国数据智能应用趋势报告:企业数字化转型新引擎,解码数据中台最佳实践.pdf>,希望对您有 ...

  8. 企业数字化转型:聊聊数据思维!

     关注ITValue,看企业级最新鲜.最价值报道! 作者丨石秀峰 笔者在<深入聊一聊企业数字化转型这个事儿>一文中给出了数字化转型的定义,即:通过应用数字化技术来重塑企业的信息化环境和业务 ...

  9. 网易数帆陈谔:云原生“牵手”低代码,加速企业数字化转型丨数据猿专访

    数据智能产业创新服务媒体 --聚焦数智 · 改变商业 近日,网易数帆在第十届全球云计算大会上斩获"云鼎奖"2021-2022年度优秀解决方案奖项.随着在云原生领域布局的持续深化,网 ...

最新文章

  1. [Unity3D]总结使用Unity 3D优化游戏运行性能的经验
  2. 华科发布报告:41%研究生学霸是单身!
  3. DRF的版本控制,认证,权限和频率限制
  4. 每天一道LeetCode-----摩尔投票法寻找给定数组中出现个数大于n/2或n/3的元素
  5. php怎样创建csv文件,如何使用PHP创建CSV文件?(代码示例)
  6. CSS解决无空格太长的字母,数字不会自动换行的问题
  7. 2007年7月23日旅游
  8. Chrome浏览器书签手动同步
  9. 代理服务器的速度慢的原因是什么?
  10. openlayers3 ol3热力图 json
  11. winedt 破解方法和软件下载
  12. JDBC操作数据库——resultset的操作小窍门
  13. 从零开始的Node.js新闻爬虫实验项目(四)东方财富网、网易新闻、Pixiv的爬取思路
  14. Ceph知识树和技能树
  15. 【认证】【DVB】T2 PLP
  16. 安卓学习之学生签到APP(一)
  17. mysql时区错乱_记一次线上mysql时区错乱
  18. MySQL约束条件及外键的关系
  19. 如何组建LoRaWAN无线网络以传输温度数据
  20. 【JY】复合材料分析利器—内聚力单元

热门文章

  1. python jpg压缩_python 实现图片批量压缩的示例
  2. Python简笔画发射爱心
  3. Git Basics - Viewing the Commit History
  4. C++: 计算其元素受制于的矩阵的逆模算术(附完整源码)
  5. java poi- 实现 word Excel pdf ppt 转 HTML
  6. html5 便签墙,自己制作画毡墙
  7. 设计原则:单一职责原则
  8. pytorch-自我使用笔记
  9. R语言-将数据按照月份、季度、年份划分及求某个代码(地名、产业名等)对应的累积值
  10. linux下Configure命令-ZZT