出處: http://itrustdata.blog.51cto.com/13246181/1961018

人人都在谈数据驱动,如数据化管理、数据驱动的运营、或者数据驱动的测试等,关于数据驱动的应用的讨论很多,但关于数据驱动基本原理的讨论较少,本文试图追根溯源,谈一谈数据驱动的基本原理:数据如何驱动?能够驱动什么?

谈原理之前,先说一个我个人的经历。

有一次我老婆从首都机场T3航站楼回家,我帮她叫了一个滴滴,后来我看到账单显示是80多元,路程是20多公里,而我家离机场不过7-8公里,一般滴滴专车的费用是40多元,显然司机是绕路了,滴滴的APP上同时也显示了一条信息,大致意思是:车费异常,是否需要申诉?

我点击了“需要申诉”,滴滴APP立刻弹出一个界面,大意是:您有很好的信誉记录,接受您的申诉,此次收费按42元计算(具体数字忘了,反正是按正常的计费水平)。

当时觉得,哇,滴滴这个功能太牛了,给客户的体验太好了!

试想一下,在滴滴之前打出租车,类似状况是完全不同的场景:

1,  你可能根本不知道司机绕路了

2,  你事后发现司机绕路了,但你下车时忘了要票据,无法举证

3,  你当时就发现司机绕路了,跟司机要了票据,但票据上只有里程和时间,而没有出发地点、目的地和行车路线,你无法证明司机绕了路

而滴滴则彻底改变了这一状况:主动提醒你是否需要投诉,你提出申诉后,立刻就做出令你满意的处理!

滴滴的投诉处理如此贴心而智能,它是怎么做到的呢?如果我们对数据,以及数据与信息、知识和人工智能的关系有一些基本的了解,就能理解滴滴这种投诉处理的运作机制。

数据金字塔可以帮助我们理解数据与信息、知识和人工智能的关系。

数据本身是没有意义的,如果它不能转化为信息和知识的话;但如果没有数据,或者数据匮乏,信息和知识的产生也就成了无水之源。

  • 如果你经历了某件事,把它记录下来。

  • 如果你记录了某件事,把它上传。

  • 如果你上传了某件事,分享它。

这意味着每个人都成为数据的采集、处理和分享者。

在上述滴滴的例子里,滴滴显然做到了这一点:乘客的所有用车经历都由系统做了记录、上传和分享。

企业在数据层面存在的两个问题

1. 数据存在缺失:

比如我所服务的一家互联网公司,他们就没有关于客户推荐的数据(有多少客户向他人推荐了产品),这是一个很小的例子,但数据缺失是企业普遍存在的现象,原因在于目前企业所拥有的数据主要来自于各业务系统, 如 CRM 和 ERP 等,而业务系统是为完成特定业务而设计的,数据只是副产品而已,必然导致决策所需的一些数据是缺失的;

2. 数据采集的无效性:

传统企业很重视数据的采集,例如他们会要求门店的员工将接待客户的相关信息记录下来,但所记录的数据质量不高,用途极有限,这里面原因有二:

一是采用纸笔或者Excel来记录,过程比较麻烦

二是他们只是单纯的数据采集、处理和分享,但数据的应用却基本和他们无关,员工采集数据只是应付了事,缺乏内在的动力。

互联网公司也同样存在数据采集无效的情况,如一家互联网公司通过QQ和潜在客户沟通,他们所了解到的客户需求信息记录都在QQ里,如果要想过一段时间再跟进某个客户,往往很难找到这个客户的相关信息,QQ里记录的这些数据实际上无法为业务所用。

要解决企业在数据层的这两个问题,需要企业基于经营决策需要,对数据进行统一的规划:需要哪些数据?如何采集?以什么方式记录?

比如上面所说的互联网公司,如果一开始就有关于潜在客户开发需要哪些数据支持的规划,就有可能设计出一个结构化的需求沟通工具,既可以有效记录客户的需求信息,又利于后期的数据分析。

如果没有对数据的统一规划,企业的数据将很可能会处于“ROT垃圾状态”,即冗余(Redundant)、过时无用 (Obsolete)和琐碎(Trivial)。

信息:是被组织起来的数据,是为了特定目的对数据进行处理和建立内在关联,从而让数据具有意义,它可以回答谁(who)、什么(what)、哪里(where)、什么时候(when)的问题,对于企业经营而言,信息的作用在于过程管理和绩效评估。

在上述例子里,滴滴的系统将时间、出发地、目的地、行驶路线、会员等资料整合起来,就形成了一条完整的乘客乘车信息,从而实现了对司机服务过程的监控和管理。

将数据转化为信息的阶段,企业存在两个问题:

1. 缺乏有效的数据分析工具:

少数大型企业(如银行和电信公司)一般拥有BI系统可以实现将不同源的数据进行整合、并支持在线分析处理和报表,但很多企业还是依靠Excel进行分析和报表,比如一家拥有上百家门店的中型珠宝公司,老板很重视数据,强调用数据说话,每次开经营分析会,大区经理就要熬夜用Excel来做各种分析报表,效率很低,也很让区域经理窝火:我是带兵打仗的,却需要我做这么多案头工作!

2. 缺乏将数据转化为信息的分析能力:

有一定规模的企业现在都拥有大量的数据,例如我们从一家互联网公司各业务系统导出来的数据,就达数千万行之多,如何从这些数据里看到数据之间的联系,将他们组织成有意义的信息,无疑是一个挑战,一般的企业不具备既了解业务又会数据分析的人才。

这导致企业所拥有的数据里,只有很少一部分得到了有效处理,变成了有价值的信息,而大部分数据停留在其原始状态:只是一个无意义的客观存在。

知识:对信息的总结和提炼。是基于信息之间的联系,总结出来的规律和方法论,主要用于回答为什么(why)和怎么做(how)的问题,在企业里的应用包括问题诊断、预测和最佳做法。

举个例子,北京夏季高温多雨,8月份温度在20-36度之间,平均降水天数12天,这是根据多年资料总结出来的北京气候的规律,这个知识有三个作用:

1,  问题诊断(回答为什么),如这个知识解释了北京今年8月份为什么下了那么多雨

2,  预测:明年8月份北京很可能温度还在20-36度之间,平均降水天数12天

3,  最佳做法:8月份来北京旅游穿短袖衣服即可,体弱者要带长袖,最好带伞。

滴滴的系统里应该有一个关于如何处理司机绕路问题的知识库,否则就不会这么智能化地完成投诉处理了。

大多数企业在知识层面做得较差,一些企业虽然建立了知识管理系统,但并没有一个有效的知识生成、应用和更新机制;更多的企业没有知识管理的体系,这些企业存在大量隐性知识,比如企业里总有一些销售高手,他们凭直觉或经验能够取得突出的销售业绩,他们也许说不清楚,但他们知道怎么筛选潜在客户、知道何时跟进、知道何时应该促成,这就是所谓“隐性知识”,隐性知识显得如此神秘,导致很多管理者认为销售高手是天生的,是无法复制的。

有效的数据驱动机制将能实现企业里隐性知识显性化,显性知识结构化,从而让企业里的每个人可以随时随地获取相关知识进行业务操作。

以销售为例,克隆一个销售高手或许不可能,但从数据的角度来看,如果销售人员的销售行为资料都能够得以完整记录,并得到有效整理和总结,就可以提炼出销售的最佳做法,从而让每个销售人员都可以在销售中运用这些做法。(对这个议题感兴趣的可以看看Jenny Dearborn所著《销售的革命》,它以讲故事的方式阐述了数据如何帮助销售管理者进行问题诊断、预测以及销售最佳做法总结)

人工智能:机器对信息和知识的自主应用

人工智能是系统基于数据、信息和知识,形成类似于人脑的思维能力(包括学习、推理、决策等)。

在信息和知识层面,数据都是提供决策支持作用,而到了人工智能阶段,则是系统模仿人类应用信息和知识进行自主决策了。

我所经历的滴滴司机绕路的例子,就是滴滴的系统根据我的乘车信息,以及滴滴系统里的知识库,由系统而非滴滴员工完成了一个投诉处理过程。

实际上,这样的应用早已很普遍,亚马逊著名的推荐机制也是类似的,系统代替了员工,不厌其烦地向顾客推荐他可能感兴趣的商品。

不少人认为,数据金字塔的顶端是智慧而非人工智能,对此我有不同看法:智慧不是建立在知识基础上的,知识不是智慧的必要条件,很多高僧很有智慧,但并没有很多的知识,比如六祖慧能从小不识字,却能闻经解义。

原因在于,知识来源于经验(数据),来源于人类对这个三维世界的观察,而智慧可以无需通过经验,有可能通过与高维度建立连接而获得(北大的刘丰教授有一个演讲,名字叫《开启你的高维智慧》,大家可以参考)

而人工智能则一定要建立在数据基础之上,没有数据,无论是专家算法还是深度学习都无用武之地,有了数据,计算机才有可能通过专家算法或深度学习形成知识,进而具备类似人类头脑的思维能力。

从这个意义上来说,人工智能永远无法超越人类的智慧。由此我们也可以看到数据的局限性:它可以将人类的理性发挥到极致,但它只会模仿却无法创造,它无法替代人类的感性和直觉,而正是这份感性和直觉,让生命多了一些有趣和柔软,真正的创造也由此发生!

數據驅動的到底是什麼相关推荐

  1. 數據移動時發生***識別欄位其外顯值只有當使用了資料行清單且 IDENTITY_INSERT 為 ON 時才能指定...

    當數據在兩個相同結構的表中移動并且發生: ***識別欄位其外顯值只有當使用了資料行清單且 IDENTITY_INSERT 為 ON 時才能指定的錯誤時 用以下方法解決: SET IDENTITY_IN ...

  2. linux串口拼接,Linux下串口操作之數據拼接

    串口操作中,特別以非阻塞的方式讀取和發送數據,做好進程之間的同步很重要.有時我們會發現這樣一個問題,在進行read操作時,一次read不能獲得一個完整的數據幀,這就好比你買了一個電腦,送貨的先把顯示器 ...

  3. solr 4.8 mysql_solr 4.8+mysql數據庫數據導入 + mmseg4j中文全文索引 配置筆記

    1.如何將solr部署,請參考之前的文章 2.按上述配置好后,在solr_home文件夾中,將包含collection1文件夾,這就是solr的一個實例.下面我們來看看collection1中的文件內 ...

  4. 兩台SQL Server數據同步解決方案

    [IT168 伺服器學院]複製的概念 複製是將一組數據從一個數據源拷貝到多個數據源的技術,是將一份數據發佈到多個存儲站點上的有效方式.使用複製技術,用戶可以將一份數據發佈到多臺伺服器上,從而使不同的伺 ...

  5. 英特尔hd630驱动,intel hd graphics 630驅動

    如果您收到此錯誤訊息,請參閱錯誤解決方案檔 :所安裝的驅動程式未針對這台電腦進行驗證. 相關主題. 瞭解Intel® Graphics Driver 版本號碼 · Intel® Graphics .. ...

  6. groovy oracle数据库,使用Groovy /搖籃到用什麼驅動程序連接到Oracle數據庫

    compile 'org.postgresql:postgresql:9.3-1102-jdbc41' compile 'mysql:mysql-connector-java:5.1.31' comp ...

  7. Vmware中mac snow leopard蘋果雪豹系統驅動程式安裝方法

    在Vmware中安裝蘋果雪豹驅動程式有兩種方法,第一種方法是安裝vmware tools,第二種方法是安裝VMsvga2驅動程式.下面我會把這兩種方法都介紹一下: 快速導航:     1:安裝Vmwa ...

  8. rodbc 连接oracle,R語言 使用RODBC連接oracle數據庫

    使用R語言有多種包可以連接oracle數據庫,我今天在這里講一下使用使用RODBC連接oracle數據庫. 1. 如果你的本地是windows系統的話,你需要安裝oracle客戶端. 2. 然后需要在 ...

  9. wildfly10 配置mysql_WildFly配置MySql驅動

    配置WildFly的JDBC驅動一般有兩種方式 (1) 以module的形式安裝: (2) 以deploy應用程序包的形式安裝: 不過對於WildFly以domain模式運行而言,最好采用第一種mod ...

  10. 多块英伟达K80显卡linux安装,ubuntu14.04下NVIDIA Tesla K80 、GTX1080顯卡驅動以及Tensorflow、Python的安裝教程...

    目錄 1 安裝NVIDIA Tesla K80顯卡驅動 1.1 准備工作 1.1.1 證明存在GPU lspci | grep -i nvidia 結果例示 01:00.0 VGA compatibl ...

最新文章

  1. 5软件开发与软件测试
  2. 阿拉德之怒显示服务器错误,阿拉德之怒网络异常怎么办 安装失败怎么办
  3. 井下三专两闭锁的内容_矿用高压防爆开关:煤矿井下高低压防爆开关五防电子锁保护装置...
  4. idea使用ant配置_Linux下Jenkins+ant+jmeter[上]
  5. ubuntu11.10+git+svn works
  6. Rearrange an array of positive and negative integers
  7. ORACLE 11g 自动内存管理
  8. 关于 C语言的 按位取反 ~
  9. 网络分析仪-inSSIDer
  10. Linux驱动(8)--内核编译与配置
  11. pythoncsv数据类型_pandas读取CSV文件时查看修改各列的数据类型格式
  12. 【报告分享】B站商业化探索频频,品牌方如何布局“小破站”营销.pdf
  13. java 运算符的程序_【Java】运算符
  14. Linux 虚拟机配置静态IP地址
  15. APP开发:线上教育APP盈利模式分析
  16. 信息系统典型的开发架构
  17. 经济法论文选题有什么推荐吗?
  18. TravelFlan携小猴问问亮相ITB,看人工智能如何化解旅游痛点
  19. 基于JAVA公立医院绩效考核系统计算机毕业设计源码+数据库+lw文档+系统+部署
  20. 利用随机数实现指定概率抽奖

热门文章

  1. linear regreesion 线性回归
  2. 郑州中小幼计算机初中级,郑州市中小幼计算机等级考试大纲.doc
  3. 深度学习-BP曲线拟合(预测)
  4. 【转载】HTML自定义滚动条(仿网易邮箱滚动条)
  5. Android 十大布局
  6. 苹果待处理订单要多久_苹果官网准备发货到发货要多久呀?
  7. jar a java exception has occured_Java Virtual Machine报错:A Java Exception has occured
  8. python 开发微信小游戏_教你快速开发一个微信小游戏好友排行榜
  9. c语言bcd错误数字还原,Windows10开机出现恢复界面且提示错误0xc0000034怎么办
  10. f452虚拟服务器,F460 F452 获取超级密码 解决 LOID 注册断线 保留telnet 无需ttl 不用拔光纤...