本文根据美国出行平台 Lime 数据负责人吕厚昌(Alex Lu)在神策 2019 数据驱动大会上发表的《Make Data Your Killer App》主题演讲整理而成。本文将为你重点介绍大数据成功的九大思路,包含以下内容:

●     数据文化

●     质量第一

●     无快不破

●     数据平民化

●     决策闭环

●     产品及运营闭环

●     数据安全

●     善用人工智能

●     借力打力

把数据做成杀手 APP”

智能手机时代,每个人的手机上都有很多 APP,我们每天都在用各种 APP。没有 APP 我们的生活将变得不方便。大数据时代,数据对企业从业者就像 APP 对个人一样,我们也要天天用。没有数据,从业者的工作也会变得举步维艰。我们要用数据去跟老板汇报业绩,用数据帮助我们做每天的决策,用数据把我们的产品运营变得更智能。我们要像做杀手 APP 一样做数据,就是希望把数据变成从业者每日的刚需 APP。

“我的第一次

我在清华学的是自动化,出国学的是电子工程。我跟大数据第一次结缘是在 1997 年。当时,AMGEN,这个目前也是美国千亿市值的药厂,没有自己的数据团队。我们被请来就是要帮他们建一个数据仓库。项目启动会上,对方极其重视。所有项目参与人员都被其 COO 的演讲搞的热血沸腾。我当时英文很烂,但有两句话还是听懂了,第一句是“把数据变成 AMGEN 的竞争优势”,第二句是“大家大胆干不差钱”。

通过半年的努力,十几个人组成的团队完成了项目。后续项目效果惊人。数据仓库让 AMGEN 更聪明做决策,产品销量提升非常快,也赚了大量的钱。作为知名药厂,AMGEN 除了花费大量时间与精力研发新药以外,其核心业务就是卖药。他们有强大的营销团队、花大量的资金做广告,按现在的话就是“打品牌”。同时他们要花力气打通药店、保险公司等售卖途径,按现在的话就是“建渠道”。更重要的是他们要搞定医生网络,因为只有医生才可以开售他们的处方药,按现在的话就是“做转化”。我们搭建的数据仓库的确成为了这家药厂的竞争优势。

其实在参与这个项目之前我还做过其他项目,我做过 WEB 网页开发、电子、商务、CRM 等系统的开发。但一直不知道自己兴趣在哪里,直到做完药厂项目之后,我知道了,数据就是我要做的。虽然技术挑战重重,但真正吸引我的是数据所能带来的不同,以及真金白银的价值。

做互联网数据”

后来有幸在互联网初期加入了雅虎,成为其第一个做数据的工程师。虽然当时没有大数据的说法,但其数据量的确很大,而且是不断暴长。用一句话概括我在雅虎 7 年的工作,就是“如何用数据更好了解用户,了解成千上万的用户,了解上亿的用户,并能为他们不断提供更好的服务”,一切为用户。

后来,在一次行业大会中,我认识了后来谷歌的同事。当时我问他,雅虎的流量是谷歌的十倍,可是营收却跟谷歌差不多,这到底为什么?他说,你要知道答案,加入吧。就这样,我加入了谷歌。也是因为这份好奇心,让我深入了解了谷歌的商业产品和盈利模式。用一句话总结我在谷歌 6 年的工作,就是“在保证用户体验的前提下,如何用数据和技术让搜索为客户带来更多的价值”。

离开谷歌之后,我加入了百度。在百度认识了文锋和神策的小伙伴们,在百度的 6 年里,我的工作也始终围绕着大数据,云计算,人工智能开展,开阔了眼界。离开百度后我加入了 Pinterest。Pinterest 是图片瀑布流 APP 的鼻祖。在 Pinterest,开始第一次践行用做 APP 产品的思路做数据,让数据成为公司每个人的日常工具。

做 O2O + 互联网数据”

一年前,我跨界出一小步,出墙加入了 Lime。Lime 尝试重新定义出行,用绿色电动滑板车,解决出行“最后一公里”的问题,在这里,数据是每个人每天的刚需。我们继续沿用做 APP 产品思路做数据,并把数据,云计算和 AI 统筹考量,以加速产品创新闭环和精细运营闭环。

20 年前,实现数据价值是艺术,需要天时地利人和,所以几乎有 80% 的项目会失败。今天,实现数据价值要靠技术,据 2018 年的一项统计,80% 以上的企业都把数据和 AI 作为其公司战略重点,当下已经没有人忽视大数据价值。著名的投资人 Mary Meaker 在 2019 的互联网趋势报告里提到,1995 年之前成功的企业是靠人工抓数据取得竞争优势,1995 年-2000 年,是凭借像互联网抓到的电子数据,获取竞争优势,而 2000 年至今的二十年中,就是用好大数据/AI 技术来实现更多数据价值,获取竞争优势。

目前,数据/AI 技术令人眼花缭乱。如此繁多选项也让大数据从业者犯难。也许未来大数据和 AI 技术会整合到头部几个大平台上。作为大数据技术平台从业者,成为头部平台的一部分也成为很多人的梦想。但目前技术还没有发展到那一步,做成功的大数据依然挑战连连。接下来,我会与大家分享关于做成功大数据的一些感想。

1.数据文化

人们总说数据文化是 CEO 的事,不错,没有 CEO 的支持,哪来的资金投入。但是企业不能指望 CEO 懂大数据。大数据的负责人,公司各业务负责人有责任将公司的数据价值及愿景清晰地描述出来,给 CEO 看,也给全公司看,推动公司的数据文化。

读过《The Lean Startup》这本书的朋友都知道,数据是把想法和实践链接迭代并闭环的关键。如今,数据科学很火,利用统计和人工智能的算法从数据里找到可以运用到业务和产品中的规律,而这其中,数据也是关键。

Lime 非常强调数据文化。产品创新闭环,精细运营闭环,在很多 O2O 公司都是非常重要的理念。对 Lime 而言,目前的产品就是绿色出行滑板车,运营就是把对的滑板车在对的时间放到对的人面前。因为数据成为两个闭环的关键,使用数据就慢慢的成为了大家每天的一个习惯。没成为习惯的都很难称其为文化,文化是你不自觉就会践行的东西。Lime 之所以这么重视数据,是因为我们知道对创业公司,没有人可以预测未来具体的发展形态。但我们相信——学得快的会赢。这学得快就要靠数据,数据可以让我们知道在哪里成功、哪里失败,找出原因,不断纠错试新。有这样的文化中,公司成长快速也是可以有迹可循的。

2.质量第一

我们在招聘数据人才的时候,通常可以用一个简单问题辨别出候选人是否是真的懂如何做数据,这个问题就是“如何解决数据质量问题”。大家应该听说过 garbage in / garbage out,错数据比没数据更可怕,有不少这样的例子,公司大量决策依赖数据,但最后发现之前的决策使用的数据是错的,这些错误决策造成的负面影响比没有数据做决策也许还要差。高质量的数据代表着人们对数据的信心,只有可信,人们才可以放心的使用到日常工作中去,变成新常态。

3.无快不破

无快不破,大家讲的很多,文锋带领的神策数据在这方面做出了很好的产品。让你可以很快搭建数据系统,在对的时间及时把数据交给你使用并产生价值。最近大家谈的很多的做“数据湖“,其初衷也是求快。通常情况下,在新产品发布之后,从取回数据到数据可用中间经历层层处理。数据湖打掉了这些环节,接一个用户数据查询工具,就可以及时使用数据。这样,每当新产品发布后,你就可以在第一时间点,使用数据验证产品迭代效果。迟到的数据其价值会变小。

4.数据平民化

当数据成为公司文化,当数据是公司每个人的日常需要时,我们必须用做 APP 的思路做数据。要让公司的每一个人都可以在实际工作中使用数据。数据已经不再是“管理者”的专用工具。数据决策,用的人越多,价值也越大。数据平民化并不容易做到。第一,为数据平民化,那 APP 必须做到极其简单易用,门槛要拉低。第二,每个人的查询数据方式不同,得出的结果有可能不一样。要明确区分标准答案和自由答案,减少数据平民化使用带来的出错风险。第三,从数据监管的角度看,数据越平民化,泄露风险越高。加强数据安全和使用操作规范便是必须的了。

5.决策闭环

世界上没有任何一家公司拥有完美的数据。也没有任何一家公司拥有所有的数据。我们很多决策,都是在数据不全备的情况下做出的。所以,很多时候,讲数据支持更贴切。数据不应该取代决策者的主导地位。

6.产品运营闭环

小步快跑,快速迭代已经成为做产品的常规作业,其核心是产品实验自动化。这一做法也可以扩展到运营。以产品为例,有一个想法后,快速做出一个原型,然后上实验做 A/B 实验,自动生成对比统计效果及下一步建议。这里很多数据科学测量方法论都被自动化。这是一个具体的大数据加速产品迭代创新杀手 APP,已经是不少公司产品经理工程师们每天的标配工具。

我的前东家,在实验平台自动化前,一天只能做十个左右的实验,自动化后每天可以做一千到一千五百个实验。实验平台使得产品迭代闭环大幅度提速。

7.数据安全

在我做第一个数据项目的时候,就涉猎到数据安全。互联网时代,数据安全/用户隐私的重要性又上了一个新台阶。最近,欧盟出 GDPR 法案,国内也新出台不少有关数据安全条例法规。数据合规的时代已来临,做数据必须尊重上帝用户的隐私。按照欧盟 GDPR 要求,如果企业泄漏用户个人隐私,可能会罚款公司总营收的 4%。在 2019 年 1 月,谷歌被罚 5000 万欧元,脸书被 FTC 罚 50 亿美元就是例子。

“数据处理不当”已经永远不再是免责的借口。

8.善用人工智能

不提人工智能的大数据是不完整的。常常有人说人工智能时代,大数据为王是因为人工智能跟大数据之间有着无法切割的关系。一个具体的做法是使用人工智能改善数据质量。如何最大化二者融合后产生的价值,是我们要思考的。数字化转型是近年来传统企业谈论最多的话题。总的来说,传统企业转型之路是要收集更多的数据之路,是使用人工智能之路。

9.借力打力

到底应该选择哪个平台?是私有化部署还是公有化部署?招人难,要不要建立数据团队?要回答这些问题,借力打力也许是个不错的策略。尤其是对于中小企业、初创企业,抢占市场也许是比自主研发更重要。无数的例子证明,站在巨人的肩膀上是可以做成功大数据的。

在用借力打力策略时,还要有应对如下挑战,第一,跨供应商系统对接和优化,第二,集成并简化平台,第三,数据分析和数据科学,目前还是很少有力可借,建队不可避免。

结论

做成功的大数据必须直接与价值产出挂钩,不谈价值的大数据都是耍流氓。尽管数据不是万能的,但不做数据几乎是万万不能的。数据是杠杆支点,用好数据的企业可能撬动巨大的商业价值。二十年前实现数据价值是艺术,今天实现数据价值更多靠技术。希望大家都能把数据做成公司的杀手应用,使自己在激烈竞争中立不败之地。

即将启动城市预告

成都 ☞2019 年 11 月 15 日(周五)

杭州 ☞2019 年 11 月 15 日(周五)

合肥 ☞2019 年 11 月 22 日(周五)

武汉 ☞2019 年 11 月 29 日(周五)

不容错过的精彩内容』

▼▼▼

  • 独家 | 神策 2019 数据驱动大会现场「视频+PPT」合集

  • PPT 下载 | 每日一淘的高速增长与复购是怎样炼成的?

  • PPT 下载 | 神策数据桑文锋:「矩·变」加速中国数据化建设

  • PPT 下载 | 神策数据徐美玲:如何挖好数据这座矿?

  • PPT 下载 | 数据治理中的一些挑战与应用

戳此,免费下载 PPT

PPT 下载 | Lime 吕厚昌:Make Data Your Killer App相关推荐

  1. PPT 下载|神策数据业务咨询师成林松:社交裂变的场景化分析

    在以"矩·变"为主题的神策 2019 数据驱动大会现场,神策数据业务咨询师成林松发表了名为<社交裂变的场景化分析>的主题演讲.以下内容根据其现场演讲整理所得. 温馨提示 ...

  2. 合肥站 | 神策 2019 数据驱动大会「PPT 下载」新鲜出炉!

    今天,以"矩•变"为主题的神策 2019 数据驱动大会,七城联动「合肥站」已成功举办. 按住图片左右滑动 ◆ ◆  ◆ 合肥场 PPT 集锦 <如何挖好数据这座矿> & ...

  3. PPT 下载 | 神策数据徐美玲:如何挖好数据这座矿?

    本文根据神策数据业务咨询专家徐美玲在神策 2019 数据驱动大会上发表的<如何挖好数据这座矿>主题演讲整理而成.本文将为你重点介绍数据驱动的挖矿模式进阶法和数据基础建设的真相,包含以下内容 ...

  4. 述信科技创始人 CEO 彭圣才:传统行业如何实现数字化转型(附 PPT 下载)

     2020 年 10 月 13 日,在以"数字化 正当潮"为主题的「神策 2020 数据驱动用户大会」现场,述信科技创始人 & CEO 彭圣才基于"多部门视角下的 ...

  5. 技术干货|基于Apache Hudi 的CDC数据入湖「内附干货PPT下载渠道」

    简介: 阿里云技术专家李少锋(风泽)在Apache Hudi 与 Apache Pulsar 联合 Meetup 杭州站上的演讲整理稿件,本议题将介绍典型 CDC 入湖场景,以及如何使用 Pulsar ...

  6. Spark+AI Summit 2019 PPT 下载[共124个]

    为期三天的 SPARK + AI SUMMIT 2019 于 2019年04月23日-25日在旧金山(San Francisco)进行.数据和 AI 是需要结合的,而 Spark 能够处理海量数据的分 ...

  7. Flink Forward Asia 2019 总结和展望 - 附PPT下载

    11 月 28 - 30 日,北京迎来了入冬以来的第一场雪,2019 Flink Forward Asia(FFA)也在初雪的召唤下顺利拉开帷幕.尽管天气寒冷,FFA 实际到会人次超过 2000,同比 ...

  8. 清华大学唐杰教授:认知图谱是人工智能的下一个瑰宝(附PPT下载)

    来源:学术头条 本文约6300字,建议阅读10分钟 如何以计算机的方式做认知? 公众号(DatapiTHU)后台回复"20201224"获取完整PPT下载 AI 的下一次机遇在哪里 ...

  9. 用户在线广告点击行为预测的深度学习模型(含PPT下载)

    本文来自英国伦敦大学学院博士张伟楠在携程技术中心主办的深度学习Meetup中的主题演讲,介绍了深度学习在Multi-field Categorical(多字段分类)数据集上的应用,涉及FM和FNN等算 ...

最新文章

  1. 3,SQL语句及数据库优化
  2. 打开Mybatis核心配置文件SqlMapConfig.xml的代码提示功能
  3. ITK:扩张灰度图像
  4. Apache Flink 零基础入门(三)编写最简单的helloWorld
  5. python网络编程能做什么_python网络编程——什么是socket?
  6. python ssl_Python3 ssl模块不可用的问题
  7. NPTL(Native POSIX Thread Library)
  8. 搭载骁龙865+量产一亿像素!小米MIX4今年无望了
  9. mysql存储过程输出多个参数值_MySQL 存储过程返回多个值
  10. 中国人工智能学会通讯——基于视频的行为识别技术 1.5 基于深度学习的视频识别方法...
  11. python json库函数_Python JSON
  12. JavaScript开发者应懂的33个概念js-33-concepts
  13. 若干个游戏辅助的分析手记(一)
  14. 【转】当我们说“区块链是无需信任的”,我们的意思是
  15. 数学与物理桥梁下的鸟瞰
  16. (正则)校验 8-16位,必须含有特殊字符、而大写字母、小写字母、数字至少包含其中两项
  17. linux12企业实战 -- 37zabbix企业微信通知配置
  18. 为什么量子力学总是让人感到疑惑?
  19. IT外企那点儿事(18): 当“we are a team”成为口头禅
  20. console.log 打印与预期结果不同

热门文章

  1. 机器学习学习笔记(一)绪论
  2. 触类旁通Elasticsearch:原理
  3. Python去除空格
  4. Intel PFR(platform firmware resilience)简介
  5. 基于java高校教师管理系统_基于Java EE高校教师继续教育管理系统的设计和实现...
  6. 渣硕自学两年转行Android,零经验春招拿美团30w年薪offer,HR说我是头一个!
  7. 中国地质大学(北京) 研究生 2022秋《Python科学计算》期末考试 模拟题2 题目+参考答案
  8. 显卡升级为啥总显示登录账号_苹果史上最重大更新,iOS13、iPadOS全放出,必须升级...
  9. RFID托盘管理,实现物流仓储全过程跟踪
  10. 全国大学生电子设计竞赛(四)--双极性跟踪可调精密直流电源的设计