【大数据千人会微信群分享】20140827期:傅志华-大数据如何在企业落地
中国互联网协会大数据工作委员会(筹)推出“大数据千人会”论坛,每周三晚8点30分开始,在“中国大数据千人会”微信群进行交流与探讨。本期我们特别有幸邀请到美国互联网上市公司数据中心副总经理傅志华为大家带来《大数据的开放式创新》的演讲。

演讲主题:大数据如何在企业落地
演讲嘉宾:傅志华(美国互联网上市公司数据中心副总经理、中国信息协会大数据分会理事)
执行主席:夏明武(专注工作于商业智能BI9年)主办单位:中国互联网协会大数据工作委员会(筹)
交流时间:2014年08月27日 20:30(周三)

演讲嘉宾介绍:

傅志华先生在互联网行业、产品与营销研究有超过十年的经验,谙熟数据分析和数据挖掘方法。曾为腾讯社交网络事业群数据中心总监以及腾讯公司数据协会会长。专注于移动互联网、社交网络、开放平台、APP、网络游戏以及网络会员服务的深度研究,并通过数据分析和数据挖掘支撑互联网产品精细化营销。在腾讯前,曾就职于艾瑞市场咨询、易观国际、中国互联网协会,并任DCCI互联网数据中心副总裁,在此期间,傅志华先生曾对互联网主流二十多个细分领域进行研究,并对移动互联网、电子商务、网络游戏、社会化媒体以及网络广告等领域进行深入的跟踪研究,并在多家IT类杂志发表文章。

傅志华先生现任一家美国互联网上市公司数据中心副总经理,中国信息协会大数据分会理事,同时积极致力于推动大数据支撑企业运营和大数据经验交流。

演讲内容:

傅志华大数据千人群分享2014.8.27

先自我介绍下。我是傅志华。一直做互联网数据研究和数据挖掘有十年了。今天要分享的内容基本上是我经历的一些经验总结。也希望各位专家多多指教。今天我要分享的主题是大数据如何在企业落地。大数据的应用有很多方向,我主要是比较关注这个方向。

我总结过一个数据价值金字塔在企业运营中的应用模型。该模型对应的是企业运营中的不同层面的数据需求,今天我们简要的对这个模型一起探讨。

先看最底层:数据基础平台层。

数据基础平台层是金字塔的最底层也是整个金字塔的基础层,如果基础层搭建不好,上面的应用层也很难在企业运营中发挥效果。没有数据或者没有高质量的数据,所有的分析都是误导,所有的数据挖掘都是错误的引导。这一层的目标是把企业的所有用户(客户)数据用唯一的ID串起来,包括用户(客户)的画像(如性别、年龄等)、行为以及兴趣爱好等,以达到全面的了解用户(客户)的目的。这一层的目标要做好有一个前提和三个关键:

关键1.企业需要确定打通数据的唯一ID,有的企业是用会员注册号,有的是手机号或者身份证号等等。

关键2.跨部门整合数据的问题。有大数据的企业通常部门都比较多,用户(客户)的各种行为和兴趣爱好数据散落在不同部门,需要企业有意识强有力的去整合;我见过很多银行内部各个部门的数据都没打通,数据打通才有产生更大的价值。

关键3.通过技术手段和规范手段把数据管理起来,这里解决的问题是存在数据仓库里面的数据具体的含义是什么,以及如何高效的存储和计算,涉及到数据接入系统、元数据管理系统和计算任务调度等系统。

我看到有很多企业都是用数据字典的方式来管理数据但这种方式有很多问题理想的做法是用元数据管理系统,大家有任何字段的更新、增加、定义的更改等,都要用技术系统的方式来记录和沉淀。

我刚才说做好这一层有三个关键和一个前提。以上说的是三个关键。前提是什么?前提是企业高层的重视。因为数据部门是成本部门,前期很难有比较多的产出。老板要有耐心和对数据价值的理解及长期的规划。

我们再看这张图的第二层,业务运营监控层。


按我的经验,做BI分析,至少有三分之一时间在解决一个问题。这个问题就是:为什么我的某某数据跌了?活跃为什么跌了,用户数为什么跌了,收入为什么跌了?我统计过我们的BI人员大致有20-30%的时间在解决这种问题。但是,我发现,有很多分析思路是比较相似的,为什么不考虑用数据产品工具去解决这种问题呢?有很多分析下跌原因的思路是一致的。这也是老板使用数据做多的场景。如果这里面做出彩了,比较容易受到老板认可。所以,我们首先要做的是清晰的梳理业务运营的关键数据体系,在此基础上通过智能化模型开发出来的数据产品,监控关键数据的异动,并可以快速定位数据异动的原因,辅助运营决策,如果企业构建了实时计算的能力,那么很多业务运营中问题就能过及时的发现。这个逻辑要和业务人员一起制定。

我们自己开发过一个异动监控工具,是这样的:

大家可以看这张图,大家应该用过mindmanager这种头脑风暴用的工具吧,我们找了一个开源的脑图工具,直接封装在BI系统里面,把某kpi数据封装在这个脑图里面,通过这个脑图可以把kpi数据不断的下钻或者关联分析,大家仔细看这个脑图,图上的节点是有不同颜色的,红色表示跌的比较厉害的点。每个节点上会封装这些数据:该节点占母节点的占比(表示这个节点的重要性)、环比、同比、节点名称、节点具体的量值。腾讯云分析大家可以用qq号登陆看看,http://mta.qq.com/。

    业务监控层 我认为最重要的是要梳理好不同的专题分析模板,然后把每天的数据灌进去这个模板,每天更新和监控。方便定位不同类别的问题。

    第三层。用户/客户体验优化层。


这一层面主要是通过数据来监控和优化用户/客户的体验问题。这里面既运用了结构化的数据来监控,也运用非结构化的数据(如文本)来监控体验的问题。前者更多的是应用各种用户(客户)体验监测的模型或者工具来实现,后者更多的是通过监测微博、论坛和企业内部的客户反馈系统的文本来发现负面的口碑,以及时的优化产品或服务。

先看结构化数据方面的应用:

比如,我们通过漏斗模型监控业务关键环节的转化率。重点是要按天监控不同环节的转化率的异动,一旦发现明显的异动,便要通过告警的方式通知相关运营的团队,及时发现体验的问题。如下图:

每种业务,不一定是电商,都有他的业务关键转化漏斗,一旦发现某个环节的转化率有突变,一定是用户体验出了问题。

非结构化部分我们是通过爬虫和文本挖掘的手段实现。业内叫舆情监控或口碑监测。即通过爬虫技术抓论坛、微博等社交媒体上用户对产品的讨论,以及时发现产品体验的问题。企业一般最重视的负面评价,我研究过很多国内外的舆情监控或者口碑监测工具,感觉都还有待优化。

我认为完整的口碑监测应该是这样的:

大家看这张图,但很多企业除了看负面,删帖之外,很少企业用来做产品改进,我听说宝洁等一些大品牌会做这种事情,看用户网上尤其是电商里面的评论,来改进产品。

舆情监测维度有几大关键:信息所在的圈子、所述信息是否与消费者关键购买因素相关、信息诱发的因素以及谈论着的影响力。但业务的监测往往是集中在正负面,比较少分析这些因素。

除了对舆情信息模型和应用价值的理解外,还有整个舆情监测面临的问题,就是语义判断的准确度的问题,整个行业最高的准确度最高也就60-70%吧。

先小结下了:业务运营监控层和用户/客户体验优化层最终希望实现企业运营的智能化医生。这两层面做出的工具好比是体温计、血压计、B超、CT等工具,我们用这些工具就能快速透视企业运营中那一模块产生问题。我个人的理想是能够为不同行业不同企业,设计出能够对企业运营不同环节进行深度体检,及时甚至是提前发现问题的智能化数据工具。

    第四个层面了:精细化运营和精细化营销层。


这层面有四方面事情:

1.构建基于用户/客户的数据提取和运营工具。运营和营销人员通过简单的条件配置(如选择男性、18-24岁以及特定兴趣爱好),便可把数据(用户/客户)提取出来,对数据背后的用户/客户进行营销或运营活动;

2.通过数据挖掘的手段提升客户对活动的响应(如点击率),常见的算法有决策树、逻辑回归等等;

3.通过数据挖掘的手段进行客户生命周期管理。我们可以可做到实时对不同生命周期的客户进行实时标记和预警,并把有效的活动当成商品一样及时的推送给不同生命周期阶段的客户;

4.客户个性化推荐。主要是用个性化推荐算法实现根据用户不同的兴趣和需求推荐不同的商品或者产品,以实现推广资源效率和效果最大化。

由于时间关系,我这里面里重点分享一下第3个,即客户生命周期管理:

什么叫客户生命周期管理?《王永庆传》里面讲到,米店老板每天收集客户用米的情况,了解家里有几个人,每天吃多少米,他这样计算家里的米大概什么时候要吃完了,待客户的米快吃完的时候,提前给客户打电话了解是否要继续买米,这样他的营业额有大大超过了同行的商家。这是很典型的一个数据采集、挖掘,然后产生效果的过程,这就属于用户生命周期管理。

转载于:https://my.oschina.net/u/1160813/blog/309692

【大数据千人会微信群20140827期交流纪要】傅志华-大数据如何在企业落地相关推荐

  1. 微信群突破500人 php,微信群如何突破五百人的上限?实现千人大群?

    原标题:微信群如何突破五百人的上限?实现千人大群? 众所周知,微信群现在已经从原来的200人限制,扩展到500人的限制,但是对于许多群主而言,创建的群可能吸引的人远远不止500人,甚至群主的影响力大, ...

  2. P5 周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”

    周志华:"数据.算法.算力",人工智能三要素在未来还要加上"知识" 算法在获得了大量数据和算力的情况下,可能会爆发出极大的威力,但这需要高昂的成本,周志华教授认 ...

  3. 周志华:“数据、算法、算力”人工智能三要素,在未来还要加上“知识”

    点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货 来源:AI科技评论 作者:李雨晨 2020 年 8 月 7 日,全球人工智能和机器人峰会(CC ...

  4. 周志华:“数据、算法、算力”,人工智能三要素在未来还要加上“知识”

    点击蓝字  关注我们 作者丨李雨晨 来源丨AI科评论 2020 年 8 月 7 日,全球人工智能和机器人峰会(CCF-GAIR 2020)正式开幕.CCF-GAIR 2020 峰会由中国计算机学会(C ...

  5. 周志华:“数据、算法、算力”人工智能三要素,在未来要加上“知识”| CCF-GAIR 2020...

    来源:雷锋网 作者 | 李雨晨 如何将"机器学习"与"逻辑推理"相结合,是人工智能领域的"圣杯问题" " 编者按:2020 年 8 ...

  6. 周志华:“数据、算法、算力” 人工智能三要素,在未来要加上“知识”!

    干货 分享人:周志华教授,来源:AI科技评论 作者:李雨晨   编辑:丛末 在CCF-GAIR 2020 的人工智能前沿专场上,南京大学计算机系主任.人工智能学院院长.CCF会士.ACM.AAAI.I ...

  7. 闺蜜带对象一起在群里群名_吉珠人最新微信群名曝光!这都是什么魔鬼群聊,最后一个让我笑出哭声!...

    赚到钱很开心 就像幼儿园的小朋友一样 要把糖果分享给好朋友 一个宿舍四口人都是憨憨 幸好还有你们 为憨憨开门带早餐 哦 忘了问 明天吃什么? 真真要生日啦 嘘!我们三个背着她悄悄建了一个群~ 四六级快 ...

  8. 2W销量Steam大神,光临联盟微信群,近距离分享成功之路!(聊天实录)

    东方异文石 晚上9点,有群里的「狐玩」大佬邀请一位 Steam 独立开发者,来到 Creator 星球联盟群,分享大作一起交流学习! 游戏名为:东方异文石,截图一发到群里,大家都被美术吸引了,这不是一 ...

  9. 微信怎么at所有人_微信群怎么@所有人_微信怎么艾特@所有人,看完你就知道了...

    现在由于学习工作等的需要,我们需要在微信建立群组更方便交流,当需要提醒全体成员时,具体我们应该怎么操作呢? 工具/材料 ·红米note3安卓手机,1部 ·手机操作系统:MINI 9.6稳定版 ·微信版 ...

最新文章

  1. 百度CTO王海峰获“光华工程科技奖”,深耕自然语言处理近30年
  2. 纯Rust编写的机器学习框架Neuronika,速度堪比PyTorch
  3. 初识Django —Python API接口编程入门
  4. 社区不支持HTML,popover不支持html内容吗?
  5. SAP gateway standard mode和compatible mode的区别
  6. 2003文件服务器迁移2016,服务器2016设置文件共享
  7. 如何在Django模板中注入全局变量
  8. P4211 [LNOI2014]LCA(离线 + 在线 做法)
  9. 机器学习:算法模型:决策树
  10. X战警大战复联要来了?迪士尼收购21世纪福克斯后开始狂秀IP...
  11. ServiceStack.Ormlit 使用Insert的时候自增列不会被赋值
  12. Linux的10个经典彩蛋
  13. 固高运动控制卡教程_基于固高运动控制卡的关节阻抗控制设计
  14. 多尺度小波分解Matlab/Python实现与原理分析
  15. FaceBook 遭遇有史以来全球最大宕机
  16. 求解位置不可用无法访问介质受写入保护咋寻回??
  17. Civil3D 2018-02 点
  18. 南柯服务器压力,从纳兰性德《木兰花》中看网络暴力和舆论压力带来的抑郁现象...
  19. 经纬度坐标转换为屏幕坐标
  20. 微服务治理之分布式链路追踪--3.zipkin实战

热门文章

  1. 凸显计算机学院特色的剧本,高职院校非计算机专业计算机课程的教学改进策略探析 - 计算机教育论文大全 - 小品台词 - 中国国际剧本网...
  2. [附源码]PHP计算机毕业设计-报刊征订管理系统(程序+LW)
  3. 问题 C: 零基础学C/C++26——判断某整数是否既是5又是7的整数倍
  4. 计算机应用基础知识盘,计算机应用基础知识介绍.ppt
  5. 风潮唱片-远方的寂静;专辑
  6. 供参考的the-gan-zoo,列出的GAN相关模型和论文
  7. C++实现简单的停车场管理系统
  8. 凡吸纳鲁宾逊微积分者,必须遵守“知识共享”授权许可
  9. ubuntu系统外连接两个显示器设置
  10. 测试是ufs3.0的软件,可怕!UFS 3.0测试首曝光:速度竟是UFS 2.1的3倍