本文为《程序员》原创文章,未经允许不得转载,更多精彩文章请订阅2016年《程序员》

导语:精准化营销是互联网业务在细分市场下快速获取用户、提高转化的利器,本文从数据体系架构和技术实现案例分享大众点评数据应用团队的尝试及经验。

总体框架

在介绍数据体系和框架前,为了方便大家理解,先简单阐述一下O2O营销的基本组成,我们从渠道和业务两个维度上抽象简化营销的表现形态见图1。

图1 O2O营销的基本组成

横轴从营销发生的渠道(站内和站外),纵轴是营销的主题业务(流量和交易)。在这两个维度上,产生了多种营销的形态。而数据分析和挖掘在这个环节都能发挥很大的价值。这次我们主要从站内的精准化用户营销活动上介绍相关的工作,以后如有机会,后续再为大家分享站外流量和交易获取维度的内容,如DSP的精准投放,渠道价值排名和反作弊。

一个站内用户运营活动的生命周期大概可以归纳为确定目标、选取活动对象、设计活动方案、活动配置与上线、线上精准营销与动态优化以及效果监控与评估六个环节见图2。

图2 站内用户运营活动的生命周期

在整个周期中,数据都存在巨大的发挥空间与价值。我们在项目启动后与业务充分沟通,了解其业务痛点,确定一期主要尝试从数据上帮助运营和财务同事解决以下几个问题:

  1. 营销活动前:确定目标和选取活动对象;
  2. 营销活动中:效果监控和跟踪,用户和商户端策略的输出;
  3. 营销活动后:效果评估和优化建议。

对于1的目标确定以前更多是拍脑袋决定,缺乏一套稳定的分析框架和模型。而活动对象,包括用户和商户/团单选取,更是需要业务和BI同学每次人工跑数据得出,效率低下。

而对2和3,更是缺乏一套公司的营销监控平台,时常出现预算花超不可控的情况。活动结束后,效果数据也是各个业务方自己给出,口径不一致导致难以整体评估效果。

系统架构

基于上述的业务场景和需求,我们用分层的金字塔架构设计了一套营销数据系统和服务,有效满足了业务的诉求并具有很好的平台扩展性见图3。

图3 营销数据系统架构

最底层是我们的数据仓库和模型层,这里又大致可以分为三个主题:画像、运营和营销以及流量。这三个都是运营活动必不可少的数据组成部分。

图4 用户标签体系

对于画像,我们的做法是部分自主建设,同时集成业务方,如搜索、广告和风控团队开发的画像标签,形成统一的画像宽表,目前我们的用户标签体系覆盖了包括基本信息、设备信息、消费浏览(如品类偏好和营销敏感度)以及特征人群等五个大类的180多个标签见图4。在标签的实现上,我们也秉承从需求出发的原则逐步迭代,从最初的以统计和基本的营销模型如RFM为主,到现在在潜在用户挖掘和用户偏好上开始探索使用机器学习的挖掘方法(见表1)。

表1 不同挖掘模型的对比

在营销运营集市上,我们与财务和支付系统协作,开发了一套公司预算流水号系统。运营人员在配置活动时,从财务申请预算流水号,并在优惠后台配置与对应活动关联,用户享受优惠的每一笔订单都会在业务表中进行打点,做到在最细粒度上的预算监控。同时在用户、商品等维度建模后,形成了营销交易评估的指标体系:新用户成本,新老用户分布,7天、30天购买留存等。

活动评估的另一个维度就是流量,活动页的点击、转化漏斗、不同渠道来源等指标是运营人员无时无刻不关系的指标,这部分模型作为数据中心数据仓库中核心的一环。我们参考了其他公司的做法,建立了自己的PV、UV、Session以及路径树转化等模型,可以很好的满足运营需求。

在数仓之上,我们建立了数据服务层,在统一使用公司高性能的RPC框架之下,针对不同的上层选择了有差异化的数据存储和查询引擎,如画像服务更多的是满足线上业务系统的实时访问需求,并发和延迟都要求毫秒级的服务可用性,我们选用了Redis作为存储,而对于分析类产品,对并发和延迟要求相对较低,但对数据在不同维度上的聚合操作要求较高,在对比了Kylin、ElasticSearch、Druid后,我们决定使用ES作为存储和查询引擎。主要有两个理由:一是我们有留存等指标,需要重刷数据,而对于Kylin来说,这就意味着无法使用增量cube,必须重建整个cube,代价很大,同时ES在同样的维度上,空间膨胀度上比Kylin少近一半;二是ES整个系统设计和架构非常简洁,特别是运维方案简单,也有专门的工具支持,对于当时没有专职运维的开发团队来说是一个捷径。

最上层是数据产品和应用,针对前面提到的运营活动的不同阶段提供数据平台和工具:

  • 人群分析平台(hoek):用户可以通过选择画像服务提供不同的标签组合快速创建人群包,创建的人群包可以提供给其他不同业务和形态的营销工具,如push、促销工具等。后续还计划提供分析报告和对比等功能对用户选择的人群包进行360度的透视。

  • 智能发券引擎(cord):cord作为活动中进行精准化营销的重要组成部分,将业务活动开发和后台精准化营销进行了解耦,通过配置后台和hork平台,运营人员就可以完成定向活动受众和策略的配置,而无需开发接入见图5。具体细节在后面的案例分享中再详细介绍。

图5 智能发卷引擎Cord

  • 云图/星图:云图和星图是产品和运营人员自助完成活动效果数据查询和分析的工具平台,通过将多维分析和营销指标结合后,运营人员将过去可能需要1-2天的数据分析需求在半个小时内就可以完成,提高了工作效率;同时我们还通过实时数据计算,提供了核心指标的实时数据(分钟,小时级别),相比之前T+1的数据实效性,在运营活动特别是大促期间,缩短了业务决策时间。

除了系统化的建设外,在运营活动的迭代中,我们与业务合作,进行了大大小小20多个专题分析,产出了包括闪惠预算动态分配,闪惠立减梯度优化,用户价值分以及免费吃喝玩乐选单等主题模型。帮助业务提高预算使用率30%,同时更好的评估拉新带来的用户价值。

而在开发过程中,我们也发现需要一个较为通用的挖掘平台,提供如特征选取和生成,模型训练和评估等功能,帮助分析师和挖掘工程师快速建模。因此也规划了基于Spark开发机器学习平台的建设。

整体的架构最终是为精准化营销服务,下面就结合两个案例具体介绍。

案例分享

外卖潜在用户挖掘与精准营销

精准营销一个主要的方向就是潜在客户挖掘,特别是在点评这个平台上,目前已有包括美食、外卖、丽人、教育等近20个业务,如何在平台近一亿的活跃用户中挖掘垂直频道的潜在用户就成了精准化营销的一个很现实的问题。Facebook和腾讯的广告系统都提供类似的lookalike功能,帮助客户找出和投放人群相似的用户群,其广告的点击率和转化率都高于一般锁定广泛受众的广告。

目前常用的潜在用户挖掘方案主要就是基于画像或者关系链的挖掘,我们团队从需求出发,结合点评的画像体系从关联规则;聚类和分类模型三个算法上进行了探索。对比效果如下:

未来我们除了在分类和聚类上进一步优化外,还计划利用点评好友关系,使用Spark的GraphX建立标签传播的算法进一步深挖高质量的相似用户。

微信红包精准优惠券引擎

另外一个精准营销的案例是智能发券引擎Cord,背景是点评会在微信群/朋友圈中用红包发各种优惠券,当好友来领券是如何决定发哪个业务什么面值的券更容易转化。本质上是一个简化的推荐问题,我们也参照广告系统的架构设计了Cord引擎。

主要包含分流模块(用于灰度发布和AB测试)、召回模块(负责从画像服务和优惠配置系统获取人和券的物料信息)、过滤模块(负责进行两者的匹配)和推荐模块(可以根据业务规则或者我们挖掘的策略对结果进行排序),返回给活动系统最合适的优惠券进行发放。整个系统实现完全服务化和可配置化,外部的活动系统可以根据配置的开关启用或者在特殊场景下禁用cord服务;而cord内部,也可以根据配置中心的设置,动态调整推荐策略。

在数据挖掘上,目前除了业务配置规则外,我们针对公司主流的运营方式,基于画像中的用户偏好和优惠敏感等标签进行综合打分,抽象了以GMV为目的和以拉新用户为目的的推荐策略。

总结

精准营销是目前大数据落地的一个公认的场景,但随着移动互联网和O2O的发展,这一领域也会有新的问题和挑战出现。结合我们这一年多的实践经验,团队也归纳了一套数据系统架构的设计原则:

  • 在数据架构和建设上,从需求出发,建立准确和易用的数据底层模型,统一指标体系和口径。

  • 在数据服务上,通过分层和SOA的思想,解耦与业务系统的逻辑。同时针对不同需求和场景选择适合的技术组件。

展望未来,在数据上如何快速的进行挖掘模型的开发,在架构和产品上满足更多场景,让数据在营销上发挥更大的价值是下一步的重点方向。


作者简介:

曹一帆,2012年7月从上海交通大学毕业,加入点评数据平台团队,进行大数据ETL,数据分析等工作,目前参与点评用户增长的数据挖掘工作。

毛天明,点评数据应用组高级工程师,负责精准营销、用户画像等项目,曾就职于百度基础架构部。

樊聪:点评数据中心数据应用负责人,目前主要负责点评精准化营销,用户画像和数据产品等工作,曾就职于微软,百度,对数据挖掘,大数据产品和服务等领域有一定研究。

责编:zhonghao@csdn.net

数据驱动:大众点评精准化营销实践相关推荐

  1. 数据驱动精准化营销在大众点评的实践

    精准化营销一直以来都是互联网营销业务在细分市场下快速获取用户和提高转化的利器.在移动互联网爆发的今天,数据量呈指数增长,如何在移动和大数据场景下用数据驱动进行精准营销,从而提高营销效能,成为营销业务部 ...

  2. Oracle Eloqua:精准化营销为企业吸引到理想客户

    :随着数字化时代的到来,营销发生了巨大的变化.营销潜在客户数量变多,客户兴趣热度变短,业内口碑影响大,需要通过自动化.数据化的方式来达到精准化营销的目标,企业级市场需要新型营销方式,此时IT成为数字化 ...

  3. 翟树卿:如何让数据挖掘助力精准化营销

    2019独角兽企业重金招聘Python工程师标准>>> 翟树卿:如何让数据挖掘助力精准化营销 随着互联网信息的碎片化,未来三屏合一的未来方向,如何把这些数据有效的整合在一起,是在整个 ...

  4. 大众点评的大数据实践转

    摘要:大众点评网从2011年中开始使用Hadoop,并专门建立团队.Hadoop主分析集群共有60多个节点.700TB的容量,月运行30多万个Hadoop Job,还有2个HBase线上集群.作者将讲 ...

  5. 大众点评的大数据实践

    2011 年小规模试水 这一阶段的主要工作是建立了一个小的集群,并导入了少量用户进行测试.为了满足用户的需求,我们还调研了任务调度系统和数据交换系统. 我们使用的版本是当时最新的稳定版,Hadoop ...

  6. 美团大众点评 Hybrid 化建设

    上周末,精神哥去参加了好友小青在北京办的T沙龙,探讨移动端热更新相关的话题.Bugly曾为大家介绍过不少腾讯内部的热更新的框架,正好这次看到了美团,去哪儿以及微博同学在应用热更新方面的实践,整理出来发 ...

  7. 【实践】端智能在大众点评搜索推荐重排序的应用实践

    猜你喜欢 0.2022年人才市场洞察及薪酬指南1.如何搭建一套个性化推荐系统?2.[免费下载]2022年1月份热门报告3.全民K歌推荐系统算法.架构及后台实现4.微博推荐算法实践与机器学习平台演进5. ...

  8. 深度:日流量高达500万的「大众点评」,或将成为养老机构营销重要布局方向

    撰文丨魏圆源 开篇: 这几年,我们发现一个比较有意思的现象:有老人和家属开始通过"大众点评"查询养老机构,同时也有养老机构的入住客户就是通过大众点评导流,"泰康" ...

  9. 端智能在大众点评搜索重排序的应用实践

    端智能,是指在移动端设备运行人工智能(AI)应用的技术.本文主要讲述大众点评搜索场景下,在端侧部署大规模深度学习模型进行搜索重排序任务的实践方案,包括端上特征工程.模型迭代思路,以及具体部署优化的过程 ...

最新文章

  1. 阿里开源台柱 Ant Design 源码仓库被删了...
  2. keil obj 文件 结构_【Python】数据分析前的入门教程 Python For Everybody P2:数据结构...
  3. 无法创建 SSIS 运行时对象。请验证 DTS.dll 是否可用及是否已注册。此向导无法继续而将终止。 (SQL
  4. 快速排序——Java
  5. 华为云FusionInsight MRS在金融行业存算分离的实践
  6. li 字多出了省略号_css 超出用省略号当标题字符溢出用省略号表示
  7. 《游戏设计师修炼之道:数据驱动的游戏设计》一1.4 来自政府和产业的挑战...
  8. [独库骑行之我们路过高山]翻越哈希勒根达坂
  9. 【实用软件】picasa不能导入文件夹至其中 的问题解决
  10. 详解boost库中的Message Queue
  11. (bat)检查今天星期几,并执行程序
  12. origin双y轴数据散点图显示
  13. java%3c%3e符号,有趣的 JavaScript 格式转换
  14. [重庆思庄每日技术分享]-oracle11g到ORACLE 816的dblink访问报 ORA-03150错误
  15. 【稻韵果香,以梦为家】云和恩墨大讲堂电子期刊第九期
  16. 和数软件新增9项计算机软件著作权登记证书
  17. SQL 与 MQL5: 与 SQLITE 数据库集成
  18. 你好啊,Spring !!!
  19. PO、DO、TO、DTO都是什么?
  20. rm 输入/输出错误

热门文章

  1. 同济、阿里获CVPR最佳学生论文,李飞飞获黄煦涛奖,近6000人线下参会
  2. In aggregated query without GROUP BY报错
  3. A8 CPRS结构
  4. 2017 VQA Challenge 第一名技术报告
  5. 小米10至尊纪念版和realmeX7pro玩家版 的区别
  6. 小米10至尊纪念版和华为P40 Pro+ 的区别 哪个好
  7. Spark 启动报错时报错 java.lang.NoSuchMethodError: scala.collection.immutable.HashSet$.empty()Lscala/collect
  8. C++学生信息管理系统(纯代码)
  9. 达人评测 r7 7735h和r7 5800h选哪个 锐龙r77735h和5800h对比
  10. 常用分割评价指标Dice、Hausdorff_95、IOU、PPV等 + Python实现