背景

闲鱼的业务在发展过程中,伴随着大量的活动和各种各样的实验。一般运营活动前期需要对市场进行调研,了解用户群体;中期进行活动设计和活动实验,根据实验效果调整活动方案;后期则进行复盘工作,整理相关数据,进行总结和分析。

然而,伴随着闲鱼体量的增长,原先定性的问题分析变得难以快速而准确的洞悉业务的真实状况。例如,在拉新场景下,如何引导用户、如何承接用户和如何提升权益,这些都需要做深入的数据分析。

痛点

当遇到相关的数据问题时,运营需要跟数据工程师提出需求,然而随着闲鱼业务越来越复杂,相关的需求也越来越多,例如需求1、需求2、需求N。这些需求的时间周期通常会比较长,无法很好的满足各类业务诉求。

因此,我们希望通过纳米镜引入实时数据分析能力,来解决此类的业务痛点问题。

解决思路

解决思路:数据科学平民化。通过搭建闲鱼人货场数据体系,将数据采集、数据清洗和模型开发都封装成接口,提供动态切面下钻、智能切面分析和指标预测的能力。

数据搭建

闲鱼人货场数据体系的搭建,将人群数据、商品数据和策略数据的标签和指标全部汇总,为后续分析打下数据基础。

此外,一些在标签库以外所需要的数据,我们通过自定义DSL的方式从客户端埋点获取。

功能

动态下钻

步骤:

  1. 先选择一个特定活动和特定指标

  2. 选择一个比较感兴趣的切面做二次分析,选择下钻按钮,例如选择敏感人群切面

  3. 再分析得到敏感人群+用户性别切面的情况

人货场的切面非常多,选择切面需要对这些切面有比较深入的理解。那么,如果运营不知道选哪些切面如何处理?引入智能切面分析。

智能切面分析

目的:
找到指标提升效果最显著的人群切面组合,帮助运营快速找到较合理的子人群, 从而做进一步的干预。

内容:
智能切面分析包含了两个部分:

  • 活动指标切面分析: 找出活动本身效果最好的切面组合

  • AB桶效果切面分析: 找出实验桶和对照桶差异最大的切面组合

方法:
结合相关分析、波动分析和决策树的思路,包含了以下两个部分:

  • 活动指标切面分析: 找出活动本身效果最好的切面组合

  • AB桶效果切面分析: 找出实验桶和对照桶差异最大的切面组合

活动指标切面分析

活动指标切面分析目的是找出活动本身效果最好的切面组合,给出的分析结果:

  • 获取效果最显著的人群切面组合,并给出每个人群切面下的指标结果

  • 给出每个切面下最小样本量,小于最小样本量则结果有一定的偶然性和不确定性。

获取这些分析结果的具体步骤如下:

  1. 分析数据:输入几十个切面和单个分析指标。切面:例如性别、年龄、职业等,指标:例如购买率、发布率、次留率等。

  2. 相关分析:分析切面和指标,切面和切面的相关性,剔除一些强相关的切面。例如7天内购买数量和14天购买数量这两个切面如果存在强相关性只需要留一个就可以了。

  3. 聚类分析:将切面的连续型数值通过聚类算法聚类成离散的类别。

  4. 信息增益率计算:计算信息增益率最大的切面,并在这个切面的基础上递归获取最大信息增益的切面。

  5. 剪枝:小于人数和增益率的阈值,则剔除子节点。

  6. 获取最佳切面:分析切面有效性,计算最小有效样本量。

我们会从几十个切面,例如职业、点击数、性别、年龄、消费水平等等几十个切面中进行切面分析,得到指标最优的切面组合。给出的结论如下所示(考虑到数据安全,以下数据非真实数据,仅供参考):

活动命中人数1000000,活动整体(是否当日新购买)指标为5%, 其中年龄区间=20~30岁,性别=女性,人群切面的活动效果最佳(该切面人群数量为200000,最小样本量为10000,指标值为10%),后续可以根据人群切面的效果做策略调整。

AB桶效果切面分析

AB桶效果切面分析目的是找出受到活动印象最大和最小的切面组合。基于AB实验的人群切面数据差异对比,我们可以对正向影响人群做放大投放,对负向影响人群减少投放。
例如,活动指标切面分析购买率最高的切面:年龄区间=20~30岁,性别=女性,人群切面的活动效果最佳。这时候只能证明这个活动切面是购买意愿最强的,不能证明是否是活动带来的增量。例如在活动指标切面分析中发现年龄区间=20~30岁,性别=女性的切面效果是最好的,但是不是活动带来增量最大的切面,带来活动增量最大的切面是年龄区间=30~40岁,性别=女性。

AB桶效果切面分析具体步骤与活动指标切面分析类似,具体如下:

  1. 分析数据:输入几十个切面和单个分析指标。切面:例如性别、年龄、职业等,指标:例如购买率、发布率、次留率等。

  2. 相关分析:分析切面和指标,切面和切面的相关性,剔除一些强相关的切面。例如7天内购买数量和14天购买数量这两个切面如果存在强相关性只需要留一个就可以了。

  3. 聚类分析:将切面的连续型数值通过聚类算法聚类成离散的类别。

  4. 选取合理的切面组合:选取切面组合,计算最小有效样本量,设置阈值剔除人数过少和不满足最小样本量的切面组合。

  5. 获取最佳切面:获取差异最大和最小的切面组合。

通过以上的AB桶效果切面分析,我们就能拿到活动给各个人群切面带来的正负向影响。对切面30~40岁,性别=女性人群加大投放,对于没有明显提升效果的人群减少投放。

指标预测

之前提到的动态下钻和智能切面分析都是在实验后做的分析,那么能否在实验前做一些预测,来加快实验的迭代时间呢?我们引入了指标预测功能。

效果

纳米镜现在可以分析闲鱼线上已有的活动,包括222、红包、导卖活动等。运营只需要输入活动ID和对应分析的时间,即可通过交互界面分析得到相关的结果.考虑到数据安全,已经隐去了相关敏感字段, 分析结论示例如下:
活动指标切面分析结论:
活动命中人数xxx,活动整体(是否当日新购买)指标为4.77%, 其中用户年龄=xxx人群切面的活动效果最佳(该切面人群数量为xxx,指标值为5.71%)
AB分桶效果切面分析结论:
是否当日新购买指标在以下3个切面的提升最大,分别是:

  • 桶xx(人数xxx 指标值5.62%)相比桶others(人数xxx 指标值4.86%)在切面是否敏感人群=1,30天内买家身份互动过的天数=xxx提升了0.76%(该置信度最小人数为xxx)

  • 桶xx(人数xxx 指标值5.72%)相比桶others(人数xxx 指标值4.91%)在切面是否敏感人群=1,是否当天新会员=0提升了0.81%(该置信度最小人数为xxx)

  • 桶xx(人数xxx 指标值5.73%)相比桶others(人数xxx 指标值4.91%)在切面最近30天的访问天数=x,是否敏感人群=1提升了0.81%(该置信度最小人数为xxx)

指标预测分析结论:

  • 在预热阶段就准确预测了闲鱼222活动当天的购买率,为后续及时调整运营调整素材争取了时间。

展望

后续我们希望可以通过利用已有的知识,搭建闲鱼知识库并仿真运营结果,帮助运营降低运营成本和减少活动迭代周期。

A2M峰会直击|闲鱼纳米镜——人人都是数据分析师相关推荐

  1. Kyligence Zen 产品体验 — “人人都是数据分析师”

    一.引言: 大家平时应该在开发中使用过类似调查问卷的低代码平台,通过对Kyligence Zen 产品的体验,这让我觉得是指标应用领域的低代码平台. 试想一下,在0到1的创业公司,在没有技术团队的情况 ...

  2. 人人都是数据分析师-数据分析之数据图表可视化(下)

    当前的BI报表.运营同学的汇报报告中数据图表大多为 表格.折线图.柱状图和饼图,但是实际上还有很多具有代表性的可视化图表,因此将对常见的可视化图表进行介绍,希望这些图表可视化方法能够更好的提供数据的可 ...

  3. 人人都是数据分析师??愿韭菜的世界没有镰刀

    开局一张图 有志于转行数据分析的朋友们好-古牧君今天大胆开麦,针对近年来网上各路培训班营造出来的"人人都是数据分析师"热潮,给出一些个人看法.希望能让所有冲动转行的小白们都先冷静下 ...

  4. 统计正数和负数的个数然后计算这些数的平均值_人人都是数据分析师之统计分析...

    前面三章介绍了DataFocus可视化视图,本章主要介绍运用视图进行统计分析的几种方法. 7.1节介绍二八法则和帕累托图的运用. 7.2节介绍如何进行平均分析,包括算数平均分析以及加权平均分析. 7. ...

  5. 人人都是数据分析师-数据分析之数据图表可视化(上)

    BI报表.运营同学的汇报报告中数据图表大多为 表格.折线图.柱状图和饼图,但是实际上还有很多具有代表性的可视化图表,因此将对常见的可视化图表进行介绍,希望这些图表可视化方法能够更好的提供数据的可用性. ...

  6. 掌握这些技能,人人都是数据分析师

    什么是数据分析? 数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,提取有用信息和形成结论而对数据加以详细研究和概括总结的过程.在实际应用中,数据分析可帮助人们作出判断,以便采取适当行动.当 ...

  7. 人人都是网站分析师:从分析师的视角理解网站和解读数据

    人人都是网站分析师:从分析师的视角理解网站和解读数据 <人人都是网站分析师>是一本真正能让网站分析的数据结果产生商业价值的著作.很多人都知道网站分析中的指标,但很少有人知道它们使用的场景. ...

  8. python怎么重新开始_人人都是数据科学家从新开始用Python学习数据科学的完整教程P3...

    上周一P2篇大家熟悉一些有用的库来学习Python.P3篇让我们学习如何用Pandas在Python中进行探索型数据分析. 为了进一步探索我们的数据,让我向您介绍另一种动物(好像Python还不够!) ...

  9. 人人都是网站分析师(从分析师视角理解网站和解读数据)-读书笔记4(完结)

    第四部分 网站分析的方法 1.网站分析的5中常用方法 (1)细分下钻分析法 原理是通过对汇总数据进行多个纬度分解,逐步找到问题的部分.细分的主要目的是对汇总数据和平均值数据进行剖析,发现问题并加以改进 ...

最新文章

  1. Linux下使用perf进行性能分析,并导出火焰图
  2. 二极管极低电流I-V特性测量
  3. angularjs 学期下拉列表指令
  4. python中值滤波去除椒盐噪声_python 中值滤波,椒盐去噪,图片增强实例
  5. php上传图片类型代码,php 上传图片的代码
  6. SDH光端机和PDH光端机有什么区别?
  7. php pfm 改端口,罗马2ESF和PFM 修改建筑 军团 派系 兵种等等等很多东西的教程
  8. 【makefile系列】调试makefile
  9. PPP 守护进程 RCE 漏洞已存在17年,可控制几乎所有的 Linux 系统
  10. shell for 循环_linux之shell编程(三)
  11. 23个超流行的jQuery相册插件收集
  12. 针对利用tzselect修改时间及ln -sf 修改系统时间不好使的情况 linux 6.5
  13. c#(asp.net/core)杂谈笔记
  14. 四叶草引导程序 CloverBootloader 5125中文版
  15. SQL编程题练习题(基础)
  16. JAVA中黄金分割点的问题
  17. DC005电源插座隐藏的用法
  18. ROS发布静态tf变换
  19. H5无插件实现实时海康、大华摄像头网页预览
  20. 电商抖音直播带货SOP工作流程主播计划脚本方案

热门文章

  1. oracle的并行原理
  2. Android指纹支付 - android M / P 全适配
  3. c语言中的下标变量是什么,c语言引用数组元素时其数组下标的允许的数据类型是什么...
  4. 编程环境和软件工具安装手册
  5. Java技术进阶推荐书单
  6. 计算机系统原理实验之BombLab二进制炸弹1、2关
  7. IBM服务器代理商创业之路①
  8. html中scr作用,可控硅的作用是什么
  9. 自兴人工智能——Python第二课(列表和元组)
  10. 1-AO3402MOS管使用