作者:livan

来源:数据python与算法

前沿

统计计算主要应用在效果评估领域。客户经过分流之后在各个试验组中产生数据,统计的作用即为查看对应组的样本量是否达到最小样本量,数据之间是否存在显著性差异,以及进行差异大小的比较。

如下图:

A-A-B三组数据观察n天后,会产生3组数据,我们接下来的任务就是计算这三组数据的统计效果,进而确定哪个方案效果好……

最小样本量

最小样本量是按照统计功效进行计算的,主要分两类:绝对值类(例如:UV)和比率类(例如:点击率)。

在试验过程中,大部分场景是进行比率类指标的比较,单纯的计算绝对值是没有价值的,而且对于试验效果来讲,绝对值的比较可以转化为比率的比较,所以在计算过程中,我们统一成比率计算,以方便口径统一和数值比较。

理论上,比率类最小样本量计算:

其中Z为z系数,统计中Z值有一个固定的Z值表,可以依据α和β指标确定出对应的Z值,工业应用中一般默认使用α=0.1(单尾)和β=0.2,因此公式中:

Zα/2+Zβ=Z0.05+Z0.2=1.6449+0.84=2.4849

可以定为固定值。

d即为对照组历史数据的月均值与提升率的乘积:

提升率detection left%”是需要用户在页面中录入的部分,比如:新方案预期指标提升率为2%,则提升率detection left%=2%。

“历史月均值mean”是对应观测指标在过去一个月的数据均值。

例如:

“XX提交”按钮由红色变为橙色,统计的指标是点击UV转化率UV_rate,测试时间是20200801~20200814,则计算“XX提交”按钮的历史月均值mean(UV_rate)为下面数据的均值avg(UV_rate):

由此,可以计算出公式中的d

注:UV、PV等绝对值的比较需要先转化成rate值进行计算。

最小样本量计算中的σ计算逻辑与d类似,同样是计算历史一个月的指标方差值,上面案例中:

σ=σ(UV_rate)

在比率方差运算时,对应的计算公式为:

σ(UV_rate)=P(1-P)

其中,P为统计值UV_rate的均值,即:

avg(UV_rate)

所以上面公式可以调整为:

注:比率的方差计算方式与绝对值的方差计算:

逻辑一致,得到两值差异不大,只是计算公式不同而已。

因此比率类最小样本量公式可变为:

到此,可确定AB测试最小样本量的计算公式。

注:此处的计算需要对统计学中的统计功效有所了解,阅读有阻力可以补充一下“统计功效”的计算方法。

最小样本量流程图

最小样本量的作用是确定试验是否有效,后管配置好对应的客群信息、开放流量占比、提升率等信息后,后台需要进行“最小样本量”的计算,并进行相关判断,如下图:

步骤:

1)用户在后管配置页面中输入预期的提升率x%、监控的数据指标_rate、对应的客群范围以及开多少流量;    

2)获取到试验前30天数据,计算对应的数据指标_rate(如上例的UV_rate),并计算出30个数值的avg(数值指标_rate);

3)后台获取到提升率x%之后,将x%和avg(数值指标_rate)带入到上面最小样本量计算公式中,确定对应的最小样本量n。

4)判断圈定出来的客群流量*m%最小样本量n的大小,如果客群流量*m% < 最小样本量n则提示样本量不足,如果客群流量*m% >= 最小样本量n则进行分桶分流操作。

5)基于n确定各个试验组的样本量为:(n(A) = n(A) = n(B)) >= n/3

当分流出的单组样本量大于n/3时,试验结果才有可信度,否则试验结果不可信。此处我们做了一个假设,即在计算最小样本量时假设样本量即活跃量,实际试验中并非如此,所以实际试验中,单组样本数据量宜大于n/3。

试验有效天数

确定好最小样本量并实现分流、试验上线之后,需要进行数据的有效天数需要进行相应计算:

试验的有效天数即为试验进行多少天能达到流量的最小样本量。当流量达到最小样本量时,查看数据是否存在显著性差异,如果不存在显著性差异则继续进行试验,直到达到最大要求天数,如果试验仍然没有达到显著性,则确定两组试验不显著,即没有明显差异。

计算过程如图:

计算说明:

1)假设有m%的流量参与试验,则第一天时选择对应的流量m%,A-A-B三组中各自的流量为m/3。

2)第二天(t+1天数据)时,依然选择m%的流量,这些流量包含两部分:其一为已经打标的客户第二天重新访问APP的数量,数量为:a12,a22,b12;其二为需要新划分的流量ax1,ax2,bx1,得到流量划分的计算公式为:

计算打标的客户是否已经满足最小样本量n_per:

同时计算当前时间下A-A-B三组试验的显著性

3)试验期间的每一天都进行如上计算,得到每天的访问量以及显著性。

4)判断试验天数是否到达试验最小天数(7天):

如果到达试验最小天数且试验样本量>=最小样本量n_per,则观察试验是否有显著性,如果A-A试验没有显著性且A-B存在显著性(B>A),则表示试验成功,否则试验失败。

如果到达试验最小天数且试验样本量<最小样本量n_per,则继续进行试验;

5)判断试验天数是否到达试验最大天数(t天):

如果到达试验最大天数且试验样本量>=最小样本量n_per,则观察显著性;

如果到达试验最大天数且试验样本量<最小样本量n_per,则终止试验并标注试验失败。

逻辑流程图为:

通过每天的数据计算可以做出如上判断,进而确定试验进行的有效天数并计算出显著性水平。

AB-testing工程化

经过上面的描述,我们可以通过下面的两张图来了解一下在工程方面,AB测试系统是什么样子的:

注释:

1)根据需求设计好AB试验之后,在AB测试系统配置好对应的策略;

2)将这一策略固化成文件,并推送到APP的AB系统SDK中;

3)客户每次访问APP,先扫描AB系统SDK中的策略文件,根据策略文件给客户打标,分配对应的A、B版本;

4)APP中根据策略呈现A、B版本的试验内容,并监控客户的操作行为以及订单行为;

5)这一行为被记录并上报到大数据环境中;

6)每天在大数据中进行显著性计算和最小样本量的处理,得到对应的显著性结果。

我们再来看一个详细的系统数据,如下图:

目前为止,AB系统已经介绍完成了,AB的结构深不可测,其中也需要经常的更新和讨论,欢迎大家关注沟通~

◆ ◆ ◆  ◆ ◆

麟哥新书已经在京东上架了,我写了本书:《拿下Offer-数据分析师求职面试指南》,目前京东正在举行100-50活动,大家可以用相当于原价5折的预购价格购买,还是非常划算的:

点击下方小程序即可进入购买页面:


数据森麟公众号的交流群已经建立,许多小伙伴已经加入其中,感谢大家的支持。大家可以在群里交流关于数据分析&数据挖掘的相关内容,还没有加入的小伙伴可以扫描下方管理员二维码,进群前一定要关注公众号奥,关注后让管理员帮忙拉进群,期待大家的加入。

管理员二维码:

猜你喜欢

● 麟哥拼了!!!亲自出镜推荐自己新书《数据分析师求职面试指南》

● 厉害了!麟哥新书登顶京东销量排行榜!

● 笑死人不偿命的知乎沙雕问题排行榜

● 用Python扒出B站那些“惊为天人”的阿婆主!

● 你相信逛B站也能学编程吗

点击阅读原文即可参与京东100-50购书活动

增长黑客AB-Test系统(四)——AB-Test 最小样本量相关推荐

  1. 增长黑客读书笔记(四)快节奏试验

    通过快速学习学到更多也是快节奏增长黑客过程的目标和一大优点. 增长黑客的巨大成功往往来自一连串小成功的累加. 小成功的威力:每个月5%的转化率改进会带来全年80%的提升,这就是成功自然累加的特点. 1 ...

  2. 增长黑客AB-Test系统(三)——AB-Test Hash分流

    作者:livan 来源:数据python与算法 Hash分流介绍 分流的方式有很多种,笔者这次来和大家聊一下Hash算法如何实现分流,Hash算法在融合MD5算法后,可以实现运算结果几乎不重复,而且方 ...

  3. 增长黑客入门:手把手教你增长模型的实践操作

    继前几年的OKR之后,这2年最火热的管理舶来品当属"Growth Hack",将其推上公众视线巅峰的时间就是可口可乐用CGO代替CMO,我们在此不讨论这两者之间的关系(存在即是合理 ...

  4. 增长黑客AB-Testing系统设计

    个人公众号:livandata AB-test思路 数据驱动概念兴起的同时,AB-test也同步出现在大家的视线中,各互联网大厂率先引进了AB-test系统,希望通过循环的测试,上线最符合公司客群的产 ...

  5. 初创公司根本没数据,增长黑客个屁

    PMCAFF(www.pmcaff.com):互联网产品社区,是百度,腾讯,阿里等产品经理的学习交流平台.定期出品深度产品观察,互联产品研究首选. 外包大师(www.waibaodashi.com): ...

  6. 怎样高效实现增长?这里有50个经典的增长黑客策略

    增长,基本上是所有成长型公司都会面临的问题.日前,约翰·麦克尔伯勒(JOHN MCELBOROUGH)在其个人博客中发表了一篇文章,汇总了世界上最具创新性的公司,在发展的过程中使用到的 50 个增长黑 ...

  7. 「产品读书」增长黑客:创业公司的用户与收入增长秘籍

    增长黑客网站 范冰公开一刻Talks  50个几点的增长黑客策略 目录 第一部分:增长黑客及相关概念 1.增长黑客 2.AARRR转换漏斗模型 第二部分:获取用户 1.筛选你的种子用户 2.插上社交的 ...

  8. 数据分析复盘——相关理论之《增长黑客》

    主要内容: (一) 什么是增长黑客? (二) 为什么要重视增长黑客? (三) 以"海盗指标"为基础的增长黑客内容 (四) <增长黑客>总结(对比<精益数据分析&g ...

  9. 增长黑客:如何低成本实现爆发式增长

    内容简介 脸谱网如何从默默无闻到坐拥二十几亿用户? 爱彼迎.优步何以在短短时间估值超过百亿美元? 领英怎样跨步成为全球领先的职业社交平台? 这些初创公司实现爆发式成长的共同奥秘就是增长黑客. 增长黑客 ...

  10. 《增长黑客实战》(第4-6章)

    <增长黑客实战>(第4-6章) 4 秉持数据为王 4.1 数据能够解决什么 4.1.1 是否一切皆可数据化衡量 4.1.2 数据不能解决什么 4.2 数据分析常见方法及指标 4.2.1 数 ...

最新文章

  1. oracle mysql 乱码_解决Oracle数据库中文乱码
  2. 六角透明颜色[复制]
  3. 冠状病毒如何杀灭最高效?这里有一份几十年的实验汇总
  4. ubuntu系统配置nijia_在Debian系统中使用backupninja定制备份计划的教程
  5. 17.深度学习练习:Character level language model - Dinosaurus land
  6. 真彩色图像数据量 计算_军职在线大学计算机基础(自主模式)
  7. CNN卷积神经网络(超详解析)
  8. windows采集音频
  9. python操作日期和时间的方法
  10. C#调用GDAL算法进度信息传递
  11. 13. Window blur() 方法
  12. Python数学建模入门【1】
  13. 【转】还原一个真实的银行待遇
  14. 以德治国——《万历十五年》的读书笔记及读后感想2900字
  15. rio 10.3 vcl应用更换皮肤
  16. 守卫解救acm_让作家阻止了它的解救
  17. 微信公众号自定义模板内容换行
  18. 使用python画等边三角形的程序-python叠加等边三角形的代码编写方法
  19. 微信公众号java开发沉淀(五)推送群发消息
  20. 回锅肉飘香,《Pokémon GO》再度成为最卖座的iPhone游戏

热门文章

  1. CAXA_三维电子图板v2
  2. html查重报告转换,知网查重报告网页版如何转换成PDF和WORD?
  3. wordpress之模板汉化(poedit的使用技巧 及 .po .mo 批量生成技术)
  4. 计算机控制技术实验平台,信号与系统•控制理论及计算机控制技术实验平台
  5. 天猫八大策略人群京东十大靶向人群简介
  6. 1075_MISRA_C规范学习_2004_Rule_5.1
  7. Matlab之样本概率图像绘制函数capaplot
  8. 深度学习教程(12) | CNN应用:目标检测(吴恩达·完整版)
  9. 基于mvc架构的劳务管理系统
  10. java 打包发布_一个java项目的打包与发布