什么是ABtest

Abtest,又称分组隔离实验,是用于衡量网页设计、产品界面不同方案的效果的科学实验方法。
具体过程就是,为同一个产品目标制定两个方案(如一个界面按钮为蓝色,一个为红色),然后分别为两个方案分配用户流量,同时上线,根据用户的的使用行为效果衡量哪一个方案对于产品目标是有利的,之后就可以将这个方案投入使用。

原则

  • 方案设计:影响用户行为的因素很多,在不同的方案设计中尽可能一次只有一个实验变量。
  • 流量分配:具有代表性,相似性。实验的最终目标是将好的产品方案分配给所有的用户,因此抽样得到的用户群体要能够代表整个用户总体。
    可以采用的抽样的方法是:使用聚类方法根据用户属性和行为特征对目标用户群体进行分类,然后采用分层抽样的方法保证两批用户的组成相似,尽可能满足相似性,同时也能代表总体用户特征
  • 评价标准:由实验目标决定,例如方案设计的目标是想要提升转化率,那就以两个方案的转化率作为评价标准。
  • 样本量确定:样本量越大越接近于真实场景,然后同时也导致了更多资源的投入。因此合理选择样本量对于接下来的实验是很重要的

效果分析

在执行完ABtest之后,接下来就需要对两个方案的效果进行评估,判断哪个方案更能满足实验目标

例如,两个方案的实验结果分别是 方案一:转化率为40%,方案二:转化率为50%
提出假设:方案一的转化率总体均值等于方案二的转化率的总体均值,也就是说两个方案没有显著性差异
p值计算:关于均值的假设检验可以使用t检验,t检验往往在是样本近似正态分布,总体参数未知的条件下使用

根据样本量、均值和方差信息计算出Z值, 结合t分布进而计算处p值。然后将p值与a值进行比较,判断是否拒绝原假设,从而判断两个方案是够存在显著性差异
区间估计
如果不存在显著性检验,说明方案本身没有效果或者样本抽样不具有代表性等,需要进行多次优化尝试
如果存在显著性差异,我们要进一步更深入的分析方案二要比方案一对于转转化率提升了多少,40%与50%都是关于总体转化率均值的点估计,因此提升了25%也是点估计,这是存在误差的。因此可以对总体参数进行区间估计,这里使用95%的置信度分别对两个方案的总体转化率差值进行估计。
根据中心极限定理可知,样本量足够大的时候,不论总体分布如何,样本均值的分布是符合正态分布的,因此可以利用下面的公司计算出总体差值的区间分布,假设是[0.1, 0.3],则表示总体均值的差以95%的概率落入这个区间内。进一步转化成方案二相较于方案一提升的百分比,则区间为[0.1/0.4,0.3/0.4],也就是[0.25, 0.75],因此得出结论:方案二比方案一效果更好,方案二有95%的把握比方案一的效果提升25%~75%

涉及到的统计学基础

假设检验:先发现一些规律和结果,然后通过概率推测这些结果发生的原因,推断的依据是小概率事件不会发生。
根据样本推断总体时会应用到假设检验,事先对总体的参数或分布做出一个假设,然后根据样本观察值判断假设是否正确,即总体的真实情况与原假设是否存在差异,从而做出接受或者拒绝原假设的判断。如果结果中p值<a值,则说明原假设值错误的,拒绝原假设,真是情况与原假设存在显著性差异
过程:

  1. 做出原假设与备择假设

  2. 根据样本数量和样本分布情况,确定总体参数的分布,构造统计量

  3. 以a=0.05(或其他)构造统计量的拒绝域,查看总体参数是否落入拒绝域内

显著性检验:属于假设检验
a值:又称为“弃真概率”,指的是拒绝原假设犯错的概率,因为弃真的代价比较大,因此这个概率越小越好,经常使用的值有0.01,0.05,0.001等。
例如:a=0.05代表的就是拒绝原假设犯错的概率只有0.05,犯错的概率极其小,本着小概率事件不会发生的原则,可以放心的做出 拒绝原假设,接受备择假设的判断。
p值 称为显著性水平,p值指的是在原假设正确的条件下,得到样本观察值的概率。p值越小,说明观察值出现结果越小,也就是说原假设正确的概率越低。当p<a时,可以得出 拒绝原假设的判断
置信区间:假设检验当中,通过样本值对总体参数进行估计时会用到区间估计,表示的含义是总体参数会以一定的概率落入这个区间范围内。决定区间范围的概率为置信度,常用90%或95%。

参考资料:
https://blog.csdn.net/buracag_mc/article/details/74905483?depth_1-utm_source=distribute.pc_relevant.none-task&utm_source=distribute.pc_relevant.none-task
https://blog.csdn.net/weixin_34417200/article/details/89153830

深入解读AB测试(含统计学原理)相关推荐

  1. AB测试的统计学原理

    随笔记一些: 1. 大数定理说明频率的极限是概率:中心极限定理说明不论总体服从何种分布,从中抽取n个样本,则这n个样本的总和或平均数是一个随机变量,当n足够大时,这n个样本的总和或平均数服从正态分布. ...

  2. 深度好文 | YOLOv5+DeepSORT多目标跟踪深入解读与测试(含源码)

    导 读 本文主要介绍如何使用Yolo-V5 + DeepSORT实现多目标检测与跟踪.(公众号:OpenCV与AI深度学习) 背景介绍 目标跟踪是一种利用检测到对象的空间和时间特征在整个视频帧中跟踪检 ...

  3. YOLOv5+DeepSORT多目标跟踪深入解读与测试(含源码)

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 导 读 本文主要介绍如何使用Yolo-V5 + DeepSORT实 ...

  4. 「原理」AB测试-详细过程和原理解读

    这篇我们来详细讲讲AB测试的原理和具体的过程. AB测试原理简介 AB测试最核心的原理,就四个字:假设检验.检验我们提出的假设是否正确.对应到AB测试中,就是检验实验组&对照组,指标是否有显著 ...

  5. android怎么做ab测试工具,开发必读:网易专家解读Android ABTest 框架设计

    应用中不同的场景.设计方案,不经过测试,你永远不知道消费者会更偏好哪一种.面对随时可能变更的产品需求,开发人员如何才能在保证测试进程的同时,让工作也变得高效.省力? 本章内容,网易严选Android资 ...

  6. 辛普森悖论如何影响AB测试

    Simpson's paradox occurs when we observe a certain trend in the aggregate data but not in the underl ...

  7. 多场景业务实战-AB测试实战(数据分析干货!!!!!)

    AB测试实战 学习目标 掌握如何设计AB测试 AB测试效果如何解读 掌握如何进行实验设计与效果计算 1.AB测试介绍 很多网站/APP的首页都会挂一张头图(Banner),用来展示重要信息,头图是否吸 ...

  8. AB测试实战案例讲解及踩坑事项

    Hey,我是小z 今天我们来结合流程,讲讲具体的AB测试案例,以及AB测试中需要注意的问题,还有面试中可能会踩的坑. AB测试案例串讲 大体背景如下: 某社交APP增加了"看一看" ...

  9. 蓝绿部署、金丝雀发布(灰度发布)、AB测试……

    点击关注公众号,Java干货及时送达 来源 | https://www.jianshu.com/p/0df88fe4a1e3 随着微服务架构的普及,线上服务越来越多,随之而来的就是部署越来越频繁:随着 ...

最新文章

  1. LINQ技术、EF技术都出来蛮久了,软件开发者、软件公司是否还有必要有自己的代码生成器?...
  2. cucumber_java从入门到精通(5)使用maven创建cucumber_java项目
  3. VC++调试技巧学习总结
  4. TCP和UDP套接字编程
  5. android 打印机打印html,Android下通过wifi调用打印机打印
  6. 二阶矩阵乘法C语言,c语言矩阵相乘
  7. python软件下载3版本-python
  8. 使用freetype来显示中文汉字和英文字符
  9. 《软件工程导论第6版》--张海藩 牟永敏 课后答案及其详解 第4章 形式化说明技术
  10. Jmeter测试post请求的接口(webapi),json格式
  11. Python 让书法作品和 PIL 库来一场美丽的邂逅
  12. explore进程和linux,解析Svchost.exe和Explorer.exe两大系统进程(zt)
  13. 实现Excel单元格中的下拉选项和数据有效性
  14. JVM源码分析之Attach机制实现完全解读
  15. VCS+verdi /dve 仿真环境搭建-问题汇总
  16. 文件服务器迁移方法,文件服务器迁移工具
  17. 【基础】秦九昭算法实现的多项式快速计算
  18. Postman是什么?
  19. nyoj 125 盗梦空间
  20. 京东2019年春暑期实习笔试

热门文章

  1. sybase启动关闭
  2. 煤矿进口替代产业全梳理,这些煤机配件空间巨大
  3. 雨林木风GHSOT_XP_SP3装机版 V0912 【雪豹】
  4. Ashampoo 阿香婆全家桶分享
  5. 两年工作经历,我来告诉你底层码农真实的生活
  6. 索尼要廉价出售Vaio PC业务
  7. snap处理哨兵2数据时报错dataType out of range!
  8. python修改html内容_详解Python利用Beautiful Soup模块修改内容示例代码
  9. Cmd Markdown 编辑阅读器使用教程
  10. 2020FME博客大赛——FME在数据整合中的应用