为什么计算置信度?

在推荐场景下,我们会研发一些策略,来提升业务指标,在做AB实验的时候,实验组跟base组的指标对标,并非稳定的胜利或者稳定的失败,观察7天或者14天的指标数据,会有正有负,那么怎么衡量胜利的置信度呐?这属于碰到统计学中的假设检验问题,可以使用常见的卡方检验、t检验以及正态性检验等,去检验论证某个设想,并通过统计学的方法做解释。

置信度是什么?

理论与应用

t检验,通常会应用于三种情况的检验,分别是单样本t检验、双样本t检验和配对样本t检验。

这里着重说下

配对样本t检验,跟工作中的AB实验吻合。

配对样本t检验

配对样本t检验,是针对同一组样本在不同场景下,某数值型指标均值之间的差异。实际上读者也可以将该检验理解为单样本t检验,检验的是两配对样本差值的均值是否等于0,如果等于0,则认为配对样本之间的均值没有差异,否则存在差异。所以,该检验也遵循两个前提假设,即正态性分布假设和样本独立性假设。下面利用统计学中的四步法完成配对样本的t检验:

步骤一:提出原假设和备择假设

步骤二:构造t统计量

其中,xbar为配对样本差的均值,s为配对样本差的标准差。在原假设满足的情况下,t统计量服从自由度为n-1的t分布。

步骤三:计算t统计量

根据步骤二中的计算公式,可以计算得到配对样本t检验的统计量值。这里使用了AB实验两组数据的差作为t统计量。

可以选择实现单样本t检验的ttest_1samp函数,也可以直接选择实现配对样本t检验的ttest_rel函数。接下来结合这两个函数,完成可支配收入的t检验。

置信度计算代码:

#!/usr/bin/python

# -*- coding: UTF-8 -*-

from scipy import stats

def load_data(input_file):

value = []

with open(input_file, 'r') as f:

for line in f:

l = line.strip()

if len(l) > 0:

value.append(float(l))

return value

def save_p_value():

data = load_data('data.txt')

print(data)

result = stats.ttest_1samp(data,0)

print('statistic: ' + str(result[0]))

print('p-value: ' + str(result[1] / 2))

print('置信度:' + str(1 - result[1] / 2))

def main():

save_p_value()

举个例子

需要计算置信度的数据保存于data.txt中:

0.011756813

0.007696947

-0.003020396

0.015364271

0.047068377

0.001973821

-0.004978872

0.016051776

0.030067915

-0.025374734

0.04177658

-0.013990472

运行上面的代码,p_value.py,得到如下结果:

[0.011756813, 0.007696947, -0.003020396, 0.015364271, 0.047068377, 0.001973821, -0.004978872, 0.016051776, 0.030067915, -0.025374734, 0.04177658, -0.013990472, -0.082597621]

statistic: 0.35054762661433364

p-value: 0.36600218285336517

置信度:0.6339978171466348

置信度越大越好,上面这个例子可以解释为:实验组的指标没有带来较大的提升。

参考:

python配对t检验_置信度计算——t检验(配对样本t检验,AB实验置信度),T相关推荐

  1. ab实验置信度_为什么您的Ab测试需要置信区间

    ab实验置信度 by Aloïs Bissuel, Vincent Grosbois and Benjamin Heymann AloïsBissuel,Vincent Grosbois和Benjam ...

  2. 置信度计算——T检验(配对样本t检验、AB实验置信度)

    为什么计算置信度? 在推荐场景下,我们会研发一些策略,来提升业务指标,在做AB实验的时候,实验组跟base组的指标对标,并非稳定的胜利或者稳定的失败,观察7天或者14天的指标数据,会有正有负,那么怎么 ...

  3. python四分位数怎么算_四分位数计算以及使用pandas计算

    最近学习python数据分析,遇到了四分位数计算问题,因四分位数计算公式不一致,导致结果不一样,坑爹的百度只给了一种计算方法,容易迷惑初学者,故总结如下: 计算方法 三个四分位数的确定: 先按从小到大 ...

  4. wald检验_笔记:分位数回归斜率相等性检验(Wald检验)

    首先我并不是统计学.数学类专业的,对很多统计模型搞不明白的,下文所写也仅是学渣的学习笔记吧,都是些基础操作,希望能帮到忙吧. 从毕业论文角度出发的分位数回归模型分享: 我是一个文科类.经济类的专业,我 ...

  5. spssχ2检验_实用医学统计:配对四格表资料的χ2检验之SPSS操作篇

    上一篇文章我们分享了应用SPSS软件(SPSS18.0)快速掌握四格表资料的χ2检验操作: 本文我们开始分享应用SPSS软件(SPSS18.0)快速掌握配对四格表资料的χ2检验操作. 请看例题: 例8 ...

  6. python分组统计标准化_分组计算和汇总_Python数据分析实战应用_数据挖掘与分析视频-51CTO学院...

    为什么学Python: 重要:数据分析是职业技能必备,Python是大数据分析** 趋势:Python是目前非常火的编程语言,使用人多 好学:学习简单,容易上手,使用灵活,可扩展强 **:会Pytho ...

  7. python算积分蒙特卡罗_蒙特卡罗计算积分

    作者|Cory Maklin 编译|VK 来源|Towards Datas Science 通常情况下,我们不能解析地求解积分,必须借助其他方法,其中就包括蒙特卡罗积分.你可能还记得,函数的积分可以解 ...

  8. python求表面积代码_用于计算python中的体积或表面积的良好算法

    我正在尝试计算3D numpy数组的体积(或表面积).在许多情况下,体素是各向异性的,并且我在每个方向上具有像素到厘米的转换因子. 有没有人知道找到工具包或包来做上述的好地方? 现在,我有一些内部代码 ...

  9. python三维矩阵可视化_科学计算三维可视化---Mlab基础(基于Numpy数组的绘图函数)...

    Mlab了解 Mlab是Mayavi提供的面向脚本的api,他可以实现快速的三维可视化,Mayavi可以通过Mlab的绘图函数对Numpy数组建立可视化. 过程为: .建立数据源 .使用Filter( ...

最新文章

  1. c语言菜单程序循环结构举例,C语言程序设计课件 第4章 循环结构.ppt
  2. vim删除多行_vim文本编辑器
  3. BZOJ 2821 分块+二分
  4. 快速排序 C语言实现
  5. 敏捷产品计划:愿景,战略和策略
  6. QQ空间快速登录地址
  7. UE5 GPU崩溃D3D丢失的终极解决办法
  8. 显卡简介,显卡怎么查看
  9. win7系统ntp时间服务器,win7与内部ntp服务器同步时间出来错误【NTP时间同步服务器】...
  10. 20年广西赛题技能要求(服务器)
  11. 三星 v版系统更新无法连接到服务器,《异能勇者》万人新服紧急新开 更新最新版领取新服礼遇...
  12. 8、ABPZero系列教程之拼多多卖家工具 添加手机注册登录功能
  13. 分享卖货小程序制作方法_怎么在微信上做小程序卖货
  14. 技术总监经验总结: 从需求到上线之用户故事地图
  15. 矩阵分析L1 线性空间基础
  16. 如何把Dom对象转换成jQuery对象,如何把jQuery对象转换成Dom对象
  17. 计科1705露营活动策划案
  18. vue 百度地图点聚合MarkerClusterer,缩放拖拽后label消失
  19. VMvare虚拟机下载地址
  20. 【PCI】ARM架构——PCI总线驱动、RC驱动、Host Bridge驱动、xilinx xdma ip驱动(八)

热门文章

  1. 光场成像2.0——聚焦型光场相机
  2. 【判断链表中是否有环】
  3. innerHTML的基本用法
  4. Zabbix 报错:Get value from agent failed: cannot connect to [[127.0.0.1]:10050]: [111] Connection refus
  5. 鼠标右键添加用notepad++打开
  6. USB转串口参数配置功能
  7. 浅谈 paas、iaas、saas
  8. 电线电缆使用时的安全要求与保护措施
  9. 哈尔滨工业大学 2023年春人工智能数学基础期末真题
  10. 【安全知识分享】2021年安全生产月宣讲课件-交通安全(附下载)