显著性检验【t-test、方差分析、ks检验】

0、目录

1显著性检验基本定义(what?)

2.使用显著性检验的意义(why? )

3.显著性检验的具体操作流程(how? )

1、显著性检验基本定义

  • 统计假设检验(Statistical hypothesis testing)

    • 事先对总体(随机变量)的 参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理
  • 显著性检验(significance test)
    • 统计假设检验的一种
    • 显著性检验是用于检测科学实验中实验组与对照组之间是否有差异以及差异是否显著的办法。
  • 在使用显著性检验之前必须先进行统计假设,也就是无效假设/零假设/原假设
  • 无效假设/零假设/原假设(null hypothesis)
    • 数据结果之间本身不存在显著性差异
    • 指进行统计检验时预先建立的假设。 零假设成立时,有关统计量应服从已知的某种概率分布。
    • 当统计量的计算值落入否定域时,可知发生了小概率事件,应否定原假设。
  • 若原假设为真,而检验的结论却劝你放弃原假设。此时,我们把这种错误称之为第一类错误。通常把第一类错误出现的概率记为α
  • 若原假设不真,而检验的结论却劝你采纳原假设。此时,我们把这种错误称之为第二类错误。通常把第二类错误出现的概率记为β
  • 通常只限定犯第一类错误的最大概率α, 不考虑犯第二类错误的概率β。我们把这样的假设检验称为显著性检验,概率α称为显著性水平。

2.使用显著性检验的意义

  • 实例讲解

    • 一个球迷想要评价c罗和梅西的网络影响力,下列分别为二人在2017年每月社交网络发布后获得的点赞量/评论量,想要知道二人是否有存在明显的差异
    • CR7= {23,25,26,27,23,24,22,23,25,29,30,32}
    • Messi= {24,25,23,26,27,25,25,28,30,31,29,28}
    • 根据零假设的定义,作出“两人的点赞量没有显著差异”的假设,最后计算得出,方差检验的p_value= 0.459,那也就意味着两人的点赞量并没有明显的差异

3、显著性检验的具体操作流程

方差分析

  • 方差分析(Analysis of Variance,简称ANOVA),又称“变异数分析”,是R.A.Fisher发明的,用于两个及两个以上样本均数差别的显著性检验
  • 在显著性水平α =0.05的情况下,p>0.05接受原假设,p值<0.05拒绝原假设
  • 原假设是二人间不存在显著性差异,由于p=0.459>0.05,所以接受原假设,即二人间不存在显著性差异
  • 如果这里的p值小于0.05,那么就要拒绝原假设,即二人间存在显著性差异
  • p_value的另一种理解
    • 实例中的p_value=0.459,意思就是说偶然因素导致数据发生这种差异的概率是0.459,跟0.05一比大好多。那么就是说偶然因素很有可能导致了这种差异,所以数据本身之间是不存在差异的。
    '''方差齐性检验  在显著性水平α =0.05的情况下,p>0.05接受原假设, 所以接受原假设,即样本集B和样本集H间不存在显著性差异'''from scipy import stats  # 导入相应模块v3=[23,25,26,27,23,24,22,23,25,29,30,32]
    v4=[24,25,23,26,27,25,25,28,30,31,29,28]stats.levene(v3,v4, center="mean")
    fVal, pSD = stats.levene(v3,v4, center="mean")print("ANOVA-0",fVal, pSD)
    

    输出结果:
    0.5671069450362157
    0.45939425229350794

T 检验(T-Test)

  • T 检验用于确定两个变量的均值之间是否存在显著差异,并判断它们是否属于同一分布
  • 双尾测试
  • 函数 ttest_ind() 获取两个相同大小的样本,并生成 t 统计和 p 值的元组
  • 查找给定值 v1 和 v2 是否来自相同的分布:
    '''T-test 在显著性水平α =0.05的情况下,p>0.05接受原假设, 所以接受原假设,即样本集B和样本集H间不存在显著性差异'''v3=[23,25,26,27,23,24,22,23,25,29,30,32]
    v4=[24,25,23,26,27,25,25,28,30,31,29,28]import numpy as np
    from scipy.stats import ttest_ind
    from scipy import statsres = ttest_ind(v3, v4)
    print(res)
    

    输出结果
    Ttest_indResult(statistic=-0.8599394154935148, pvalue=0.3990967787539713)

KS 检验

  • KS 检验用于检查给定值是否符合分布

  • 该函数接收两个参数;测试的值和 CDF

    • CDF 为累积分布函数(Cumulative Distribution Function),又叫分布函数。CDF 可以是字符串,也可以是返回概率的可调用函数。
  • 可以用作单尾或双尾测试,默认情况下它是双尾测试。 我们可以将参数替代作为两侧、小于或大于其中之一的字符串传递。

  • 查找给定值是否符合正态分布

    import numpy as np
    from scipy.stats import kstestv = np.random.normal(size=100)res = kstest(v, 'norm')print(res)
    

    输出结果
    KstestResult
    (statistic=0.047798701221956841, pvalue=0.97630967161777515)

显著性检验【t-test、方差分析、ks检验】相关推荐

  1. Python | KS检验以及其余非参数检验的实现

    Python | KS检验以及其余非参数检验的实现 1 什么是KS检验 2 KS检验分类? 3 KS检验的Python实现 3.1 检验指定的数列是否服从正态分布 3.2 检验指定的两个数列是否服从相 ...

  2. R假设检验之k-s检验(KOLMOGOROV AND SMIRNOV TEST)

    R假设检验之k-s检验(KOLMOGOROV AND SMIRNOV TEST) 目录 R假设检验之k-s检验(KOLMOGOROV AND SMIRNOV TEST) 假设检验 假设检验的应用

  3. ks检验正态分布结果_【学习】AD, RJ和KS哪种正态性检验是最好的?

    MinitabUG.Minitab微课堂原创文章 转载请联系客服微信:13524041180 Minitab中的正态性检验提供了三种方法:Anderson-Darling(AD),Ryan-Joine ...

  4. 方差分析 球形检验_重复测量数据的方差分析

    重复测量资料是同一受试对象的同一个观察指标在不同时间点上进行多次测量所得的资料,常用来分析该观察指标在不同时间点上的变化特点.这类资料在临床试验和流行病研究中较常见.重复测量的方差分析模型仍然应用方差 ...

  5. ks检验正态分布结果_统计学里的数据正态性检验

    在前面的文章中讲过,很多模型的假设条件都是数据是服从正态分布的.这篇文章主要讲讲如何判断数据是否符合正态分布.主要分为两种方法:描述统计方法和统计检验方法. 01.描述统计方法 描述统计就是用描述的数 ...

  6. 单列表_正态分布检验(单样本K-S检验)

    目的:检验"肺活量"是否服从正态分布.(数据是否满足正态分布,对统计方法的选择以及部分统计结果的可靠性有很大影响) 注:下面以SPSS24.0操作为例.SPSS18.0及以前的版本 ...

  7. 使用K-S检验一个数列是否服从正态分布、两个数列是否服从相同的分布(转载+自己笔记)

    K-S检验全称: Kolmogorov-Smirnov检验 下面内容来自[1] 假设检验的基本思想: 若对总体的某个假设是真实的,那么不利于或者不能支持这一假设的事件A在一次试验中是几乎不可能发生的. ...

  8. ks检验正态分布结果_KS检验及其在机器学习中的应用

    KS检验及其在机器学习中的应用 什么是KS检验 Kolmogorov–Smirnov 检验,简称KS检验,是统计学中的一种非参数假设检验,用来检测单样本是否服从某一分布,或者两样本是否服从相同分布.在 ...

  9. KS检验、qq图、Scalability可扩展性

    1.KS检验 Kolmogorov-Smirnov test(KS检验)是一种重要的非参数检验方法,应用非常广泛,比如之前介绍的数据库CMap,其核心算法就是借鉴KS检验. KS检验是一种统计检验方法 ...

最新文章

  1. 微型计算机硬件的最小配置包括,职中计算机应用基础第一章测试题及答案
  2. 如何写好一篇高质量的IEEE/ACM Transaction级别的计算机科学论文?——顶刊与顶会的区别...
  3. Weblogic 12c中修改SERVER NAME的方法
  4. 2049 : 压死骆驼的最后一根稻草 (规律)
  5. Andriod开发中正确引入jar包的方式
  6. 园子里关于罗辑树与视觉树的文章
  7. Java开发中定时器的使用
  8. java 模块化基础
  9. Alpine Linux:如何配置GUI的图形桌面环境:x Desktop Environment
  10. mysql8 bigint类型和datetime类型的转换
  11. C#TTS语音播报带背景音乐
  12. VMware vSphere Client虚拟化重装虚拟机系统步骤
  13. python 知乎 合并 pdf_如何用Python程序将几十个PDF文件合并成一个PDF?其实只要这四步...
  14. UCK区块链微课堂—公钥私钥,数字资产安全性的两把金钥匙
  15. 永恒之蓝--Windows7
  16. Raptor实践参考:要么错误要么求和
  17. 汉语拼音的5个声调该怎么学?
  18. (pywin32)解决keybd_event在游戏中失效
  19. 关于Python 的“多元”赋值
  20. “谷底”类题目及一些自己的思考

热门文章

  1. [学习笔记]模拟退火
  2. linux mint软件包,在Linux Mint上安装R软件包的问题18.1
  3. 使用python监控NTP系统(时钟服务器)
  4. python requests常见用法总结
  5. 数据库连接中useSSL是否为true 或者 false的选择
  6. 软件测试工程师项目业绩怎么写,软件工程师的“项目业绩”如何才能脱颖而出?...
  7. Linux libusb
  8. STM32L431低功耗停止模式莫名其妙自动唤醒
  9. 八、量子纠缠状态的纯化协议及其应用
  10. 使用CMake构建/开始使用CMake