假设检验原理

小概率事件在一次试验中几乎不可能发生。

多重假设检验原理

小概率事件在多次重复试验中必定会发生。

单样本二项式检验(binomial test)

问题:调查北京市所有人喜欢吃面食还是吃米饭(都不喜欢吃的忽略),在北京街头随机选了10个人(样本有点少),有8个喜欢吃面食,2个喜欢吃米饭。由此能否否定北京人喜欢吃面食的比例为p = 0.5呢?

建立零假设(null hypothesis): 北京人喜欢吃面食的比例为p = 0.5,由此就可以得到一个二项式分布,Pr(X = k) = (10k)10 \choose k(k10​)0.5k0.510−k0.5^{k}0.5^{10-k}0.5k0.510−k,k = 0,1,2,…10。基于这个分布就可以算出Pr(X >= 8)的概率。

进行统计推断:容易计算,Pr(X >= 8)的概率为0.055,由对称性,Pr(X <= 2)的概率也为0.055。为了统计检验的严格性,一般要用双尾(单尾双尾如何选择)。这样在零假设的基础上,得到Pr(X = 8)或更极端的概率为0.11,这个概率不算小,无法推翻零假设。所以无法否定北京人喜欢吃面食的比例为50%这个结论。

符号检验(sign test)

此检验属于非参数检验的范畴,针对配对样本。此检验的核心是二项分布(或者有二项分布近似而来的正态分布)。

那么何时应选用符号检验?
1,有序的匹配数据。如两种治疗皮肤晒伤的药A,B,A涂左手,B涂右手,比较一下哪种药的效果更好。这时只关心A>B或A=B或A<B,并不关心A与B的差异有多大,应选用符号检验。
2,基数数据,但正态假设不成立,无法使用t检验来判断两组数的均值是否有显著差异(参数检验的统计效力要比非参数检验大,所以能用配对t检验的就不要用符号检验)。

建立零假设:以有序的匹配数据为例,零假设是药A与B的效果,即假设A>B和A<B的比例都为1/2(A=B对假设检验没有贡献,故去掉)。翻译成数学语言为:Pr(A>B) = 1/2。

进行统计推断:在Pr(A>B) = 1/2的基础上,判断实际的Pr(A>B)或更极端的概率。这就转化为一个单样本二项式检验了。对此检验概率的计算由下面两种方法:
1,精确方法
设m为A>B何A<B的总个数,n为A>B的个数,由二项分布的公式,
if n >= m/2,则p=2∗∑k=nm(mk)(12)mp = 2 * \sum_{k=n}^{m}\binom{m}{k}(\frac{1}{2})^{m}p=2∗∑k=nm​(km​)(21​)m,
else, p=2∗∑k=0n(mk)(12)mp = 2 * \sum_{k=0}^{n}\binom{m}{k}(\frac{1}{2})^{m}p=2∗∑k=0n​(km​)(21​)m。
2,正态理论近似
值得注意的是,在npq>=5时,即这里的n*(1/2)*(1/2)>=5,即n>=20时,可以用正态分布来代替二项分布计算p value。
设m为A>B和A<B的总个数,n为A>B的个数,用来近似的正态分布的均值为mean=m/2,方差var=m/4,则
if n >= m/2,则p=2∗(1−ϕ(n−m/2−0.5m/4))p = 2 * (1 - \phi(\frac{n - m/2 - 0.5}{\sqrt{m/4}}))p=2∗(1−ϕ(m/4​n−m/2−0.5​)),
else, p=2∗ϕ(n−m/2+0.5m/4)p = 2 * \phi(\frac{n - m/2 + 0.5}{\sqrt{m/4}})p=2∗ϕ(m/4​n−m/2+0.5​)。
Note: 上式中的加减0.5使用了连续性修正,使得二项分布更好地被正态分布所近似。

跟二项分布相关的统计检验方法相关推荐

  1. 如何选择适合自己数据的统计检验方法

    ## 链接 https://statsandr.com/blog/what-statistical-test-should-i-do/ 偶然间发现的一个博文 ![What-statistical-te ...

  2. 金融学习之七——统计检验方法的使用

    今天的内容有点无聊,主要是几个统计检验方法的应用,都是scipy模块中的stas子模块中的函数.几个统计检验分别是K-S检验,A-D检验,W检验和正态性检验. (1)K-S检验 K-S检验是基于累计分 ...

  3. BERT的成功是否依赖于虚假相关的统计线索?

    作者 | 李理 来源 | 个人博客 导读:本文介绍论文Probing Neural Network Comprehension of Natural Language Arguments,讨论BERT ...

  4. 量化投资相关文章统计

    转载自:http://www.dataguru.cn/article-5441-1.html 量化投资相关文章统计,具体信息如下: 算法交易-尽可能降低你的交易成本(一) 算法交易-尽可能降低你的交易 ...

  5. r语言平均值显著性检验_最全的R语言统计检验方法_数据挖掘中R语言的运用

    最全的R语言统计检验方法_数据挖掘中R语言的运用 统计检验是将抽样结果和抽样分布相对照而作出判断的工作.主要分5个步骤:建立假设 求抽样分布 选择显著性水平和否定域 计算检验统计量 判定 假设检验(h ...

  6. t检验的p值对照表_统计学|各类统计检验方法大汇总

    点击蓝字关注我们 教材中(<医学统计学>第七版,李康.贺佳,人民卫生出版社)列举了对于不同类型的资料,可以使用包括t检验.方差分析.卡方检验.非参数检验.直线回归与相关等在内的不同方法处理 ...

  7. r语言平均值显著性检验_R语言:常用统计检验方法

    转自http://blog.sciencenet.cn/home.php?mod=space&uid=255662&do=blog&id=240107 正态总体均值的假设检验 ...

  8. 记住这个网站:服务器相关数据统计网站 http://news.netcraft.com/

    http://news.netcraft.com/ 需要参考现在服务器相关数据,可以上这个网站. 当然google趋势也是一个可选得备案. 有一个数据统计更全面的: http://w3techs.co ...

  9. sentinel限流相关指标统计源码分析

    文章目录 *前言* *官方架构图* 滑动窗口模型 *StatisticSlot* *Node* *NodeSelectorSlot* *ClusterBuilderSlot* *FlowSlot如何使 ...

  10. 【算法分析】多个对比算法的统计检验方法

    一.几种检验方法 先说结论:方差分析(或者用Kruskal Wallis).秩和检验.Holm's method一定要做. 第一个用于确定所有算法有显著差异,第二个生成p-value用于对比,最后一个 ...

最新文章

  1. 【iOS】日历行程的增删改查(完整)
  2. L车改装浅析及性能测试
  3. pandas中关于DataFrame计算时间差(加减)
  4. Spring Boot + Mybatis 实现动态数据源
  5. leetcode 453,462. Minimum Moves to Equal Array Elements I, II | 453, 462. 最少移动次数使数组元素相等(图解)
  6. 转载:关于对REST的基本认识和理解
  7. 万兆以太网测试仪应该具备的测试功能
  8. 【Linux系统编程学习】 GCC编译器
  9. linux搜索日志组合条件,find查找
  10. ACM中java快速入门
  11. bzoj 2865 字符串识别——后缀数组
  12. python算法精解pdf_算法详解(卷1)算法基础 PDF 完整高清版
  13. 从Kaminario谈谈“三大”存储热点技术
  14. 根据两个字段去重SQL语句
  15. 记一次利用tomcat manager部署war包失败并解决的经历
  16. mysql migration toolkit报错_MYSQL Migration Toolkit 安装
  17. [VBA学习]关于Formula以及数字格式的问题
  18. (六)K8S中HostPath、EmptyDir、ConfigMap、Secret、Downward API用法
  19. 问题 K: 蜗牛1534
  20. 第三方对接-支付宝支付

热门文章

  1. ios 隐藏app的插件_iPhone如何隐藏App图标?iOS9不越狱隐藏App小技巧
  2. java 生成树形_Java实现生成Excel树形表头完整代码示例
  3. GNSS高精度数据处理网址大全
  4. jQuery到Vue的迁移之路
  5. 爬虫---高性能爬虫
  6. python进行数据处理——pandas的drop函数
  7. 新手自己搭建、开发网络直播平台历程——了解实现一个简单直播平台的结构
  8. 计算机维修与数据恢复论文,备份恢复论文,关于计算机数据备份数据恢复技术相关参考文献资料-免费论文范文...
  9. PowerBI制作报表背景图
  10. 航空航天行业工作站应用---EDA仿真计算工作站