目录

1.检验假设的基本思想与步骤

1.检验思想

2.检验步骤

2.检验假设的两类错误

1.第一类错误

2.第二类错误

3.正态总体均值的参数检验

1.单个总体

2.两个总体

3.成对数据的t检验

4.非参数检验

1. McNemar 检验

2.符号检验

3.成对数据符号检验

4.wilcoxon符号秩检验

5.Mood检验

6.尺度参数的Ansari-Bradley检验

7.尺度参数的Fligner-Killeen检验



1.检验假设的基本思想与步骤

1.检验思想

(1).在我们所接触的参数检验、非参数检验中,绝大多数使用的反证法思想。即当我们要检验一个假设是不是成立时,我们所采用的就是先假定这个假设成立,在此基础上来看当这个结果正确是,会有什么结果。假如由此得出一个不合理的假设,那就证明该假设不正确,假设不成立。那么我们就会拒绝这个假设;反之,则接受。

2.检验步骤

(1)提出假设:单边假设、双边假设;

(2)选定显著性水平,一般取

(3)构造检验统计量;

(4)给出拒绝域与结论。

2.检验假设的两类错误

1.第一类错误

原假设为真,但是拒绝原假设,犯第一类错误的概率为:

α = P{拒绝H0 | H0为真}

2.第二类错误

原假设为假,但是接受原假设,反第二类错误的概率为:

β = P{接受H0 | H0为假}.

一般来说,在已经给定了也根本容量的情况下,减少犯第一类错误的概率势必会增加犯第二类错误的概率,反之也一样;但是增大样本容量可以减少反第一类和第二类的概率。

3.正态总体均值的参数检验

1.单个总体

例题1、某种电器的寿命X(单位:H)服从正态分布N(),均未知,现在随机抽取16只电器,测得寿命如下:

159 280 101 212 224 379 179 264
222 362 168 250 149 260 485 170

问是否有理由认为电器的平均寿命大于225小时?

检验假设:H0 : µ ≤ µ0 = 225, H1 : µ>µ0 = 225.

R语言中,函数t.test()提供了T检验和去加估计的功能,函数的使用格式如下:

t.test(x, y = NULL,alternative = c("two.sided", "less", "greater"), mu = 0, paired = FALSE, var.equal = FALSE, conf.level = 0.95, ...)

参数解释:

(1)x,y表示变量参数,提供x只做单个总体均值检验,提供x,y做两总体均值检验;

(2)alternative 表示备择假设,括号内分别表示双边检验,左侧检验,右侧检验;

(3)mu表示原假设,conf.leve表示置信水平,默认取0.95。

R语言代码实现:

t.test(X, alternative = "greater", mu = 225)

求解结果:

从图中我们可以知道,置信下限为198.2321<225,P值为0.257>0.05,则不能拒绝原假设,接受原假设H0,认为平均寿命不大于225小时。

2.两个总体

例2. 在平炉上进行一项实验,用来研究改变操作方法的建议是否会增加钢的得率,实验环境除了操作方法不一样外,其余都一样。新旧交替,各10次。

标准方法 78.1 72.4 76.2 74.3 77.4 78.4 76.0 75.5 76.7 77.3
新方法 79.1 81.0 77.3 79.1 80.0 79.1 79.1 77.3 80.2 82.1

设两个样本相互独立,都服从正态分布 (1,),1, 2,,  均未知,问新方法得操作能否提高得率?

检验假设:H0 : µ1 ≥ µ2, H1 : µ1 < µ2

R语言中,函数 t.test() 也可以做双样本检验 其使用格式为:

t.test(x, y = NULL,alternative = c("two.sided", "less", "greater"),mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, ...)

R语言实现代码:

X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)
Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)
t.test(X, Y, var.equal=TRUE, alternative = "less")

运行结果:

从图中可知,P值为0.0002176<0.05,且 1=76.23<2=79.43,故拒绝原假设,认为 1均值小于 2均值,即新方法操作能够提高得率。

3.成对数据的t检验

成对数据即数据为成对出现的,即(,),令=-,对Z做单样本的均值检验。

R语言实现代码:

X<-c(78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3)
Y<-c(79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1)
t.test(X-Y, alternative = "less")

运行结果:

从图中来看,P值为0.00115<0.05, 故拒绝原假设,认为 1均值小于 2均值,即新方法操作能够提高得率。

4.非参数检验

1. McNemar 检验

例题 某胸科医院同时用甲乙两种方法测定202份标本中的抗酸杆菌,结果如下,问甲乙两法的检出率有无差别?

甲乙两法检验某标本中的抗酸杆菌结果

对于McNemar 检验,可使用mcnemar.test()函数来检验。

检验假设:

H0:甲乙两种检测方法的检出率没有差异

R语言代码:

X<-c(49, 21, 25, 107)
dim(X)<-c(2,2)
mcnemar.test(X,correct=FALSE)

运行结果:

从图中可知,P值为0.5553>0.05,故接受原假设,即不能认为甲乙两种检测方法的检出率有差异。

2.符号检验

例题  联合国人员在世界上66个大城市的生活花费指数(以纽约1996年12月为100),按照从小到大的次序排列如下,其中北京的指数为99。假设这个样本是从世界大城市中随机抽样得到的。用符号检验分析,北京是在中位数之上,还是中位数之下。

66 75 78 80 81 81 82 83 83 83 83
84 85 85 86 86 86 86 87 87 88 88
88 88 88 89 89 89 89 90 90 91 91
91 91 92 93 93 96 96 96 97 99 100
101 102 103 103 104 104 104 105 106 109 109
110 110 110 111 113 115 116 117 118 155 192

检验假设:H0:M99,H1:M<90

R语言代码:

X <- c(66,75, 78 ,80 ,81 ,81 ,82, 83, 83, 83, 83,84 , 85, 85, 86, 86, 86, 86, 87 ,87, 88, 88,88, 88, 88, 89 ,89, 89, 89, 90 ,90 ,91 ,91,91 ,91, 92, 93, 93, 96, 96, 96, 97, 99, 100,101, 102, 103, 103 ,104, 104, 104 ,105, 106, 109, 109,110 ,110, 110, 111, 113, 115, 116, 117 ,118, 155 ,192)
binom.test(sum(X>99), length(X), al="less")

运行结果:

从图中可见,P值为0.009329<0.05,故拒绝原假设,认为北京的水平在中位数之上,高于世界中等水平。

3.成对数据符号检验

例题 用两种不同的饲料养猪,增重结果如下:

编号 1 2 3 4 5 6 7 8 9 10 11 12 13 14
X 25 30 28 23 27 35 30 28 32 29 30 30 31 16
Y 19 32 21 19 25 31 31 26 30 25 28 31 25 25

请分析两种饲料对体重增加有无显著性差异。

检验假设:H0:两种饲料没有显著性差异

成对符号的检验可以用binom.test()函数来实现检验。

R语言代码:

x<-c(25,30,28,23,27,35,30,28,32,29,30,30,31,16)
y<-c(19,32,21,19,25,31,31,26,30,25,28,31,25,25)
binom.test(sum(x<y), length(x))

解释:sum(x,y)表示样本X<Y样本的个数。

运行结果:

从图可知,95%水平的置信区间下,包含了0.5,并且P值为0.1796>0.05,故接受原假设,认为两种饲料养猪没有显著性差异。

第二类型 没有具体数字。

检验假设:

H0:顾客喜欢咖啡等于喜欢喝奶茶;H1:顾客喜欢咖啡超过奶茶

R语言代码:

binom.test(3,12,p=1/2, al="l", conf.level = 0.95)

运行结果:

从图种可知,P值为0.073<0.10,故接受原假设,认为喜欢咖啡的人超过喜欢喝奶茶的人;但是在95%水平下,认为两个人数一样多。

4.wilcoxon符号秩检验

检验假设:

H0:新复合肥的产量与原肥料的产量相同;H1:新复合肥的产量高于原肥料的产量

R语言代码:

x<-c(459, 367, 303, 392, 310, 342, 421, 446, 430, 412)
y<-c(414, 306, 321, 443, 281, 301, 353, 391, 405, 390)
wilcox.test(x, y, alternative = "greater", paired = TRUE)

运行结果:

从图中可知,P值为0.02441<0.05,故拒绝原假设,认为新复合肥的产量高于原肥料的产量,即新复合肥能显著提高小麦的产量。

5.Mood检验

问两个村农民的月收入的内部差异是否相同?

因为mood检验需要的假定之一是要两样本的中位数相同, 故在做检验时 要先消除两样本之间中位数的差异, 接着才可以做mood检验mood检验可以调用函数mood.test()函数来进行检验。

检验假设:

H0:两个村农民的月收入的内部差异相同

R语言代码:

A<-c(321,266,256,388,330,329,303,334,299,221,365,250,258,342,343,298,238,317,354)
B<-c(488,598,507,428,807,342,512,350,672,589,665,549,451,481,514,391,366,468)
diff<-median(B)-median(A)
A<-A+diff
mood.test(A,B)

运行结果:

从图可知, P值为0.0129<0.05,故拒绝原假设,认为这两个村的农民月收入的内部差异是不同的。

6.尺度参数的Ansari-Bradley检验

原理:

例题 两个工人加工的零件尺寸(各10个)为(单位:mm):

工人A 18.0 17.1 16.4 16.9 16.9 16.7 16.7 17.2 17.5 16.9
工人B 17.0 16.9 17.0 16.9 17.2 17.1 16.8 17.1 17.1 17.2

这个结果能否说明两个工人的水平(加工精度)一致?

检验假设:

对于Ansari-Bradley检验,可以调用ansari.test( )来实现;

ansari.test( )的调用格式ansari.test(x, y,alternative = c("two.sided", "less", "greater"),exact = NULL, conf.int = FALSE, conf.level = 0.95, ...)

R语言代码:

x<-c(18.0,17.1,16.4,16.9,16.9,16.7,16.7,17.2,17.5,16.9)
y<-c(17.0,16.9,17.0,16.9,17.2,17.1,16.8,17.1,17.1,17.2)
ansari.test(x,y)

运行结果:

从图中知,P值为0.04232<0.05,故,故拒绝原假设, 认为这两个工人的水平不 一样。

7.尺度参数的Fligner-Killeen检验

原理:

例题  三名不同的运动员A、B、C同时在同一条件下进行打靶比 赛,各打10发子弹,他们打中的环数如下:

A 8 7 9 10 9 6 5 8 10 5
B 8 7 9 6 8 9 10 7 8 9
C 10 10 9 6 8 3 5 6 7 4

问这三名运动员的稳定性是否一样?

检验假设:

对于Fligner-Killeen检验,我们可以调用fligner.test()函数,该函数使用格式如下:

fligner.test()函数调用格式fligner.test(x,g....)list()表示列表形式
x为一向量或列表, g为对x分类的因子, 当x为列表时g可以省略.

R语言代码:

x<-list(A=c(8,7,9,10,9,6,5,8,10,5),B=c(8,7,9,6,8,9,10,7,8,9),C=c(10,10,9,6,8,3,5,6,7,4))
fligner.test(x)

运行结果:

从图可知,P值=0.07463>0.05, 故接受原假设, 认为这三名运动员的稳定 性相同。

仅用来对非参数统计学习。

参考文献:

吴喜之, 非参数统计, 中国统计出版社, 1999.

薛毅 陈立萍,统计建模与R软件

R语言与统计分析-汤银才

R语言非参数检验(二)相关推荐

  1. R语言绘制二维密度图

    R语言绘制二维密度图 二维密度图显示了两个数值变量之间的关系,一个在x轴上表示,另一个在Y轴上表示,与散点图类似,然后计算二维空间中特定区域内的观测数,并用颜色梯度表示.二维密度图有几种类型,以下主要 ...

  2. R语言学习二——工具的使用

    R语言学习(二) 本章学习R语言相关开发工具的使用: 软件下载 软件安装 RStudio的使用 R扩展包的安装与载入 容易遇到的问题 一.软件下载(RStudio) Rstudio下载地址 选择免费版 ...

  3. R语言非参数检验多重比较

    本文首发于公众号:医学和生信笔记,完美观看体验请至公众号查看本文. 医学和生信笔记,专注R语言在临床医学中的使用,R语言数据分析和可视化. 之前介绍了多个样本均数的多重比较,今天说说kruskal-W ...

  4. 浅析R语言非参数检验的多组比较及分面与分组的图形艺术

    浅析R语言多组定量资料非参数检验的多组比较及簇状柱形图显著性字母标记之分面与分组的图形艺术 R语言多组定量资料非参数检验的多组比较 非参数检验的应用 本流程是在刘永鑫老师提供的代码资料指导下完成 测试 ...

  5. R语言:求二维变量数学期望

    想做一个二维变量数学期望实验, 查看若干资料终于找到方法 先看这篇文章熟悉一下R的函数 http://www.cyclismo.org/tutorial/R/tables.html 构造数据 通过下面 ...

  6. 生存分析 R语言(二)——Cox PHM(1)

    题目 使用R自带数据集veteran进行操作,是被诊断有肺癌的老兵生存数据. 载入数据集 library(survival) library(survminer) data()#列出已载入的包的所有数 ...

  7. R语言(二)——简单线性模型中的指数变换

    目录 一.数据 1.数据信息 2.数据处理 二.简单线性回归 三.指数变换 四.生存分析数据的Cox回归模型 一.数据 1.数据信息 口咽癌数据(pharynx.csv)是针对口咽若干位置癌细胞的临床 ...

  8. R语言 非参数检验:Mann-Whitney检验和Wilcoxon检验

    参数检验 非参数检验 分布特征 正态分布 非正态分布或未知分布 独立样本 独立t检验 Mann-Whitney检验 成对样本 配对t检验 Wilcoxon秩和检验paired 两独立样本t检验的假设条 ...

  9. R 语言绘制二维正态分布的密度曲面图;

    (1)绘制二维正态分布的密度曲面图: library("shape") #需要用drapecol()函数 library("MASS") #需要用fractio ...

  10. R语言分析(二)——薛毅R语言第二章后面习题解析

    包括2.2-2.6中间的习题,2.2的习题中第三问和第四问,应该有其他的解答方法,但我看他的题目,似乎是在A和B的基础上进行,所以就选择了使用for循环的方法 做着习题,又不断查着书,这样,书籍也熟悉 ...

最新文章

  1. 微信小程序,是不是一盘可口的菜!
  2. BiLSTM+CRF的损失由发射矩阵和转移矩阵计算而得 BiLSTM+CRF命名实体识别:达观杯败走记(下篇
  3. 技术非中立,语言非同质:机器翻译正被用于维护文化障碍
  4. JVM参数调优,无停滞实践
  5. 微服务网关Gateway
  6. interceptor 拦截器的使用 (session验证)
  7. 使用js脚本的好处以及其本身的特点
  8. c语言~符号_条件编译指令(符号),C语言条件编译指令完全攻略
  9. OmniGraffle 7 Pro全新推出!V7.18.3(204.9.0)正式版 支持M1
  10. oc实时渲染的图如何导出_VR批量渲染如何同时保存通道图?「渲云渲染」
  11. unity3d插件分享paint in 3d插件的简单使用
  12. 企业竞争竞争情报系统的流程整合
  13. c语言中int转string,C++中int型与string型互相转换
  14. Javascript DOM readyState 属性
  15. logrotate 管理日志文件不生效
  16. JS笔记:实现网页税收表
  17. navicat 无法连接mysql10060错误
  18. Openlayers各种下载方法
  19. Java爬虫——人人网模拟登录
  20. torch.nn 和 torch.functional 的区别

热门文章

  1. word文档怎么批量解除锁定_解除锁定的word文档的方法
  2. linux安装fdfs
  3. css 字体压缩 fonttools
  4. PDF如何转Excel?学会这3个方法,1分钟就能实现转换
  5. matlab fft2 fftshift,matlab fft fftshift
  6. Verilog实现的格雷码与二进制码的互相转换
  7. Qt 读写 txt 文件
  8. 使用nginx + uwsgi部署自己的django项目
  9. php值班系统,php简单的值日值班处理方法
  10. 基于移动互联网的交互式卫星地面管理终端