统计检验是将抽样结果和抽样分布相对照而作出判断的工作。主要分5个步骤:

建立假设

求抽样分布

选择显著性水平和否定域

计算检验统计量

判定 —— 百度百科

假设检验(hypothesis test)亦称显著性检验(significant test),是统计推断的另一重要内容,其目的是比较总体参数之间有无差别。假设检验的实质是判断观察到的“差别”是由抽样误差引起还是总体上的不同,目的是评价两种不同处理引起效应不同的证据有多强,这种证据的强度用概率P来度量和表示。除t分布外,针对不同的资料还有其他各种检验统计量及分布,如F分布、X2分布等,应用这些分布对不同类型的数据进行假设检验的步骤相同,其差别仅仅是需要计算的检验统计量不同。

正态总体均值的假设检验

t检验

t.test() => Student's t-Test

require(graphics)

t.test(1:10, y = c(7:20)) # P = .00001855

t.test(1:10, y = c(7:20, 200)) # P = .1245 -- 不在显著

## 经典案例: 学生犯困数据

plot(extra ~ group, data = sleep)

## 传统表达式

with(sleep, t.test(extra[group == 1], extra[group == 2]))

Welch Two Sample t-test

data: extra[group == 1] and extra[group == 2]

t = -1.8608, df = 17.776, p-value = 0.07939

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

-3.3654832 0.2054832

sample estimates:

mean of x mean of y

0.75 2.33

## 公式形式

t.test(extra ~ group, data = sleep)

Welch Two Sample t-test

data: extra by group

t = -1.8608, df = 17.776, p-value = 0.07939

alternative hypothesis: true difference in means is not equal to 0

95 percent confidence interval:

-3.3654832 0.2054832

sample estimates:

mean in group 1 mean in group 2

0.75 2.33

单个总体

某种元件的寿命X(小时)服从正态分布N(mu,sigma2),其中mu、sigma2均未知,16只元件的寿命如下;问是否有理由认为元件的平均寿命大于255小时。

X

222, 362, 168, 250, 149, 260, 485, 170)

t.test(X, alternative = "greater", mu = 225)

One Sample t-test

data: X

t = 0.66852, df = 15, p-value = 0.257

alternative hypothesis: true mean is greater than 225

95 percent confidence interval:

198.2321 Inf

sample estimates:

mean of x

241.5

两个总体

X为旧炼钢炉出炉率,Y为新炼钢炉出炉率,问新的操作能否提高出炉率?

X

Y

t.test(X, Y, var.equal=TRUE, alternative = "less")

Two Sample t-test

data: X and Y

t = -4.2957, df = 18, p-value = 0.0002176

alternative hypothesis: true difference in means is less than 0

95 percent confidence interval:

-Inf -1.908255

sample estimates:

mean of x mean of y

76.23 79.43

成对数据t检验

对每个高炉进行配对t检验

X

Y

t.test(X-Y, alternative = "less")

One Sample t-test

data: X - Y

t = -4.2018, df = 9, p-value = 0.00115

alternative hypothesis: true mean is less than 0

95 percent confidence interval:

-Inf -1.803943

sample estimates:

mean of x

-3.2

正态总体方差的假设检验

var.test() => F Test to Compare Two Variances

x

y

var.test(x, y) # x和y的方差是否相同?

var.test(lm(x ~ 1), lm(y ~ 1)) # 相同.

从小学5年级男生中抽取20名,测量其身高(厘米)如下;问:在0.05显著性水平下,平均值是否等于149,sigma^2是否等于75?

X

136 144 143 157 137 159 135 158 147 165

158 142 159 150 156 152 140 149 148 155

var.test(X,Y)

F test to compare two variances

data: X and Y

F = 34.945, num df = 19, denom df = 9, p-value = 6.721e-06

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

9.487287 100.643093

sample estimates:

ratio of variances

34.94489

对炼钢炉的数据进行分析

X

Y

var.test(X,Y)

F test to compare two variances

data: X and Y

F = 1.4945, num df = 9, denom df = 9, p-value = 0.559

alternative hypothesis: true ratio of variances is not equal to 1

95 percent confidence interval:

0.3712079 6.0167710

sample estimates:

ratio of variances

1.494481

二项分布的总体检验

有一批蔬菜种子的平均发芽率为P=0.85,现在随机抽取500粒,用种衣剂进行浸种处理,结果有445粒发芽,问种衣剂有无效果。

binom.test(445,500,p=0.85)

Exact binomial test

data: 445 and 500

number of successes = 445, number of trials = 500, p-value = 0.01207

alternative hypothesis: true probability of success is not equal to 0.85

95 percent confidence interval:

0.8592342 0.9160509

sample estimates:

probability of success

0.89

按照以往经验,新生儿染色体异常率一般为1%,某医院观察了当地400名新生儿,有一例染色体异常,问该地区新生儿染色体是否低于一般水平?

binom.test(1,400,p=0.01,alternative="less")

Exact binomial test

data: 1 and 400

number of successes = 1, number of trials = 400, p-value = 0.09048

alternative hypothesis: true probability of success is less than 0.01

95 percent confidence interval:

0.0000000 0.0118043

sample estimates:

probability of success

0.0025

非参数检验

数据是否正态分布的Neyman-Pearson 拟合优度检验-chisq

5种品牌啤酒爱好者的人数如下

A 210

B 312

C 170

D 85

E 223

问不同品牌啤酒爱好者人数之间有没有差异?

X

chisq.test(X)

Chi-squared test for given probabilities

data: X

X-squared = 136.49, df = 4, p-value < 2.2e-16

检验学生成绩是否符合正态分布

X

25 45 50 54 55 61 64 68 72 75 75

78 79 81 83 84 84 84 85 86 86 86

87 89 89 89 90 91 91 92 100

A

#cut 将变量区域划分为若干区间

#table 计算因子合并后的个数

p

p

chisq.test(A,p=p)

Chi-squared test for given probabilities

data: A

X-squared = 8.334, df = 3, p-value = 0.03959

#均值之间有无显著区别

大麦的杂交后代芒性状的比例 无芒:长芒: 短芒=9:3:4,而实际观测值为335:125:160 ,检验观测值是否符合理论假设?

chisq.test(c(335, 125, 160), p=c(9,3,4)/16)

Chi-squared test for given probabilities

data: c(335, 125, 160)

X-squared = 1.362, df = 2, p-value = 0.5061

现有42个数据,分别表示某一时间段内电话总机借到呼叫的次数,

接到呼叫的次数 0   1   2   3   4   5   6

出现的频率     7   10  12  8   3   2   0

问:某个时间段内接到的呼叫次数是否符合Possion分布?

x

y

mean

q

n

p[1]

p[n]

for(i in 2:(n-1))

p[i]

chisq.test(y, p= rep(1/length(y), length(y)) )

Chi-squared test for given probabilities

data: y

X-squared = 19.667, df = 6, p-value = 0.003174

Z

n

chisq.test(Z, p= rep(1/length(Z), length(Z)))

Chi-squared test for given probabilities

data: Z

X-squared = 1.5946, df = 3, p-value = 0.6606

P值越小越有理由拒绝无效假设,认为总体之间有差别的统计学证据越充分。需要注意:不拒绝H0不等于支持H0成立,仅表示现有样本信息不足以拒绝H0。

传统上,通常将P>0.05称为“不显著”,0.0l

反馈与建议

r语言t检验输出检验统计量_R语言:常用统计检验相关推荐

  1. r语言t检验输出检验统计量_R语言中实现T检验及可视化

    T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布.T检验是用t分布理论来推论差异发生的概率,从而比较两 ...

  2. r语言t检验输出检验统计量_R语言的各种检验

    R语言的各种检验 1.W检验(Shapiro–Wilk (夏皮罗–威克尔) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比如 ...

  3. r语言t检验输出检验统计量_R语言:十一个统计检验都在这了

    R语言的各种检验 1.W检验(Shapiro–Wilk (夏皮罗–威克尔 ) W统计量检验) 检验数据是否符合正态分布,R函数:shapiro.test(). 结果含义:当p值小于某个显著性水平α(比 ...

  4. r语言t检验输出检验统计量_数据统计的理解和运用(四)列联表之卡方检验

    前面几期我们介绍了参数检验,t检验和方差分析: 临度科研:数据统计的理解和运用(三)方差分析​zhuanlan.zhihu.com 临度科研:数据统计的理解和运用(二)t检验的应用​zhuanlan. ...

  5. r语言t检验输出检验统计量_如何进行统计分析

    在写统计分析报告时,会用到描述统计分析和推论统计分析.下面会对以上两种分析方法进行简要介绍. 一.描述统计分析 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随 ...

  6. r语言t检验输出检验统计量_[转载]R语言:常用统计检验

    R语言:常用统计检验方法 写在前面 R已经成为当前国际学术界最流行的统计和绘图软件之一,该语言较为简单易学,统计分析功能强大,且具有很强的绘图功能,能够绘制学术出版要求的多种图表.R语言在生物信息学, ...

  7. c语言作业系统输出超限,C语言网Online Judge系统支持语言和编译说明

    Online Judge系统支持语言和编译情况: 语言 编译器 语言版本 编译参数 C gcc 4.6.3 C99 gcc Main.c -o Main -Wall -lm –static -std= ...

  8. go语言 第三方包安装方法_R语言3.6.3 安装程序下载及破解方法

    下载地址 百度网盘链接: https://pan.baidu.com/s/16smT3ceIjqaupn54AdgmgQ 提取码:7hap 解压密码:关注[菜瓜程序猿]微信公众号,回复[解压密码]获取 ...

  9. c语言不能正确输出最小值,C语言综合测试.doc

    C语言综合测试 1.在C语言中,下面()转义序列表示换行(选一项)在C语言中,为了输出如图所示的一字符(),下面的代码正确的是().(选择一项)'c') B)putchar('c') C)printf ...

  10. c语言10个数输出最大数,C语言怎么输入十个数输出最大值

    C语言怎么输入十个数输出最大值 C语言求输入的10个数中最大值的编程方法如下: 1.首先需要定义一个整型数组空间,因为这里需要输入十个数,所以数组空间为10个.int a[10]; 2.接着定义一个最 ...

最新文章

  1. 从源码分析DEARGUI之add_drag_float和4
  2. nokia 基亚 wp 开发中心
  3. MySQL存储过程和函数示例
  4. 如何提高电脑运行速度_电脑运行速度慢的解决方法
  5. 一位大学教师对学生的建议:如何做好研究
  6. JS动态插入HTML后不能执行后续JQUERY操作
  7. HTML入门小站,Phaser
  8. pycharm中配置r语言_【R语言】R语言中的循环
  9. css字体样式代码大全_这都2020年了,还没了解CSS?
  10. WOFF字体的Mime类型?
  11. 利用java实现一个简单的远程监控程序
  12. 编码格式详解:多字节字符集和Unicode字符集
  13. github入门教程最全中文版(官方)
  14. Sentaurus TCAD 2013安装包下载
  15. 平衡车 两轮平衡车扭扭车程序漂移车主板方案原理图pcb图程 两轮平衡车扭扭车程序体感车
  16. [每日一题]10、一道关于九宫格的面试题
  17. E20-591考试必备资料分享
  18. 商标有效期、续展期、宽展期分别是什么意思?
  19. HDU 5745 La Vie en rose(简单模拟)
  20. Eagerly caching bean '' to allow for resolving potential circular references

热门文章

  1. 李乐为担任BCF理事
  2. 高效工作的7种方法,可以让你的工作效率提高一倍,很实用
  3. wps里面函数怎么使用_WPS表格中常用文本函数的用法
  4. 大数据监控平台实践之路
  5. 卷帘快门与全局快门的区别
  6. 微信小程序客服消息配置 token 验证失败 微信无请求记录 问题现象的解决办法
  7. 图像处理: 五种 插值法
  8. linux在命令行下打开pdf文件
  9. 怎么彻底删除users下的文件夹_c盘中的users文件夹删除了怎么办?
  10. python生成中文字符画_用python生成字符画