转自新浪博客,转载地址:http://blog.sina.com.cn/s/blog_427c24ae0102wg7n.html

1、t检验

数据是高血压患者治疗前后舒张压的变化,这个内容最熟悉不过了吧,虽然采用t检验的方法目前有争议,我们后面再讨论。treat 1为处理组,treat 2是对照组。显然,要比较两组的dd(血压下降值)。

# 读入SPSS格式的数据setwd("C:/R/R语言笔记")library(Hmisc)dat<-spss.get("Hypertension.sav") # t检验其实就下面这一行t.test(dd~treat,dat)

结果:

     WelchTwo Sample t-test

data: dd by treat

t = 4.3326, df = 11.671, p-value = 0.001038

alternative hypothesis: true difference inmeans is not equal to 0

95 percent confidence interval:

5.847287 17.752713

sample estimates:

mean in group 1 mean in group 2

      16.0             4.2

结果出来了,差异是有统计学意义的,P=0.001038。有些过于简单了,是吧?等等,结果中的Welch是什么东西?这是假设两个变量方差不齐,对自由度进行校正的t检验。如果方差齐呢?

t.test(dd~treat,dat,var.equal=TRUE)

结果

     TwoSample t-test

data: dd by treat

t = 4.3326, df = 18, p-value = 0.0004011

alternative hypothesis: true difference inmeans is not equal to 0

95 percent confidence interval:

6.078013 17.521987

sample estimates:

mean in group 1 mean in group 2

      16.0             4.2

结果是一致的,只是P值更小了些。

这里给出t检验的语法:

t.test(x, y = NULL,alternative = c("two.sided", "less", "greater"),mu = 0, paired = FALSE, var.equal = FALSE,conf.level = 0.95, ...)

或者:

t.test(formula, data, subset, na.action,...)

2、统计描述

那怎么知道方差齐不齐,对了,还有要符合正态分布呢?好,看一下计量资料的统计描述吧。如果summary(dat)不够用的话(您自己试试吧,此处略去),看一下fBasics包里basicStats的威力:

dat1<-subset(dat, treat==1)dat2<-subset(dat, treat==2)library(fBasics)basicStats(dat1$dd)basicStats(dat2$dd)   

看其中第1组的结果,连可信限、偏度系数、峰度系数都有了:

       X..dat1.dd

nobs 10.000000

NAs 0.000000

Minimum 10.000000

Maximum 20.000000

  1. Quartile 14.500000

  2. Quartile 18.000000

Mean 16.000000

Median 17.000000

Sum 160.000000

SE Mean 0.988826

LCL Mean 13.763119

UCL Mean 18.236881

Variance 9.777778

Stdev 3.126944

Skewness -0.627973

Kurtosis -1.025207

3、正态性检验

先来正态性检验。看一下直方图,QQ图,似乎不是特别正态,可能是因为样本量较小,但shapiro检验是OK的。

opar<-par(no.readonly = TRUE)
par(mfrow=c(1,2))
hist(dat1$dd)
hist(dat2$dd)
qqnorm(dat1$dd)
qqnorm(dat2$dd)
par(opar)
shapiro.test(dat1$dd)
shapiro.test(dat2$dd)

结果:


Shapiro-Wilknormality test

data: dat1$dd

W = 0.89893, p-value = 0.2132

Shapiro-Wilknormality test

data: dat2$dd

W = 0.92674, p-value = 0.4166
顺便看一下箱线图,没有离群值。有人喜欢均数标±准差的图,也来一个(目前的版本不太好看呀,有机会再改进吧);或者有想使用标准误的,自己应该能仿一个了吧。

boxplot(dd~treat,dat,main="两组血压下降值")library(Hmisc)x<-c(mean(dat1$dd),mean(dat2$dd))mp<-barplot(x)errbar(mp,x,x+c(sd(dat1$dd),sd(dat2$dd)),x-c(sd(dat1$dd),sd(dat2$dd)),xaxt="n",xlab="Groups",main="两组血压下降值")title(main="两组血压下降值")

结果:

4、方差齐性检验

levenTest一看,原来方差不齐,因此第一步的默认t检验设置正好是正确的。

library(car)leveneTest(dat$dd,dat$treat,median)

结果:

Levene’s Test for Homogeneity of Variance(center = median)

 Df F value   Pr(>F)

group 1 8.5909 0.008926 **

 18

Signif. codes:

0 ‘’ 0.001 ‘’ 0.01 ‘’ 0.05 ‘.’ 0.1 ‘’ 1

5、非参数检验

如果连正态都不满足呢?那就Wilcoxon非参数秩检验了,wilcox.test同样显示两组有显著性差异。

wilcox.test(dd~treat, dat)

结果:

     Wilcoxonrank sum test with continuity correction

data: dd by treat

W = 91.5, p-value = 0.001698

alternative hypothesis: true location shiftis not equal to 0

6、配对t检验与非参数秩检验

问第2组治疗前后血压是否有变化(治疗是否有效)?t检验在这里使用是有问题的,我们以后讨论,先看方法。

7、单样本t检验与非参数秩检验

问第1组的基线血压值是否大于140?

R语言笔记1:t检验和Wilcoxon检验相关推荐

  1. R语言 非参数检验:Mann-Whitney检验和Wilcoxon检验

    参数检验 非参数检验 分布特征 正态分布 非正态分布或未知分布 独立样本 独立t检验 Mann-Whitney检验 成对样本 配对t检验 Wilcoxon秩和检验paired 两独立样本t检验的假设条 ...

  2. R语言:B-M中位数检验和WMW检验

    文章目录 B-W检验 WMW检验 Mood方差检验 Moses方差检验 B-W检验 Brown-Mood检验与符号检验的思想类似,仅比较了两组数据的符号:类似于单样本的Wilcoxon符号秩检验,利用 ...

  3. R语言编写自定义函数使用Wilcoxon符号秩检验(Wilcoxon signed rank)实现多分组非参数成对检验(pairwise)、并使用p.adjust函数调整概率值

    R语言编写自定义函数使用Wilcoxon符号秩检验(Wilcoxon signed rank)实现多分组非参数成对检验(Nonparametric pairwise multiple comparis ...

  4. R语言笔记4_模型诊断(关于残差)

    R语言笔记4_模型诊断(关于残差)及模型补救(Box-Cox变换) 文章目录 R语言笔记4_模型诊断(关于残差)及模型补救(Box-Cox变换) 检验线性关系 检验方差齐性 检验残差正态性 检验离群值 ...

  5. R语言笔记——”org.Hs.eg.db“脱坑记录

    R语言笔记--"org.Hs.eg.db"脱坑记录 "org.Hs.eg.db"是发布在bioconductor平台上面的一个数据库文件,该包中装有较多的主流数 ...

  6. R语言与非参数检验之单样本位置检验

    学习笔记 学习书目:<统计学:从数据到结论>–吴喜之 非参数检验 啥是非参数检验 很多检验都假定了总体的背景分布,但也有些检验没有假定总体分布的具体形式,这些检验多根据数据观测值的相对大小 ...

  7. R语言笔记1:数据类型(向量、数组、矩阵、 列表和数据框)

    宏基因组按:科研中数据分析解读占用了我们太多时间,学习R语言是生物测序领域数据(reads count表)分析及可视化的首选.举个例子,扩增子分析从fastq到OTU表至多是de novo或refer ...

  8. R语言笔记-R语言数据挖掘方法及应用--1

    参考-<R语言数据挖掘方法及应用>-薛薇,学习笔记 --1---------------------------------------------- search() 当前工作区间加载了 ...

  9. R语言回归中的Hosmer-Lemeshow拟合优度检验

    在依赖模型得出结论或预测未来结果之前,我们应尽可能检查我们假设的模型是否正确指定.也就是说,数据不会与模型所做的假设冲突. 我们围绕回归技术进行一些咨询,帮助客户解决独特的业务问题.对于二元结果,逻辑 ...

最新文章

  1. 大疆没有边界:刚拳打GoPro,又脚踢优必选
  2. linux screen 命令详解
  3. python在线编辑器最新_Editor.md 二次开发-markdown在线编辑器
  4. android各层之间,Android运行程序在各层架构之间的相互关系
  5. win10计算机启动一分钟重启,Win10开机提示电脑将在一分钟后自动重启怎么办?...
  6. Android之事件分发机制
  7. 益生菌拯救“社恐”?肿瘤攘外安内?胎盘似癌?这个世界怎么了。。。
  8. python watchdog_Python watchdog
  9. sublime text3创建文件时生成头部注释
  10. java中有无穷大吗_Java语言中有无穷大
  11. atitit.web原理 理论attilax总结
  12. python:画图调整图例位置
  13. gen_fsm的学习笔记
  14. 华佳慧科技:OSN500设备ERPS相切环组网介绍
  15. windows桌面股票价格软件
  16. 创建一个Scrapy爬虫项目并运行
  17. 控制系统中对信号求导的注意事项
  18. 视频分辨率过高,导致部分手机播放失败
  19. Composition API使用记录
  20. 用python判断素数合数_使用Python判断质数(素数)的简单

热门文章

  1. Efficient multi-keyword ranked query over encrypted data in cloud computing (6)
  2. VTS-DEBUG VtsHalCameraProviderV2_4TargetTest CameraHidlTest.noHal1AfterP FAIL
  3. 108颗佛珠的含义,每颗佛珠都有含义
  4. ROS2编程基础课程--Launch
  5. 掌阅标签功能能否自定义名字?
  6. 初级计算机信息处理员笔试题,初级信息处理技术员计算机系统基础知识考试卷模拟考试^题...
  7. 字符串之正则表达式匹配
  8. 浅谈游戏数据分析---留存篇一-留存折损
  9. BNUOJ 53073 【找规律】
  10. JSP设置Excel表格换行_外企大公司的 Excel 表格,都是这样设置隐藏的