置换检验

置换检验(Permutation test),也称随机化检验或重随机化检验,是Fisher于20世纪30年代提出的一种基于大量计算(computationally intensive),利用样本数据的全(或随机)排列,进行统计推断的方法。
其对总体分布自由,应用较为广泛,特别适用于总体分布未知的小样本资料,以及某些难以用常规方法分析资料的假设检验问题,属于非参数检验方法。
与Bootstrap Methods类似,通过对样本进行顺序上的置换,重新计算统计检验量,构造经验分布,然后在此基础上求出P值进行推断。
步骤:
两独立样本比较 (A组 10个观测值, B组15个观测值)

  1. 与参数方法类似,计算观测数据的 ttt统计量,称为 t0t_0t0​;
  2. 将A、B两组数据合并到一个集合中
  3. 随机分配10个观测值到A组,剩下的分配15个观测值到B组;
  4. 计算并记录新观测的 ttt统计量;
  5. 对每一种可能随机分配重复步骤(3)~(4),此处有C2510C^{10}_{25}C2510​种可能的分配组合;
  6. 将C2510C^{10}_{25}C2510​个ttt 统计量按升序排列,这便是基于样本数据的经验分布;如果t0t_0t0​落在经验分布中间95%部分的外面,说明在零假设条件下这个数值是很少出现的,则在0.05的显著性水平下,拒绝两组的总体均值相等的零假设。

置换检验通常使用coin包,里面包含各种置换检验函数。

举例
现有“en”及“ch”两组独立数据

pacman::p_load(coin)
feature <-c(4508,21904,9.717835,0.039856,4.28406,4112,17423,8.474222,0.020499,5.00825,4632,33252,14.35751,0.032547,4.07546,4646,25483,10.96987,0.020499,5.00825)
group <- factor(c(rep("ch",10),rep("en",10)))
mydata <- data.frame(group,feature)
mydata # 长格式数据group      feature
1     ch  4508.000000
2     ch 21904.000000
3     ch     9.717835
4     ch     0.039856
5     ch     4.284060
6     ch  4112.000000
7     ch 17423.000000
8     ch     8.474222
9     ch     0.020499
10    ch     5.008250
11    en  4632.000000
12    en 33252.000000
13    en    14.357510
14    en     0.032547
15    en     4.075460
16    en  4646.000000
17    en 25483.000000
18    en    10.969870
19    en     0.020499
20    en     5.008250oneway_test(feature~group, data=mydata, distribution="exact")Exact Two-Sample Fisher-Pitman Permutation Test
data:  feature by group (ch, en)
Z = -0.44355, p-value = 0.6614
alternative hypothesis: true mu is not equal to 0

置换检验使用条件:
假定数据成正态分布并不合适;
担心离群点的影响;
对于标准的参数方法来说数据集太小。

长短格式数据转换

数据整形既有专门的包也可用R内置的函数作简单变换。

mydata2 <- unstack(mydata, feature~group) #转换为宽格式
mydata2ch           en
1   4508.000000  4632.000000
2  21904.000000 33252.000000
3      9.717835    14.357510
4      0.039856     0.032547
5      4.284060     4.075460
6   4112.000000  4646.000000
7  17423.000000 25483.000000
8      8.474222    10.969870
9      0.020499     0.020499
10     5.008250     5.008250

两样本秩和配对检验

 with(mydata2,wilcox.test(ch,en,paired = TRUE))Wilcoxon signed rank test with continuity correction
data:  ch and en
V = 3, p-value = 0.04232
alternative hypothesis: true location shift is not equal to 0

其他非参数秩和检验可参考R语言差异检验:非参数检验

置换检验 配对秩和检验相关推荐

  1. 微生物组数据库: 一站式环境基因组学数据云平台更新啦!

    微生物生态学学科的快速发展产生了大量的序列数据集,目前一般存储在NCBI.ENA和MG-RAST等国际生物信息学数据库.但是这些数据库缺少用于检索.整合和重新分析多个独立数据集所必需的信息,导致现有数 ...

  2. 超效率dea模型_【探索】基于超效率DEA模型的我国公立医院排行榜研究

    点击标题下「蓝色微信名」可快速关注 文章来源: 中华医院管理杂志, 2020,36 (11):896-901 作者: 郭淑岩  李萌  杨威  杨婷婷  尹畅  胡广宇  董四平 DOI:10.376 ...

  3. 有搜python题目的软件吗_Python开发及应用-中国大学mooc-试题题目及答案

    [单选题]人性化设计原则是在设计中对人的心理.生理需求和精神追求的尊重与满足,是设计中的( ),是对人性的尊重. A. 价值体现 B. 创意思维 C. 文化意蕴 D. 人文关怀 [判断题]液化石油气的 ...

  4. SPSS随机对照研究总结

    医学研究最常见类型有3类,包括实验性研究,观察性研究和文献研究.实验性研究最常见的是随机对照研究,观察性研究主要包括横截面研究.病例对照研究.队列研究,其中横截面研究这一类型,最常见的是现况调查.本篇 ...

  5. 统计学习 | 正态分布 Normal Distribution

    参考资料 统计学-1:判断数据是否满足正态分布 - 知乎 (zhihu.com) 正态分布!你真的了解么?_检验 (sohu.com) 正态检验 (Normality Test)--常见方法汇总与简述 ...

  6. 单因素设计一元定量资料差异性分析(一)-- 单组设计一元定量资料 t检验 与 符号秩和检验、配对设计一元定量资料 t检验 与 符号秩和检验

    单组设计一元定量资料 t检验 与 符号秩和检验 1.1.1 问题与数据 例1-1 已知玉米单交种群 105 的平均穗重为300克.喷药后,随机抽取九个果穗.其穗重分别为308g.305g.298g.3 ...

  7. R语言实战笔记--第十二章 重抽样(置换检验)与自助法

    R语言实战笔记–第十二章 重抽样(置换检验)与自助法 标签(空格分隔): R语言 重抽样 自助法 置换检验 置换检验 双样本均值检验的时候,假设检验的方法就是,检查正态性.独立性.方差齐性,分别对应的 ...

  8. R语言四格表、列联表秩和检验

    R语言四格表.列联表秩和检验 秩和检验方法最早是由维尔克松(Wilcoxon)提出,叫维尔克松两样本检验法.后来曼-惠特尼将其应用到两样本容量不等(n1不等于n2)的情况,因而又称为曼-惠特尼U检验. ...

  9. R语言 配对t检验,对子变量到底填在哪?t.test paired=TRUE???

    使用本地数据 鸢尾花(yuān wěi huā)做配对t检验 t.test示例 提取两个物种的处理介绍看之前提到的空因子处理 #加载数据和包 data(iris) library(tidyverse) ...

  10. Science子刊: 类配对分析法揭示孤独症患者肠道菌群解毒功能受损

    Science Advances: 类配对分析法揭示孤独症患者肠道菌群解毒功能受损 标题:类配对法揭示孤独症谱系障碍儿童肠道微生物解毒功能受损 Title:A quasi-paired cohort ...

最新文章

  1. 一直被喷不实用的超算 在深度学习时代会改变吗?
  2. Android性能优化典范第四季
  3. 使用文本挖掘实现站点个性化推荐
  4. java 反射api_Java的反射API
  5. LeetCode 1656. 设计有序流(数组)
  6. 95-130-502-源码-source-ElasticSearch相关-ElasticSearch connector
  7. C++ 模板元编程简介
  8. 金蝶oracle用鼎信诺取数,取数软件 审计取数软件?
  9. win8计算机修改mac,快捷MAC地址修改器
  10. 讲师面试流程及试讲指导
  11. 34.UCASE() LCASE() 函数
  12. 华为路由TC7102实现一根网线分离同时支持路由器无线网络使用和电信IPTV机顶盒播放的方法步骤
  13. ballerina 学习 三十二 编写安全的程序
  14. JAVA多线程向kafka的topic各分区中写入本地数据
  15. [总结]FFMPEG视音频编解码零基础学习方法
  16. CSS制作各种三角形写法
  17. STM32三菱FX1N,FX2N,FX3U,PLC方案 可以直接上传下载梯形图,在线监控,具有称重功能,数码管功能,可以做到10路模拟量
  18. 有效沟通bic法则_猎头支招:工作中有效沟通的法则
  19. xm在线转换成mp3_也就索尼敢了!4000多卖QQ音乐还不送会员,安卓MP3咋这么贵?...
  20. java之program arguments与VM arguments

热门文章

  1. css 图片剪切object-fit属性
  2. php大量邮件,PHPMailer批量发送邮件的实例代码
  3. matlab 轮廓系数,kmeans聚类理论篇K的选择(轮廓系数)
  4. codevs 1329 东风谷早苗
  5. 电脑小白须知!N卡和A卡有什么区别?A卡和N卡的区别,一个动图秒懂!
  6. 15.计算几何: 坐标值的精度【eps、sgn()、dcmp()】+ 平面上的点用struct表示 + 向量的定义与加减乘除
  7. 基于AD7705的32路AD采集
  8. 如何将英文PDF翻译成中文且格式不变?(PDF免费翻译攻略)
  9. 中国象棋《棋经论》及象棋布局歌诀,值得研究、细细品味
  10. RNN学习:利用LSTM,GRU层解决航空公司评论数据预测问题