T检验，方差分析，非参数检验，卡方检验

一.T检验
- 1.T检验分类
- 2.T检验的使用前提
- 3.T检验的适用类型
二.非参数检验
- 1.非参数检验介绍
- 2.非参数检验适用类型
三.卡方检验
- 1.卡方检验介绍
- 2.卡方检验的分类
- 3.卡方检验的的适用类型
四.单因素方差分析
- 1.单因素方差分析介绍
- 2.单因素方差分析的使用前提
- 3.单因素方差分析的适用类型

一.T检验

1.T检验分类

T检验是通过比较不同数据的均值，研究两组数据之间是否存在显著差异。
单总体检验：单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布，如总体标准差未知且样本容量小于30，那么样本平均数与总体平均数的离差统计量呈t分布。

独立样本T检验：双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t检验又分为两种情况，一是独立样本t检验（各实验处理组之间毫无相关存在，即为独立样本），该检验用于检验两组非相关样本被试所获得的数据的差异性；一是配对样本t检验，用于检验匹配而成的两组被试获得的数据或同组被试在不同条件下所获得的数据的差异性，这两种情况组成的样本即为相关样本。

配对样本t检验：配对样本t检验可视为单样本t检验的扩展,其实质就是对差值进行单样本t检验。

2.T检验的使用前提

正态性；（单样本、独立样本、配对样本T检验都需要，可以用K-S检验法，在SPSS中的“分析”–“非参数检验”—“单样本”中；或者直接根据直方图、P-P图，Q-Q图来观察或根据偏度峰度法来分析）

独立性；（独立样本T检验要求）

方差齐性；（独立样本T检验要求，使用Levene’s检验，两样本T检验中提供Levene’s检验，如需更详细的检验结果可在“分析”–“描述统计”–“探索”中进行）

3.T检验的适用类型

单样本T检验：比较样本均数和总体均数
独立样本T检验：比较成组设计的两个样本，如比较两个班学生的某科目成绩
配对样本T检验：如用药前和用药后的两个人群的样本、同一样品用两种方法的比较，

二.非参数检验

1.非参数检验介绍

非参数检验(Nonparametric tests)是统计分析方法的重要组成部分，它与参数检验共同构成统计推断的基本内容。非参数检验是在总体方差未知或知道甚少的情况下，利用样本数据对总体分布形态等进行推断的方法。由于非参数检验方法在推断过程中不涉及有关总体分布的参数，因而得名为“非参数”检验。

2.非参数检验适用类型

链接：非参数检验来自百度.

两独立样本的非参数检验

两独立样本的非参数检验是在对总体分布不甚了解的情况下，通过对两组独立样本的分析来推断样本来自的两个总体的分布等是否存在显著差异的方法。独立样本是指在一个总体中随机抽样对在另一个总体中随机抽样没有影响的情况下所获得的样本。
SPSS中提供了多种两独立样本的非参数检验方法，其中包括曼-惠特尼U检验、K-S检验、W-W游程检验、极端反应检验等。

某工厂用甲乙两种不同的工艺生产同一种产品。如果希望检验两种工艺下产品的使用是否存在显著差异，可从两种工艺生产出的产品中随机抽样，得到各自的使用寿命数据。
甲工艺：675 682 692 679 669 661 693
乙工艺：662 649 672 663 650 651 646 652

曼-惠特尼U检验
两独立样本的曼-惠特尼U检验可用于对两总体分布的比例判断。其原假设：两组独立样本来自的两总体分布无显著差异。曼-惠特尼U检验通过对两组样本平均秩的研究来实现判断。秩简单说就是变量值排序的名次，可以将数据按升序排列，每个变量值都会有一个在整个变量值序列中的位置或名次，这个位置或名次就是变量值的秩。

K-S检验
K-S检验不仅能够检验单个总体是否服从某一理论分布，还能够检验两总体分布是否存在显著差异。其原假设是：两组独立样本来自的两总体的分布无显著差异。
这里是以变量值的秩作为分析对象，而非变量值本身。

游程检验
单样本游程检验是用来检验变量值的出现是否随机，而两独立变量的游程检验则是用来检验两独立样本来自的两总体的分布是否存在显著差异。其原假设是：两组独立样本来自的两总体的分布无显著差异。
两独立样本的游程检验与单样本游程检验的思想基本相同，不同的是计算游程数的方法。两独立样本的游程检验中，游程数依赖于变量的秩。

极端反应检验
极端反应检验从另一个角度检验两独立样本所来自的两总体分布是否存在显著差异。其原假设是：两独立样本来自的两总体的分布无显著差异。
基本思想是：将一组样本作为控制样本，另一组样本作为实验样本。以控制样本作为对照，检验实验样本相对于控制样本是否出现了极端反应。如果实验样本没有出现极端反应，则认为两总体分布无显著差异，相反则认为存在显著差异。

多独立样本的非参数检验
多独立样本的非参数检验是通过分析多组独立样本数据，推断样本来自的多个总体的中位数或分布是否存在显著差异。多组独立样本是指按独立抽样方式获得的多组样本。
SPSS提供的多独立样本非参数检验的方法主要包括中位数检验、Kruskal-Wallis检验、Jonckheere-Terpstra检验。
例：希望对北京、上海、成都、广州四个城市的周岁儿童的身高进行比较分析。采用独立抽样方式获得四组独立样本。

中位数检验
中位数检验通过对多组独立样本的分析，检验它们来自的总体的中位数是否存在显著差异。其原假设是：多个独立样本来自的多个总体的中位数无显著差异。
基本思想是：如果多个总体的中位数无显著差异，或者说多个总体有共同的中位数，那么这个共同的中位数应在各样本组中均处在中间位置上。于是，每组样本中大于该中位数或小于该中位数的样本数目应大致相同。

Kruskal-Wallis检验
Kruskal-Wallis检验实质是两独立样本的曼-惠特尼U检验在多个样本下的推广，也用于检验多个总体的分布是否存在显著差异。其原假设是：多个独立样本来自的多个总体的分布无显著差异。
基本思想是：首先，将多组样本数据混合并按升序排序，求出各变量值的秩；然后，考察各组秩的均值是否存在显著差异。容易理解：如果各组秩的均值不存在显著差异，则是多组数据充分混合，数值相差不大的结果，可以认为多个总体的分布无显著差异；反之，如果各组秩的均值存在显著差异，则是多组数据无法混合，某些组的数值普遍偏大，另一些组的数值普遍偏小的结果，可以认为多个总体的分布有显著差异。

Jonckheere-Terpstra检验
Jonckheere-Terpstra检验也是用于检验多个独立样本来自的多个总体的分布是否存在显著差异的非参数检验方法，其原假设是：多个独立样本来自的多个总体的分布无显著差异。
基本思想与两独立样本的曼-惠特尼U检验类似，也是计算一组样本的观察值小于其他组样本的观察值的个数。

两配对样本的非参数检验
两配对样本的非参数检验是对总体分布不甚了解的情况下，通过对两组配对样本的分析，推断样本来自的两个总体的分布是否存在显著差异的方法。
SPSS提供的两配对样本非参数检验的方法主要包括McNemar检验、符号检验、Wilcoxon符号秩检验等。

例：要检验一种新的训练方法是否对提高跳远运动员的成绩有显著效果，可以收集一批跳远运动员在使用新训练方法前后的跳远最好成绩，这样的两组样本便是配对的。再例如，分析不同广告形式是否对商品的销售产生显著影响，可以比较几种不同商品在不同广告形式下的销售额数据（其他条件保持基本稳定）。这里不同广告形式下的若干组商品销售额样本便是配对样本。可见，配对样本的样本数是相同的，且各样本值的先后次序是不能随意更改的。

McNemar检验
是一种变化显著性检验，它将研究对象自身作为对照者检验其“前后”的变化是否显著。其原假设是：两配对样本来自的两总体的分布无显著差异。

分析学生在学习“统计学”课程前后对统计学重要性的认知程度是否发生了显著改变，可以随机收集一批学生在学习“统计学”之前以及学完以后认为统计学是否重要的样本数据（0表示“不重要”，1表示“重要”）。

应该看到：两配对样本的McNemar检验分析的变量是二值变量。因此，在实际应用中，如果变量不是二值变量，应首先进行数据转换后方可采用该方法，因而它在应用范围方面有一定的局限性。
符号检验

符号检验也是用来检验两配对样本所来自的总体的分布是否存在显著差异的非参数方法。其原假设是：两配对样本来自的两总体的分布无显著差异。

首先，分别用第二组样本的各个观察值减去第一组对应样本的观察值。差值为正则记为正号，差值为负则记为负号。然后，将正号的个数与负号的个数进行比较，容易理解：如果正号个数和负号个数大致相当，则可以认为第二组样本大于第一组样本变量值的个数，与第二组样本小于第一组样本的变量值个数是大致相当的，从总体上讲，这两个组配对样本的数据分布差距较小；相反，如果正号个数和负号个数相差较多，则可以认为两个配对样本的数据分布差距较大。

应该看到：配对样本的符号检验注重对变化方向的分析，只考虑数据变化的性质，即是变大了还是变小了，但没有考虑变化幅度，即大了多少，小了多少，因而对数据利用是不充分的。

Wilcoxon符号秩检验
Wilcoxon符号秩检验也是通过分析两配对样本，对样本来自的两总体的分布是否存在差异进行判断。其原假设是：两配对样本来自的两总体的分布无显著差异。

基本思想是：首先，按照符号检验的方法，分布用第二组样本的各个观察值减去第一组对应样本的观察值。差值为正则记为正号，为负则记为负号，并同时保存差值数据；然后，将差值变量按升序排序，并求出差值变量的秩；最后，分布计算正号秩总和W+和负号秩和W-。
多配对样本的非参数检验

多配对样本的非参数检验是通过分析多组配对样本数据，推断样本来自的多个总体的中位数或分布是否存在显著差异。

例如，收集乘客对多家航空公司是否满意的数据，分析航空公司的服务水平是否存在显著差异；再例如，收集不同促销形式下若干种商品的销售额数据，分析比较不同促销形式的效果，再如，收集多名评委对同一批歌手比赛打分的数据，分析评委的打分标准是否一致，等等。

这些问题都可以通过多配对样本非参数检验方法进行分析。SPSS中的多配对样本的非参数检验方法主要包括Friedman检验、Cochran Q检验、Kendall协同系数检验等。

Friedman检验
Friedman检验是利用秩实现对多个总体分布是否存在显著差异的非参数检验方法，其原假设是：多个配对样本来自的多个总体分布无显著差异。

SPSS将自动计算Friedman统计量和对应的概率P值。如果概率P值小于给定的显著性水平0.05，则拒绝原假设，认为各组样本的秩存在显著差异，多个配对样本来自的多个总体的分布有显著差异；反之，则不能拒绝原假设，可以认为各组样本的秩不存在显著性差异。

基于上述基本思路，多配对样本的Friedman检验时，首先以行为单位将数据按升序排序，并求得各变量值在各自行中的秩；然后，分别计算各组样本下的秩总和与平均秩。多配对样本的Friedman检验适于对定距型数据的分析。

Cochran Q检验
通过对多个配对样本的分析，推断样本来自的多个总体的分布是否存在显著差异。其原假设是：多个配对样本来自的多个总体的分布无显著差异。
Cochran Q检验适合对二值品质型数据的分析。如二分的评价：1代表满意，0代表不满意。

Kendall协同系数检验
它也是一种对多配对样本进行检验的非参数检验方法，与第一种检验方法向结合，可方便地实现对评判者的评判标准是否一致的分析。其原假设是：评判者的评判标准不一致。
有6名歌手参加比赛，4名评委进行评判打分，现在需要根据数据推断这4个评委的评判标准是否一致。（见下页具体分析）

如果将每个被评判者对象的分数看做来自多个总体的配对样本，那么该问题就能够转化为多配对样本的非参数检验问题，仍可采用Friedman检验，于是相应的原假设便转化为：多个配对样本来自的多个总体的分布无显著差异。但对该问题的分析是需要继续延伸的，并非站在对6名歌手的演唱水平是否存在显著差异的角度进行分析，而是在认定他们存在差异的前提下继续判断4个评委的打分标准是否一致。

如果利用Friedman检验出各总体的分布不存在显著差异，即各个歌手的秩不存在显著差异，则意味着评委的打分存在随意性，评分标准不一致。原因在于：如果各个评委的评判标准是一致的，那么对于某个歌手来说将获得一致的分数，也就是说，评委给出的若干个评分的秩应完全相同，这就必然会导致各歌手评分的秩有较大的差异。

三.卡方检验

1.卡方检验介绍

卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度，实际观测值与理论推断值之间的偏离程度就决定卡方值的大小，如果卡方值越大，二者偏差程度越大；反之，二者偏差越小；若两个值完全相等时，卡方值就为0，表明理论值完全符合。

2.卡方检验的分类

（1）Pearson卡方检验
Pearson卡方检验只能告诉两种测量结果之间是否存在关联，但不能判断其是否具有一致性。
（2）Kappa一致性检验
检验两种区分同一属性的方法给出的结果是否一致，如两专家分别对10份作品进行差，中，好进行评价。另外，在数据分析中，比较两种预测方法的预测结果的一致性时也可能用到一致性检验。
（3）配对卡方检验

3.卡方检验的的适用类型

（1）检验某个连续变量的分布是否与某种理论分布一致。
（2）检验某个分类变量各类的出现概率是否等于指定概率。

性别	人数	期望频数
1	190	180
2	110	120

注意：在进行分析之前我们需要将人数加权到性别中。
（3）检验某两个分类变量是否相互独立。
（4）检验控制某种或某几种因素的作用后，另外两个分类变量是否相互独立。
（5）检验某两种方法的结果是否一致。如两种结果对同一批人进行诊断，其诊断结果是否一致。

四.单因素方差分析

1.单因素方差分析介绍

试验中要考察的指标称为试验指标，影响试验指标的条件称为因素，因素所处的状态称为水平，若试验中只有一个因素改变则称为单因素试验，若有两个因素改变则称为双因素试验，若有多个因素改变则称为多因素试验。方差分析就是对试验数据进行分析，检验方差相等的多个正态总体均值是否相等，进而判断各因素对试验指标的影响是否显著

2.单因素方差分析的使用前提

正态性；（单样本、独立样本、配对样本T检验都需要，可以用K-S检验法，在SPSS中的“分析”–“非参数检验”—“单样本”中；或者直接根据直方图、P-P图，Q-Q图来观察或根据偏度峰度法来分析）
独立性；（独立样本T检验要求）
方差齐性；（独立样本T检验要求，使用Levene’s检验，两样本T检验中提供Levene’s检验，如需更详细的检验结果可在“分析”–“描述统计”–“探索”中进行，如果不满足方差齐性的话可以进行对数变换、平方根变换、平方根反正弦变换、平方变换、倒数变换）

3.单因素方差分析的适用类型

前面所介绍的T检验只能对两个总体进行检验，而对于多个总体进行差异性推断的话会导致多次检验的误差会叠加，所以引入方差分析，可以进行均数间的多重比较、各组均数的精细比较（可以指定要比较的两个组，通过设定系数）

方差分析结束后如均值不同可进行两两比较，采用的方法有：
LSD法：用于事先计划好的比较，最灵敏；检验水准没有校正，每次都是α
Sidak法：第二灵敏；
Bonferroni法：用于事先计划好的比较，第三灵敏；
Scheffe法：多用样本含量不等的情况，第四灵敏；
Dunnett法：常用于多个实验组和一个对照组的比较，第五灵敏；

如研究使用药物不同品牌对植物生长的影响：

参考文章：
http://mrw.so/5XdEdO
SPSS统计分析基础教程第3版张文彤编著

T检验，方差分析，非参数检验，卡方检验，方差分析总结相关推荐

Excel T检验双样本等方差分析
Excel T检验双样本等方差分析 1 声明本文的数据来自网络,部分代码也有所参照,这里做了注释和延伸,旨在技术交流,如有冒犯之处请联系博主及时处理. 2 等方差分析简介方差分析(Analysis ...
t检验、方差分析、卡方检验统计量的构造
一.t检验 1.应用条件:正态分布.方差齐性(当两总体方差不等时,t检验不适用,需要用Cochran&Cox检验等) 2.t检验的理解:t检验的目的是比较两个样本的均值是否有差异,那么构造t统 ...
python做方差分析和卡方检验
from scipy.stats import chi2_contingency chi2_contingency([[40, 10], [10, 40]], False) 做卡方检验,结果为依次是 ...
SPS读书笔记1——均值比较（T检验，方差检验，非参数检验汇总）
均值比较一.T检验用途:比较两组数据之间的差异前提:正态性,方差齐次性,独立性假设:H0: μ0=μ1 H1: μ0≠μ1 SPSS中对应方法: 1.单样本T检验(One-sample Tes ...
matlab 计算一组数据的方差分析,多因素方差分析|MATLAB 数学统计与优化|MATLAB技术论坛 - Powered by Discuz!...
一般来讲,使用anovan函数进行多因素方差分析时,调用格式是第二种形式,{A,B,C,D}里面是没有编码的形式,返回一个方差分析表的形式,不过如果要求精度高的话,似乎不能显示更多的小数点位数. 不过 ...
R语言检验独立性：卡方检验(Chi-square test)和费舍尔精确检验分析案例报告
统计测试最常见的领域之一是测试列联表中的独立性.在这篇文章中,我将展示如何计算列联表,我将在列联表中引入两个流行的测试:卡方检验和Fisher精确检验. 什么是列联表? 列联表提供关于两个分类变量的测 ...
医学统计学题库带答案
一.最佳选择题 1. 比较相同人群的身高和体重的变异程度,宜用的统计指标是__ __. A. 全距 B. 标准差 C. 中位数 D. 变异系数 2. 反映一组偏态分布资料平均水平的指标宜用_ __. ...
如何正确区分方差分析、T检验、卡方检验的使用？
差异研究的目的在于比较两组数据或多组数据之间的差异,通常包括以下几类分析方法,分别是方差分析.T检验和卡方检验. 三个方法的区别其实核心的区别在于:数据类型不一样.如果是定类和定类,此时应该使用卡方 ...
方差分析/卡方/fisher精确检验
方差分析前提条件: 1.各样本须是相互独立的随机样本; 2.各样本来自正态分布总体; 3.各总体方差相等,即方差齐.(方差不齐,用非参数检验) 适用数据情况: 分类变量的连续变量例如: 卡方检验 ...

T检验，方差分析，非参数检验，卡方检验，方差分析总结