一、方差分析基本原理

1、方差分析(analysis of variance):k(k>=3)个样本平均数假设测验方法。

与j无关的变量都看成常数,此时summation代表的是次数

方差分析基本步骤:

(1)将资料总变异的自由度和平方和分解为各变异原因的自由度和平方和,并算的其均方

(2)计算均方比,做出F测验,以明了各变异因素的重要程度

(3)对各平均数进行多重比较

2、F分布与F测验(比较两个事物变异大小)

在一个平均数为、方差为的正态总体中,随机抽取两个独立样本,分别求得其均方,将其比值定义为F:

在给定的v1,v2下按上述方法从正态总体中进行一系列抽样,可得一系列的F值而作成一个F分布。

统计研究证明:

(1)F分布是具有平均数为1 ,取值空间为[0,]一组曲线

(2)某一特定曲线的形状仅取决于参数v1和v2,v1=1或2时,曲线是严重倾斜成反向J曲线,v1>=3时,曲线转为偏态。

在方差体系中,F测验可用于检测某项变异因素的效用或方差是否真实存在。在计算F分布时,总是将要测验的那一项变异因素的均方作为分子,另一项变异(如试验误差项)的均方作为分母。这个问题与方差分析的模型和各项变异来源的期望均方有关。在此测验中,若分子的均方小于分母的均方,则F<1,不用查表即可确定P>0.05,接受无效假设,所以分子必须是大均方。

F测验需具备:

(1)变数y遵循正态分布N(

(2)必须彼此独立

当资料不符合这些条件时,需做适当转换。

对一组处理的重复试验数据经对总平方和与总自由度的分解估计出   处理间均方与处理内均方(误差均方),通过F=MSt/MSe测验处理间所表示出的差异是否真实(比误差大),这一方法为方差分析法。所用统计假设H0:或HA:间存在差异(不一定三者都不等,可能部分不等)。

二、多重比较

对一组试验数据通过平方和与自由度的分解,将所估计的处理均方与误差均方作比较,由F测验推论处理间有显著差异,对有些试验方差分析已算告一段落,但对有些试验其目的不仅在于了解一组处理间总体上有无实质性差异,更在于了解哪些处理间存在真实差异,需进一步做处理平均数间的比较。一个试验中K个处理可能有K(K-1)/2个比较,这种比较是复式比较亦称多重比较(multiple comparisions)。

通过方差分析后进行平均数间的多重比较,不同于处理间两两单独比较。原因:

(1)误差由多个处理内的变异合并估计,自由度增大了,因而比较的精确度也增大了

(2)由于F测验显著,证实处理间总体上有真实差异后再做两两平均数的比较,不大会像单独比较时那样将个别偶然性的差异无误判为真实差异。在F测验基础上再做的平均数间多重比较称为Fisher氏保护下的多重比较(Fisher's protected multiple comparisons)。 在无F测验保护时,处理间两两比较,每一比较的显著水平=0.05,若处理间总体上无差异,每一比较误判为有差异的概率为0.05,则6个比较中至少有一个被误判的概率为'=1-=0.2649;若处理数k=10,则 '=1-=0.9006,因而尽管单个比较的显著水平为0.05,但从试验总体上 ' (至少有一个误判的概率)是很大的,说明通过F测验做保护是非常必要的。

多重比较的方法:最小显著差数法,复极差法(q法),Duncan氏新复极极差法。

方法一: 最小显著差数法(least significant difference,LSD法),实质是t测验(成组)。

程序:在处理间的F测验为显著的前提下,计算出显著水平为  的最小显著差数;任何两个平均数的差数(),其绝对值  ,即为在水平上差异显著;反之在水平上不显著。该法又称在F测验保护下的最小显著差数法。                                                                                                                                                                                                                                                        

方法二: q法(极差)

LSD法的t测验是根据两个样本平均数差数(k=2)的抽样分布提出的,但是一组处理(k>2)是同时抽取k个样本的结果。抽样理论指出k=2时与k>2,例如k=10时其随机极差是不同的,随着k的增大而增大,k=2时的t测验有可能夸大了k=10时最大与最小两个样本平均数差数的显著性。基于极差的抽样分布理论,Student-Newman-Keul提出了q测验或称负极差测验(SNK/NK测验)。

q测验方法是一组k个平均数由大到小排列后,根据所比较的两个处理平均数的差数是几个平均数间的极差分别确定最小显著极差的值。

q测验根据极差抽样分布原理,其各个 比较都保证同一个显著水平,其尺度值构成为:

=SE      SE=sqrt(MSe/n)

式中2pk,p是所有比较的平均数按大到小顺序排列所计算出的两极差范围内所包含的平均数个数(称为秩次距),SE是平均数的标准误。每一显著水平下有k-1个尺度值。平均数比较时,尺度值随秩次距的不同而异。

方法三: 新复极差法

不同秩次距P下的最小显著极差变幅比较大,因此,D.B.Duncan提出新复极差法,又称最短显著极差法(shortest significant ranges,SSR)。与q法相似,其区别在于计算最小显著极差时不是查q表而是查SSR表,所得最小显著极差值随k增大通常比q测验时减小。

=SE*

在不同秩次距p下,平均数间比较的显著水平按两两比较是   ,但按p个秩次距则为保护水平'=1-(1-)^(p-1)

二、多重比较结果的表示方法

(1)列梯形表法

(2)划线法

(3)标记字母法

首先将全部平均数从大到小依次排序,然后再最大的平均数标上字母a;并将该平均数与以下各平均数相比,凡相差不显著的都标上字母a,直至某一个与之相差显著的平均数则标以字母b(向下过程);再以标有该字母b的最大平均数为标准,与以下未标记的平均数比,凡不显著的继续标以字母b,直至某一个与之相差显著的平均数则标以字母c。……如此重复下去,直至最小的一个平均数有了标记且与以上平均数进行了比较为止。各个平均数间,凡有一个相同标记字母的即为差异不显著,没有相同标记的即为差异显著。

三、多重比较方法的选择

参考原则:

(1)试验事先确定比较的标准,凡与对照相比较,或与预定要比较,或与预定要比较的对象比较,一般可选用最小显著差数法

(2)根据否定一个正确的H0与接受一个不正确的H0的相对重要性来决定。

四、方差分析的线性模型与期望均方

方差分析是建立在一定线性可加模型基础上。线性可加模型是指总体每一个变量可以按其变异的原因分解成若干个线性组成部分,是方差分析的理论依据。

五、单项分组资料的方差分析

单项分组资料是指观察值仅按一个方向分组的资料。

(1)组内观察值数目相等

(2)组内观察值数目不等

(3)组内又分亚组的单向分组资料的方差分析,

每组又分若干个亚组,每个亚组内又有若干个观察值,则为组内分亚组的单项分组资料,或称系统分组资料。系统分组并仅限于组内分亚组,亚组内还可分小组,小组内还可分亚组,……,如此一环套一环地分下去---巢式试验。

统计假设测验------(四)方差分析(F测验、多重比较原理与方法)相关推荐

  1. 统计假设测验------(一)基本原理(假设测验的两类错误)

    1.导论: 一个试验相当于一个样本,由一个样本平均数可以对总体平均数做出估计,但样本平均数是因不同样本而变化的,即样本平均数有抽样误差.用存在误差的样本平均数来推断总体,其结论并不是绝对正确的.把试验 ...

  2. python方差分析图_【Python】统计科学之方差分析

    首页 专栏 python 文章详情 0 统计科学之方差分析 张俊红发布于 今天 07:40 上一篇讲了假设检验,这一篇讲讲方差分析. 1.背景: 假如你们现在针对用户提出了三种提高客单价的策略A.B. ...

  3. linux 统计日志数量总,shell统计日志中时间段内匹配的数量的方法

    shell统计日志中时间段内匹配的数量的方法,有需要的朋友可以参考下. 假设日志文件mtasvr.log格式如下: T:24583088(04:02:06)[root:Info] 6KqowLDLAg ...

  4. python整数二进制有多少个1_几种统计一个二进制数内有几个1的方法

    几种统计一个二进制数内有几个1的方法 方法一: int f1(int temp) { int num = 0; while(temp) { int t = temp%2; if(t == 1 || t ...

  5. python统计单词频率、存放在字典中_Python3实现统计单词表中每个字母出现频率的方法示例...

    本文实例讲述了Python3实现统计单词表中每个字母出现频率的方法.分享给大家供大家参考,具体如下: 作为python字典与数组概念的运用,统计字母表中每个字母出现的频率,作为练习再合适不过. 解决问 ...

  6. 第四课 脱壳必备知识要点及方法

    第四课  脱壳必备知识要点及方法 今天所要讲的是这高级篇中最为关键,最为重要的一课,希望大家能认真学习,反复推敲,举一反三学习脱壳的各种方法,当然有的时候可能需要几种方法一起使用,今后我们也会一点一点 ...

  7. python中小数点后取2位(四舍五入)以及取2位(四舍五不入)的方法总结

    在很多场景的计算中,最终得到的数值例如123.45678,要截取2位小数得到123.45,而不是默认的四舍五入方法得到123.46,如何实现呢? 文章目录 一.小数点后取2位(四舍五入)的方法 方法一 ...

  8. matlab数据整周期截断,凯塞窗四谱线插值FFT的电力谐波分析方法

    论文写作指导:请加QQ229366758 摘 要:针对在采用快速傅里叶变换分析电力谐波时,对信号非同步采样以及非整周期截断的情况下,会产生频谱泄露和栅栏效应,无法有效检测谐波的各参数值等问题,提出了加 ...

  9. 开机出现checking file system on C或者D E F盘符的解决方法

    http://kms.lenovots.com/kb/article.php?id=12616 开机出现checking file system on C或者D E F盘符的解决方法 出现这种情况一般 ...

最新文章

  1. Java中使用FTPClient上传下载
  2. mysql join大小表顺讯_MySQL优化器join顺序
  3. Programming Computer Vision with Python (学习笔记五)
  4. JavaScript---事件详解
  5. WPF整理-使用逻辑资源
  6. anasys hpc集群_这可能是最简单的并行方案,如何基于 AWS ParallelCluster 运行 ANSYS Fluent...
  7. Cloudera Manager内部结构、功能包括配置文件、目录位置等
  8. mysql的增_MySQL之增_insert-replace
  9. 【ElasticSearch】Es 源码之 PersistedClusterStateService 源码解读
  10. 相机模型之世界坐标、相机坐标、归一化坐标、图像坐标、像素坐标、内参、外参、转换关系总结
  11. 高德地图工具箱里有个“连接汽车”功能具体怎么用?
  12. webmin升级php,Centos linux下webmin安装及配置
  13. 将java类的泛型集合转换成json对象
  14. LINUX中安装gotop检测页面
  15. 小马激活工具出现Cannot open file k:\OEMSF 的解决方法
  16. Beagleboneblack的MLO文件干了些啥
  17. 工作中如果一直被领导忽略,你会怎么办?
  18. 如何查看windows凭据管理器-windows 凭据 里保存的密码
  19. 计算机组成原理--储存器概述
  20. 2021年Android开发者跳槽指南,工作感悟

热门文章

  1. 谷歌AlphaFold近日宣称预测出地球上几乎所有蛋白质结构
  2. 电脑连接打印机出现的问题(打印机显示未指定)解决方法
  3. C++ 网络编程下的socket编程(TCP\UDP),连接下位机
  4. 绕过Office文档的受保护视图
  5. ppt文件提示处于受保护状处理方案
  6. 艺术签名微信小程序源码/支持微信流量主
  7. 小妲己智能机器人要连接wifi吗_小度智能机器人怎么连wifi
  8. 二进制四进制八进制十六进制之间转换关系及浅谈文字在计算机中表示
  9. 07.26爬虫request模块之药监局学习笔记
  10. 第5章 LinearR/PLR/SVR/KNN/DTR/RFR(测算房价)