*** 单因素方差分析&多因素方差分析 (前提:满足正态假设和方差齐型)
GLM(非均衡可用):一般线性模型,有均值检验与比较功能; class b;model a=b;means b;
ANOVA:用于均衡设计观测数据的方差分析;class b;model a=b ;means b;
TTEST:两独立样本均值的比较.
glm过程/anova:class a b c;model y=a b c ab ac bc ab*c /ss3 ss1;means
*** 齐性检验
glm/anova 过程 means /hovtest;
***均值估计与比较
anova 过程 means

***glm过程 (多重比较)
means /
检验 lsd tukey alpha
置信区间 cldiff
排列 lines
***estimate ‘US vs FOREIGH’ (名称) brand(分类变量) 2 2 2 -3 -3(各个分类变量的系数);
(均值线性函数的估计:如估计 (m1+m2)/2 - m3)
***contrast ‘A-L vs C-L’ brand 1 1 -2 0 0;
(预定的比较:如检验 H0: (m1+m2)/2=m3)

均衡设计
非均衡设计

anova
glm
class
model /ss3 ss1
means /lsd tukey dunnett cldiff lines hovtest
contrast
estimate

概念
方差分析(ANOVA)
在方差分析中,我们把
试验数据(响应变量)的总变差(总波动)
分解为所考察因素(分类变量)的变差和由随机因素引起的变差,
然后通过分析比较这些变差来推断哪些因素对指标(响应变量)影响最显著,哪些不显著.
试验数据(响应变量)的总变差(总波动)=考察因素(分类变量)的变差+随机因素引起的变差

对多个均值进行统计推断通常使用方差分析,方差分析的问题与模型:
为了比较不同配方和工艺条件对产品产量和质量的影响,往往需要进行多个总体均值的比较.

方差分析:就是对两个或多个总体均值进行比较最常用的一种统计方法.
在方差分析中:
指标X(因变量或响应变量):记录各种试验条件下的观测结果;
因素(自变量或分类变量):各试验条件分类变量值又称为水平.

单因素问题:观测到的数据的均值受同一因素不同水平的影响,即依赖于因素的第?个水平

多因素方差分析 :但在一些实际问题中,影响指标(因变量)的因素(自变量)不止一个,这就要考虑两个或多个因素的问题.另这些因素间还可能存在交互作用,即这些因素的水平之间的不同搭配对指标可能有影响.

在方差分析中,不论是单因素或多因素的实验结果,
都是检验关于参数的一个整体的假设.若原假设被拒绝,表明某个因素各个水平下的响应有显著差异或因素间存在交互影响
但并不了解某两个水平下响应是否有差异.所以在方差分析后,尤其原假设被拒绝后,
还常需要对各水平下响应的均值进行估计和比较.常用的有线性估计、预定的比较与多重比较.

多重比较:从所有均值对中找出均值不等的对, 用MEANS 语句;
均值线性函数的估计:如估计 (m1+m2)/2 - m3 ,用ESTIMATE语句;
预定的比较:如检验 H0: (m1+m2)/2=m3,用CONTRAST语句;

例1.1(胶合板磨损试验):为比较5种不同品牌产品的质量,每种抽取4个做磨损试验.试用编程的方法比较5种品牌的质量有无显著差异.
解: proc anova data=veneer;
class brand;
model wear=brand;
run;
或 proc glm data=veneer;
class brand;
model wear=brand;
run;
结论:由方差分析表或因素的效应检验结果可知:
F=7.40,
p=0.0017<0.05
故五种品牌的质量有显著差异.

多重比较:
用MEANS语句及选项要对许多对均值进行比较,关心的问题是如何控制错判均值为不等的概率.
LSD(Least Signification Difference) 对每一对均值都使用t-检验(实际至少误判一对的概率>a);
TUKEY比较所有的均值对并控制误判概率<=a。是一种比较保守的方法(较其它方法难于区分均值的不同);
Bonferroni与TUKEY类似; WALLER,DUNCAN,SCHEFFE,
DUNNETT,GABRIEL, REGWQ,REGWF 介于两者之间.
cldiff: 生成每对均值差的置信限(LSD,Tukey);
lines: 将均值降序排列并对不显著的组以同一字母注明,仅在各处理样本容量相同时可用;
alpha: 均值比较的显著性水平,缺省alpha=0.05.

预定的比较: 用CONTRAST语句及选项
例如检验 H0: (m1+m2)/2=m3contrast ‘1,2 vs 3’ brand 0.5 0.5 -1;


(3) 对5种品牌胶合板的平均磨损数量进行估计,并对这5种品牌两两进行比较,找出质量有显著性差异的哪几对品牌(alpha=0.1).

proc glm data=veneer;
class brand;
model wear=brand;
estimate ‘US vs FOREIGH’ brand 2 2 2 -3 -3;
contrast ‘A-L vs C-L’ brand 1 1 -2 0 0;
run;

tabulet

方法选择

如果存在明确的对照组,要进行的是验证性研究,即计划好的某两个或几个组间(都和对照组)的比较,宜用Bonferroni(LSD)法;
若需要进行的是多个均数间的两两比较(探索性研究),且各组人数相等,适宜用Tukey法或SNK(q)检验。相比之下,后者更方便一些,但是如果比较的组数特别多,则SNK法的假阳性较高;
若需要进行的是多个均数间的两两比较(探索性研究),但各组人数相等,且组数较多,比较较为复杂,则宜用Scheffe法。

? LSD法:即最小显著差法(Least-Significance-DifferenceMethod),是最简单的比较方法之一。它其实只是t检验的一个简单变形,并未对检验水准做出任何校正,只是在标准误的计算上充分利用了样本信息,为所有组的均数统一估计出了一个更为稳健的标准误,因此它一般用于计划好的多重比较。由于单次比较的检验水准仍为α,因此可以认为LSD法是最灵敏的。
? Sidak法:它实际上就是Sidak校正在LSD法上的应用,即通过Sidak校正降低每次两两比较的一类错误率,以达到最终整个比较的一类错误率为α的目的。但是,由于在统计分析中习惯上是将每次比较的水准都定为0.05,为符合阅读习惯,统计软件往往采用倒乘的方式,即固定检验水准,将检验的P值进行反向放大。例如当需要进行c次比较时,对于相同的比较,Sidak法的P值和LSD 法P值间的关系为PSidak =1-(1-PLSD)c。显然,Sidak法要比LSD法保守得多。
? Bonferroni法:和Sidak法类似,它的每一次比较实际上是Bonferroni校正在LSD法上的应用,对于相同的比较,Bonferroni法的P值和LSD 法P值间的关系为PB onferroni =PLSD ×C。一般而言,Bonferroni要比Sidak法更为保守一些。
? Scheffe法:与一般的多重比较不同,Scheffe法的实质是对多组均数间的线性组合是否为0进行假设检验(即所谓的Contrast)。多用于进行比较的两组间样本含量不等时。
? Dunnett法:常用于多个试验组与一个对照组间的比较。因此在指定Dunnett法时,还应
当指定对照组。

以上几种方法的排列顺序大致是从最灵敏到最保守,除了它们几个以外,还有另外一大类目的在于寻找同质亚组的检验方法,常见的有:
? S-N-K法:经常在有关统计学教材上出现的方法,全称为Student-Newman-Keuls法。它实质上是根据预先指定的准则将各组均数分为多个子集,利用StudentizedRange分布来进行假设检验,并根据所要检验的均数的个数调整总的一类错误概率不超过α。
? Tukey法:即Tukey’sHonestlySignificantDifference法,***应用这种方法要求各组样本含量相同。它也是利用StudentizedRange分布来进行各组均数间的比较,与S-N-K法不同地是,它控
制所有比较中最大的一类错误的概率,即MEER不超过α。
? Duncan法:其思路与S-N-K 法相类似,只不过检验统计量服从的是Duncan’sMultipleRange分布。

两两比较方法如此之多,该如何加以选择?很多统计学家对方差分析后两两比较的策略均提出了自己的看法,国内也有多篇文献对不同方法进行比较。以下是笔者查阅多本参考书后的心得,仅供参考。
(1)如两个均数间的比较是独立的,或者虽有多个样本均数,但事先已计划好要作某几对均数的比较,则不管方差分析的结果如何,均应进行比较。一般采用LSD法或Bonferroni法。
(2)如果事先未计划进行多重比较,在方差分析得到有统计学意义的F值之后,可以利用多重比较进行探索性数据分析。此时方法的选择要根据研究的目的和样本的性质。比如说,需要进行多个试验组和一个对照组的比较时,可以采用Dunnett法;需要进行任意两组之间的比较而各组样本含量又相同时,可以选用Tukey法;若样本含量彼此不同时,可以采用Scheffe法。而若是事先未计划进行多重比较,且方差分析未检出差别,此时不应当进行多重比较。
(3)绘制MeansPlot图,或者进行详细的统计描述有利无弊。
(4)事先未计划的多重比较,各组间的差别只是一种提示,要确认这种差别最好重新设计
实验。

SAS 方差分析(复习4)相关推荐

  1. SAS期末复习知识点总结(应用多元统计实验笔记)

    SAS复习目录 一.数据集的建立.存储.导出.导入和编辑: 二.统计数据的描述性分析 三.一元线性回归分析 四.多元线性回归分析与残差分析 五.主成分分析 六.因子分析 七.判别分析 八.聚类分析 一 ...

  2. SAS实验05 ——方差分析

    实验05 方差分析 一.实验目的 完成方差分析的实验,进行初步了解其作用功能 二.实验内容 ①某药物对小鼠ldl浓度的影响是否有显著差异 ②肉馅种类.厨师种类是否对包子肉馅的多少有显著差异 ③生理盐水 ...

  3. 【SAS应用统计分析】方差分析

    声明:本文知识参考内容来自网络,如有侵权请联系删除. 目录 [anova过程] 1.anova过程的语句格式 2.语句说明 [glm过程] 1.glm过程的语句格式 2.语句说明 [实例分析] [实验 ...

  4. 方差分析分类及SAS实现代码

    方差分析为多样本检验,其核心为假设检验,此外,方差分析还可以做多重比较.方差分析本身是一种假设检验,同时也是一种模型,是回归模型的特例,回归模型为线性模型,方差分析为一般线性模型.实际应用中方差分析单 ...

  5. 数据分析统计学原理第十三章:实验设计与方差分析 | 我的统计学原理复习日记

    统计研究可以分为实验性研究与观测性研究两类.在实验性统计研究中,数据是通过实验产生的.一项实验首先要从确定一个我们感兴趣的变量开始.然后确定并控制一个或多个其他变量,这些其他变量与我们感兴趣的变量是相 ...

  6. sas统计分析学习笔记(九)——方差分析

    1.简介 当数据多于两组时,T检验或者相应的非参数分析不再适应,这时需要使用方差分析. 2.单因素方差分析 零假设为所有组的均值相等,备择假设是不是所有平均数都相等.F=组间方差/组内方差=[组间平方 ...

  7. SAS概念知识点 (复习1)

    概念部分 作业一: g) SAS语句通常以一个关键字开头.每一个SAS语句都以分号结尾.可以使用 contents过程查看SAS 数据集的描述部分.字符型变量长度最多能有 32767 字符长,并且每个 ...

  8. SAS学习8、9(方差分析、anova过程、相关分析和回归分析、corr过程、reg过程、多元线性回归、stepwise)

    方差分析(anova过程) 做方差分析前提是假设每一个随机变量是符合正态分布的,且方差是一样的 可以两两构造t检验进行分析 anova过程是交互式过程,需要quit退出 可以看到下面分成了两组 单因素 ...

  9. SAS——列联表(复习3)

    概念 列联分析解决的问题: 两个分类之间是否存在相关性 例:不同性别对颜色的喜好是否显著不同 属性变量类型(分类变量:只有有限个值)(连续型变量取值较少时也可以做属性变量使用,变量的类型不是绝对不变的 ...

  10. SAS软件介绍单元测验

    很坑的测试,复习一下 :)? 在SAS程序中,注释语句的写法是? /-/ 在SAS程序中,如何一行一条记录读入一个字符型变量 input x$@ 如何在SAS程序中调用假设检验模块的关键命令 ttes ...

最新文章

  1. Python List append()方法
  2. 腾讯云【人脸识别】服务的一次尝试(JAVA)
  3. vue中使用watch监听$route 无效问题
  4. SAP Spartacus Multi-Site Configuration
  5. base cap 分布式_高并发架构系列:详解分布式一致性ACID、CAP、BASE,以及区别
  6. 给你的Mr.Right画张择偶地图像
  7. mysql 对表插入多行_MySQL表中怎么一次插入两行或更多行
  8. hutool的定时任务不支持依赖注入怎么办_设计一个任务调度算法,时间轮算法,比优先队列更高效...
  9. 浅谈Java中类加载机制
  10. JAVA 一个或多个空格分割字符串
  11. 4k笔记本安装linux,Dell 4K Linux 笔记本 M3800 发售
  12. php session实现原理
  13. virtualbox启动后一直黑窗_UBUNTU18.04 安装virtualbox-6.0,出现rc=-1908问题解决方法
  14. python selenium点击网页关闭按钮_基于python的selenium-打开关闭第二个页面
  15. 苹果登陆qq邮箱服务器,iPad和iPhone如何登陆QQ邮箱 怎么设置
  16. imx6 Android gpu 内存,Use vivante GPU on IMX6 with 4.14 kernel
  17. linux mysql 开发环境_RedHat Linux下QT平台MySQL数据库开发环境配置
  18. 中小企业的公司财务管理系统
  19. 高德地图android拖动地图,建议高德地图添加地图拖动事件,添加方法如内容所述...
  20. JTAG和SWD定义

热门文章

  1. c语言实现mysql通配符_Mysql的C语言接口简单实现电话本功能
  2. linux之limit.conf
  3. HMI-40-【节能模式】平均油耗实现
  4. 怎样查看苹果服务器验证关闭,iPhone小技巧:如何查询 iOS 系统是否已经关闭验证?...
  5. 自定义CDH parcel
  6. itest考试切屏能检测出来吗_itest测试
  7. halcon轮廓选择
  8. 剑指offer20题——leetcode主站65题
  9. kali 安装volatility_linux网络命令 【Volatility】取证实战
  10. 计算机图形学VC 配置,计算机图形学(VC++实现)(第2版)