sas统计分析学习笔记(九)——方差分析
1.简介
2.单因素方差分析
DATA READING;INPUT GROUP $ WORDS @@;
DATALINES;
X 700 X 850 X 820 X 640 X 920
Y 480 Y 460 Y 500 Y 570 Y 580
Z 500 Z 550 Z 480 Z 600 Z 610
;
PROC ANOVA DATA=READING;TITLE "Analysis of Reading Date";CLASS GROUP;*指定自变量;MODEL WORDS=GROUP; *指定分析模型;MEANS GROUP;*计算GROUP的每个水平上的WORDS平均值;
RUN;
3.对比检验
PROC GLM DATA=READING;CLASS GROUP;MODEL WORDS=GROUP;CONTRAST 'X VS. Y AND Z' GROUP -2 1 1;CONTRAST 'METHOD Y VS Z' GROUP 0 1 -1;
RUN;
单因素设计中,CONTRAST语句就是在关键词CONTRAST后跟比较检验的标签(单引号内)、自变量(CLASS)、和k个系数集
4.两个自变量的方差分析
组别 | |||
X | Y | Z | |
男性 | 700 | 480 | 500 |
850 | 460 | 550 | |
820 | 500 | 480 | |
640 | 570 | 600 | |
920 | 580 | 610 | |
女性 | 900 | 590 | 610 |
880 | 540 | 660 | |
899 | 560 | 525 | |
780 | 570 | 610 | |
899 | 555 | 645 |
在GENDER的每个水平上都有三种阅读方法,这种类型的设计叫做因子设计。总平方和现在被分为4部分。来自GROUP差异的平方和,来自GENDER差异的平方和,GENDER和GROUP的结合,以及误差平方和。
DATA TWOWAY;LENGTH GROUP GENDER $ 1;INPUT GROUP $ GENDER $ WORDS @@;
DATALINES;
X M 700 X M 850 X M 820 X M 640 X M 920
Y M 480 Y M 460 Y M 500 Y M 570 Y M 580
Z M 920 Z M 550 Z M 480 Z M 600 Z M 610
X F 900 X F 880 X F 899 X F 780 X F 899
Y F 590 Y F 540 Y F 560 Y F 570 Y F 555
Z F 520 Z F 660 Z F 525 Z F 610 Z F 645
;
PROC ANOVA DATA=TWOWAY;TITLE "Analysis of reading data";CLASS GROUP GENDER;MODEL WORDS=GROUP|GENDER;MEANS GROUP|GENDER /SNK;
RUN;
同前面一样,CLASS 后面是自变量列表。在MODEL语句里的GROUP和GENDER之间的竖线表明我们使用因子设计(也称交叉设计)。如果不用竖线也可使用*,但遇到多维设计时,比较麻烦,多维时下面两种表达等价:
5.解释显著地交互作用
安慰剂(PLACEBO) | 利他林(RITALIN) | |
正常 | 50 | 67 |
45 | 60 | |
55 | 58 | |
52 | 65 | |
多动症 | 70 | 51 |
72 | 57 | |
68 | 48 | |
75 | 55 |
研究中变量命名为GROUP(NORMAL HYPER)、DRUG(PLACEBO RITALIN)、ACTIVITY(活跃度)。
DATA RITALIN;DO GROUP = 'NORMAL','HYPER';DO DRUG = 'PLACEBO','RITALIN';DO SUBJ = 1 TO 4;INPUT ACTIVITY @;OUTPUT;END;END;END;
DATALINES;
50 45 55 52 67 60 58 65 70 72 68 75 51 57 48 55
;
PROC ANOVA DATA=RITALIN;TITLE "Activity Study";CLASS GROUP DRUG;MODEL ACTIVITY = GROUP|DRUG;MEANS GROUP|DRUG;
RUN;
此处使用了DO循环,当然也可以直接输入 INPUT GROUP $ DRUG $ ACTIVITY;
还有另一种方法进行上述T检验:将院士变量的每个处理水平相结合,生成一个新的自变量,这样就把两因素ANOVA分解成了单因素ANOVA,可以用串联符号||创建CONDITION变量,在data步骤中加入语句:
DATA RITALIN;DO GROUP = 'NORMAL','HYPER';DO DRUG = 'PLACEBO','RITALIN';DO SUBJ = 1 TO 4;INPUT ACTIVITY @;CONDITION=GROUP||DRUG;OUTPUT;END;END;END;
DATALINES;
50 45 55 52 67 60 58 65 70 72 68 75 51 57 48 55
;
PROC ANOVA DATA=RITALIN;TITLE "ONE-WAY ANOVA Ritalin study";CLASS CONDITION;MODEL ACTIVITY=CONDITION;MEANS CONDITION /SNK;
RUN;
还可以运用对比检验:
PROC GLM DATA=RITALIN;TITLE "ONE-WAY ANOVA Ritalin study";CLASS CONDITION;MODEL ACTIVITY=CONDITION;CONTRAST 'Hyperactive only' CONDITION -1 1 0 0 ;CONTRAST 'NORMAL only' CONDITION
6.多因素设计
7.非平衡设计:PROC GLM
甜度水平 | |||
1 | 2 | 3 | |
香草 | 9 | 8 | 6 |
7 | 7 | 5 | |
8 | 8 | 7 | |
7 | |||
巧克力 | 9 | 8 | 4 |
9 | 7 | 5 | |
7 | 6 | 6 | |
7 | 8 | 4 | |
8 | 4 |
DATA PUDDING;LENGTH FLAVOR $ 9;INPUT FLAVOR $ SWEET RATING @@;
DATALINES;
VANILLA 1 9 VANILLA 2 8 VANILLA 3 6
VANILLA 1 7 VANILLA 2 7 VANILLA 3 5
VANILLA 1 8 VANILLA 2 8 VANILLA 3 7
VANILLA 1 7
CHOCOLATE 1 9 CHOCOLATE 2 8 CHOCOLATE 3 4
CHOCOLATE 1 9 CHOCOLATE 2 7 CHOCOLATE 3 5
CHOCOLATE 1 7 CHOCOLATE 2 6 CHOCOLATE 3 6
CHOCOLATE 1 7 CHOCOLATE 2 8 CHOCOLATE 3 4
CHOCOLATE 1 8 CHOCOLATE 3 4
;
PROC GLM DATA=PUDDING;TITLE "Pudding Taste Evaluation";TITLE3 "Two-way ANOVA - Unbalanced Design";TITLE4 "---------------------------------";CLASS FLAVOR SWEET;MODEL RATING = FLAVOR|SWEET/SS3;*采用第三类平方和;LSMEANS FLAVOR|SWEET/PDIFF ADJUST=TUKEY;*LSMEANS为使用最小二乘法校正主效应平均数,PDIFF用于计算所有配对差异的概率,ADJUST=TUKEY是对多检验的校正;
RUN;
程序中加入的TITLE语句,TITLEn表示SAS输出中的第n行,TITLE和TITLE1等价。
8.协方差分析
组别 | |||
A | B | ||
数学成绩 | IQ | 数学成绩 | IQ |
260 | 105 | 325 | 126 |
325 | 115 | 440 | 135 |
300 | 122 | 425 | 142 |
400 | 125 | 500 | 140 |
390 | 138 | 600 | 160 |
DATA COVAR;LENGTH GROUP $ 1;INPUT GROUP $ MATH IQ @@;
DATALINES;
A 260 105 A 325 115 A 300 122 A 400 125 A 390 138
B 325 126 B 440 135 B 425 142 B 500 140 B 600 160
;
PROC CORR DATA=COVAR NOSIMPLE;TITLE "Covariate Example";VAR MATH IQ;
RUN;
PROC TTEST DATA=COVAR;CLASS GROUP;VAR MATH IQ;
RUN;
通过计算相关系数检验数学成绩和IQ之间的关系,并通过t检验考察A、B两组是否有显著差异。
PROC GLM DATA=COVAR;CLASS GROUP;MODEL MATH=IQ GROUP/SS3;LSMEANS GROUP;
*上两步为校正IQ;
RUN;
sas统计分析学习笔记(九)——方差分析相关推荐
- sas统计分析学习笔记(六)
1.lag函数 LAG函数返回上次执行时的自变量值,而不是上一个观测值,下面例子能说明这个特点: DATA LAGGARD; INPUT X; IF X GT 5 THEN LAG_X=LAG(X); ...
- sas统计分析学习笔记(一)
一.基本规则 1.DATA步骤:定义数据和创建数据集,以DATA 开始,以DATALINES结束:PROC步骤:定义统计分析的类型,每个PROC过程后接一个run语句. 2.SAS变量名必须遵循以下原 ...
- [统计学笔记九] 方差分析(ANOVA)
[统计学笔记九] 方差分析(ANOVA) 方差分析(Analysis of Variance,简称ANOVA) 方差分析(ANOVA)又称"变异数分析"或"F检验&quo ...
- 概率与统计分析学习笔记
注:该文是上了开智学堂数据科学基础班的课后做的笔记,主讲人是肖凯老师. 概率与统计分析 描述性分析 用一个数字描述一组数字的特征.用一个数字来归纳一组数字,这个数字称为统计量或统计指标. 均值.中位数 ...
- 统计学习方法笔记(九)-最大熵原理及python实现
最大熵模型 最大熵模型介绍 最大熵模型原理 代码案例 案例地址 最大熵模型介绍 最大熵模型(maximum entropy model)可以用于二分类,也可以用于多分类.其是由最大熵原理推导实现的,所 ...
- 空间统计分析学习笔记
空间统计有别于经典统计学的两大特征:空间相关性和空间异质性,莫兰指数等可以用来量化空间相关性,地理加权回归等用来量化空间异质性. 潜在的(因为没有很明显的表现出来)的相互依赖性,就是所谓的" ...
- sas统计学习笔记(四)
有时候列联表的情况很负责,比如某个因素的每个水平上都有一个2×2列联表,一种用于分析多层2×2表的方法是Mantel-Haenszel卡方统计量,这个技术有时也叫元分析.用sas软件计算分层表的卡方值 ...
- 统计学习笔记:方差分析
方差分析(ANOVA)又称F检验.方差分析是判定方差在组间和组内是否(明显)具有区别的一种方法.如果组内差异相对于组间差异较小,则可以推断出组与组之间是有明显差异的. 从形式上看,方差分析与t检验或z ...
- 利用python进行统计分析学习笔记 第7章
第7章,基本功能部分,讲到了函数应用和映射 这里作者说了. ,将函数应用到由各列或行所形成的一维数组上.DataFrame 的apply方法即可实现此功能: 然后又说, 元素级的Python函数也是可 ...
最新文章
- -bash: make: command not found的解决办法
- SDOI 2009 ED
- java ceilingentry_java.util.TreeMap.ceilingKey()
- java 读取svg元素_svg动态添加元素
- 1 SAP DEBUG调试改表操作手册
- 字节流复制文件 java
- 【Python成长之路】Python爬虫 --requests库爬取网站乱码(\xe4\xb8\xb0\xe5\xa)的解决方法【华为云分享】
- 前端学习笔记:Bootstrap框架入门
- 简易 Vue 构建--终
- Node.js 教程第十三篇——WebSocket
- java B2B2C springmvc mybatis电子商城系统-分布式配置中心(Spring Cloud Config)
- 软件外包中常见的七个错误之一 - 不懂用户需求
- java商家查询订单功能_查询订单详情示例代码
- MPP集群基本概念和搭建
- python链接sql报错_python3.7连接sqlserver数据库失败报错20002, DB-Lib error message 20002
- MarkdownNote
- lotus domino_保护IBM Lotus Domino Web服务器的安全:案例研究
- 刘强东终于向自己的兄弟下手了!
- linux的mount bind命令
- 管道程序c语言,怎么创建管道