单因素方差分析(R)
目录
目标
原理
假设前提和模型设定
离差平方和分解
检验统计量和拒绝域
未知参数的估计
例题
应用
目标
方差分析的基本思想:通过分析不同影响来源对总体的影响程度,确定可控因素对研究对象影响力是否显著。
单因素方差分析用来研究一个控制变量的不同水平是否对观测指标变量有显著影响。
原理
观测指标变量值的变动会受控制变量和其他随机变量两方面的影响,据此,把观测指标变量的总离差平方和(SST)分解为(受控制变量影响的)组间离差平方和(SSB)和(受其他随机变量影响的)组内离差平方和(SSW)两部分,即:SST=SSB+SSW。在观测指标变量的总离差平方和中,如果组间离差平方和所占比例较大,则说明观测指标变量的变动主要由控制变量引起的,控制变量给观测指标变量有显著影响;反之,控制变量对观测指标变量没有显著影响。
假设前提和模型设定
设单因素A有r个水平,分别记为,在每个水平下的观测指标变量样本值看做一个总体,故有r个总体,基于假设前提:
1.每个总体均服从正态分布,且方差相等,即
2.每个总体中抽取的样本相互独立(为因素水平的实验数据个数)
通过假设检验来探究期望控制变量对观测指标变量是否有显著影响,如果有,则意味着A因素不同水平对应的观测指标变量总体的均值有显著差异。可作出如下假设:
;
不完全相等
方差分析的任务:
任务一:检验r个总体的均值是否相等,即完成上述假设的检验;
任务二:作出未知参数的估计。
由假设前提有,即有,故可视为随机误差,且相互独立,由假设前提知,各个相互独立。从而得到模型:
记数据总个数为
总平均值为
用因素水平下的总体均值与总平均值的差异来表示 因素水平对观测指标变量的效应:。效应间的关系为
从而改写模型为:
可得,前述假设等价为:
不全为0
这是因为当且仅当时,,即(i=1,2,...,r)
离差平方和分解
记 因素水平下的样本均值为
,
A因素的所有水平的样本总均值为
组内离差平方和为:
组间离差平方和为:
总离差平方和为:
检验统计量和拒绝域
由和分布的可加性,可得:
因此,
SSB可以看做r个变量的平方和,它们之间仅有一个线性约束条件:
故知SSB的自由度是r-1。
并且,由SSW和SSB表达式可知二者独立,所以,
当为真时,
当 不为真时,
因此可得拒绝域为:
因SST的n个变量之间有一个约束条件,所以SSW的自由度为n-1。
据上述分析结果,可得方差分析表:
方差来源 | 平方和 | 自由度 | 均方 | F比 |
因素A | SSB | r-1 | ||
误差 | SSW | n-r | ||
总和 | SST | n-1 |
在实际中,可先计算SST和SSB,再由二者相减得到SSW,以简便计算。
未知参数的估计
由知,的无偏估计为:
由知,的无偏估计为:
不管是否为真,,可知的无偏估计为:
当拒绝时,效应不全为0,且,可知,的无偏估计为
当拒绝时,常常需要作出两总体和,的均值差的区间估计,由于
并且与独立,于是,
据此得均值差的置信水平为1-的置信区间为:
例题
设有三台机器,用来生产规格相同的铝合金薄板,并且假定除了机器这一因素之外,其他条件都相同。取样并测量薄板的厚度精确到千分之一厘米,得到结果(服从单因素方差分析假设前提):
machine1=c(0.236,0.238,0.248,0.245,0.243)
machine2=c(0.257,0.253,0.255,0.254,0.261)
machine3=c(0.258,0.264,0.259,0.267,0.262)
data1=cbind(machine1,machine2,machine3)
write.csv(data1,"D:/CSDN/方差分析/r/data1.csv",row.names = FALSE)
先假设检验三个总体的均值是否相等
做出假设:
不全相等
由数据可知,r=3,,n=15,则,
SSW=SST-SSB
F比=32.91667>=3.885294
故在0.05显著性水平下拒绝,认为各台机器生产的薄板厚度有显著的差异。
write.csv(data1,"D:/CSDN/方差分析/r/data1.csv",row.names = FALSE)
Data1=read.csv("D:/CSDN/方差分析/r/data1.csv")
n=15
r=3
n1=n2=n3=5
SST=sum(c(Data1$machine1**2,Data1$machine2**2,Data1$machine3**2))-(sum(Data1)**2)/n
SSB=sum(c((sum(Data1$machine1)**2)/n1,(sum(Data1$machine2)**2)/n2,(sum(Data1$machine3)**2)/n3))-(sum(Data1)**2)/n
SSW=SST-SSB
tab1=data.frame(matrix(nrow = 3,ncol = 5))
colnames(tab1)=c("方差来源","平方和","自由度","均方","F比")
tab1[1,1]="因素"
tab1[2,1]="误差"
tab1[3,1]="总和"
tab1[1,2]=SSB
tab1[2,2]=SSW
tab1[3,2]=SST
tab1[1,3]=r-1
tab1[2,3]=n-r
tab1[3,3]=n-1
tab1[1,4]=SSB/(r-1)
tab1[2,4]=SSW/(n-r)
tab1[1,5]=tab1[1,4]/tab1[2,4]
qf(1-0.05,r-1,n-r)
接着对未知参数进行点估计及均值差的0.95置信区间
1.6e-05
0.2533333
hatsigma2=SSW/(n-r)
hatmu=mean(c(mean(Data1$machine1),mean(Data1$machine2),mean(Data1$machine3)))
tab2=data.frame(matrix(nrow = 2,ncol = 3))
colnames(tab2)=c("machine1","machine2","machine3")
rownames(tab2)=c("hatmu","hatdelta")
tab2[1,1]=mean(Data1$machine1)
tab2[1,2]=mean(Data1$machine2)
tab2[1,3]=mean(Data1$machine3)
tab2[2,1]=tab2[1,1]-hatmu
tab2[2,2]=tab2[1,2]-hatmu
tab2[2,3]=tab2[1,3]-hatmu
tab3=data.frame(matrix(nrow = 3,ncol = 2))
colnames(tab3)=c("lower","upper")
rownames(tab3)=c("interval12","interval13","interval23")
t=qt(1-0.025,n-r)
tab3[1,1]=mean(Data1$machine1)-mean(Data1$machine2)-t*sqrt(SSW/(n-r)*(1/n1+1/n2))
tab3[1,2]=mean(Data1$machine1)-mean(Data1$machine2)+t*sqrt(SSW/(n-r)*(1/n1+1/n2))
tab3[2,1]=mean(Data1$machine1)-mean(Data1$machine3)-t*sqrt(SSW/(n-r)*(1/n1+1/n3))
tab3[2,2]=mean(Data1$machine1)-mean(Data1$machine3)+t*sqrt(SSW/(n-r)*(1/n1+1/n3))
tab3[3,1]=mean(Data1$machine2)-mean(Data1$machine3)-t*sqrt(SSW/(n-r)*(1/n2+1/n3))
tab3[3,2]=mean(Data1$machine2)-mean(Data1$machine3)+t*sqrt(SSW/(n-r)*(1/n2+1/n3))
应用
library(reshape2)
tData1=melt(Data1,measure.vars=c("machine1","machine2","machine3"),variable.name = "machine",value.name = "thickness")
aov=aov(thickness~machine,data=tData1)
summary(aov)
单因素方差分析(R)相关推荐
- 单因素方差分析——R语言实战
课题组的每个人都有实验任务,做实验的目的是为了获取实验数据,下一步就要进行数据分析,数据分析的方法各式各样.今天我给大家介绍,如何使用R语言进行单因素方差分析. 有人会问,什么是单因素方差分析? 试验 ...
- R语言使用aov函数进行单因素协方差分析(One-way ANCOVA)、单因素协方差分析(ANCOVA)扩展了单因素方差分析,包括一个或多个协变量(covariates)
R语言使用aov函数进行单因素协方差分析(One-way ANCOVA).单因素协方差分析(ANCOVA)扩展了单因素方差分析,包括一个或多个协变量(covariates) 目录
- R语言Welch方差分析(Welch’s ANOVA)实战:Welch方差分析是典型的单因素方差分析的一种替代方法,当方差相等的假设被违反时我们无法使用单因素方差分析,这时候Welch’s出来救场了
R语言Welch方差分析(Welch's ANOVA)实战:Welch方差分析是典型的单因素方差分析的一种替代方法,当方差相等的假设被违反时我们无法使用单因素方差分析,这时候Welch's出来救场了 ...
- R语言单因素方差分析(One-Way ANOVA)实战:探索性数据分析(EDA)、单因素方差分析模型结果解读(检查模型假设)、分析不同分组的差异TukeyHSD、单因素方差分析的结果总结
R语言单因素方差分析(One-Way ANOVA)实战:探索性数据分析(EDA).单因素方差分析模型结果解读(检查模型假设).分析不同分组的差异TukeyHSD.单因素方差分析的结果总结 目录 R语言 ...
- R语言单因素方差分析与协方差分析
R语言单因素方差分析与协方差分析 条件: 各个样本是相互独立的随机: 各个样本来自正态总体: 具有方差齐性: 用途: 检验两个或多样本均数间的差异有无统计学意义:注:本均数的比较可以采用 t检验或 F ...
- 方差分析中怎么看有无显著性影响_用R语言做单因素方差分析及多重比较
SPSS方差分析的应用已经做得非常好了,绝大多数的方差分析问题均可通过SPSS"点菜单"的方式得以解决,R语言在统计和可视化方面有自己的特色,我们不妨来对比着学习.选用R语言自带案 ...
- 单因素方差分析_基于R语言开展方差分析(一)——单因素方差分析
基本原理 方差分析(Analysis of variance, ANOVA)是用于两个或两个以上样本均数比较的方法,还可以分析两个或多个研究因素的交互交互作用以及回归方程的线性假设检验等.其基本思想是 ...
- R语言实现单因素方差分析
1.方差分析基本原理:是一种分析各类别自变量对数值因变量影响的一种统计方法.自变量对因变量的影响也称为自变量效应.由于影响效应的大小体现为因变量的误差里有多少是由自变量造成的,因此,方差分析通过对数据 ...
- R语言单因素方差分析及两两比较
一.导语 两个样本均数的比较用t检验,那么多个样本均数的比较应该采用什么方法分析呢?就是接下来介绍的方差分析.方差分析由统计学家R.A.Fisher提出,又称为F检验.是通过对数据变异的分析来推断两个 ...
- R语言基础数据分析—单因素方差分析
有了试验数据,我们就需要进行数据的处理与分析,而在试验设计中,通常分为单因素试验或者双因素试验.试验中要考察的指标称为试验指标,影响试验指标的条件称为因素,因素所处的状态称为水平,若试验中只有一个因素 ...
最新文章
- resilience4j小试牛刀
- php常用快捷键,phpstorm常用快捷键
- idea开发swing项目_IntelliJ IDEA 开发swing(一)
- Exynos4412 ADC 设备驱动开发
- mysql 相同字段相减_mysql datetime 类型字段相减
- Python flask 特殊装饰器 @app.before_request 和 @app.after_request 以及@app.errorhandler介绍
- kafka消费者分区的分配的三种机制
- 日常见到一些命令使用实例~(持续更新!)
- ftp://hxtech.com
- ArcGIS Engine开发之旅01---产品组成、逻辑体系结构
- Python 语感训练100题
- JarvisOJ 逆向Writeup
- dw cs6设置字体样式
- python不重复排列组合_python解决排列组合
- Vue项目安装XLSX成功后,生成项目报错:“export ‘default‘ (imported as ‘XLSX‘) was not found in ‘xlsx‘
- border渐变 ios_iOS一个方法搞定view渐变色
- 施耐德服务器屏幕不显示,施耐德 触摸屏 HMI_ presentation -人机界面.ppt
- bugly上传符号表
- Eth 01 - Eth以太网控制器驱动概述和API讲解
- 来自滴滴、微博、唯品会、魅族、点评关于高可用架构的实践分享
热门文章
- UCSC 基因组浏览器配置详解
- 解决谷歌地图alert出现“此页面无法正确加载 Google 地图“
- 京东联盟高级API接口-批量查询推广位-京东联盟接口详情
- 查询论文SCI/EI检索及引用报告
- JAVA 通过Excel导出pdf_教你用Java 将Excel转为PDF
- Android云真机原理以及云真机平台搭建实践
- 穿山甲(巨量引擎)广告接入
- kms激活win10
- linux脚本每月1日跑一次,Linux crontab 每分钟、每小时、每天、每周、每月、每年定时执行...
- 等额本金等额本息推导