1、方差分析的基本概念

方差分析(Analysis of Variance, ANOVA),由英国统计学家费雪(Ronald Aylmer Fisher)于1920年前后提出,最初主要应用于生物和农业田间试验,后来推广到各个领域。

它直接对多个总体的均值是否相等进行检验。

方差分析能够解决多个均值是否相等的检验问题。

方差分析是要检验各个水平的均值是否相等,采用的方法是比较各水平的方差。

如研究不同的销售点(假设为5个)对销售量是否有有影响,可以收集不同销售点若干天的销售数据来进行研究,则实质上是看这些销售点在这些天中的平均销售量 是否相同(或由显著差异)。

所要检验的对象称为因素或因子,也称为自变量。如例子中的销售点就是因素。

因素的不同表现称为水平或处理 。如例子中研究的是5个销售点,则共有5个水平。

每个因素水平下得到的样本数值称为观测值,也称为因变量或响应变量。

如果研究中只考虑一个因素的话,称之为单因素方差分析;如果考虑两个因素的话,称为双因素方差分析;双因素方差分析中如果不考虑两个因素的交互作用对因变量的影响的话,称之为无交互作用的双因素方差分析,否则称之为有交互作用的双因素方差分析。

2、方差分析的原假设与备择假设

原假设:

H0: μ1= μ2 = μ3 = μ4 = ...... = μn

备择假设:

H1:均值不全相等。

3、方差分析运用的前提条件

(1)各样本是相互独立的随机样本——独立性;

(2)各组的方差相同——方差齐性;

(3)各样本来自正态分布——正态性。

4、单因素方差分析问题原型

研究仅涉及到一个因素。如例子中的研究仅考虑销售点一个因素。

(1)问题原型

设因素A有r个水平A1,A2,...,Ar,每个水平Ai进行ni次独立观测,将水平Ai下的试验结果xi1,xi2,...,xini看成来自第i个正态总体Xi~N(μi,σ)的样本观测值,其中μi,σ均未知,并且每个总体Xi都相互独立。考虑线性统计模型:

xij = u i + εij

εij~N(0,σ2) 且相互独立

其中,μi为第i个总体的均值,ε为相应的试验误差。

(2)单因素方差分析的数据结构

(3)单因素方差分析表

(4)判断与结论

在假设条件成立时,F统计量服从第一自由度为r-1、第二自由度为n-r的 F分布。

若F ≥ Fα,则拒绝原假设,表明均值之间的差异显著,因素A对观察值有显著影响;

若F < Fα,则不能拒绝原假设,表明均值之间的差异不显著,因素A对观察值没有显著影响。

5、R中进行方差分析的函数

在R中可以使用aov()函数和summary()函数共同完成方差分析的计算。aov()函数的格式如下:

aov(formula, data = NULL, projections = FALSE, qr = TRUE, contrasts = NULL, ...)

其中,formula是个字符串,表示方差分析的公式,如形如X~A或X~A+B或X~X+B+A:B;

data是数据框,描述数据的响应变量、因素和相应水平的对应关系,默认值为NULL,当数据直接由X和A给出时,不需要此参数。

6、R语言进行单因素方差分析举例说明

新实验楼装修,小明需要买一批灯泡。市场上的灯泡种类繁多,而且价格也相差较大。小明选择了4种品牌的灯泡请人做了测试。测试结果如下表。你认为购买哪种品牌较好呢?

品牌

使用寿命

A1

1600

1610

1650

1680

1700

1700

1780

A2

1500

1640

1400

1700

1750

A3

1640

1550

1600

1620

1640

1600

1740

1800

A4

1510

1520

1530

1570

1640

1600

当然选择平均寿命要大一些的,那么这些水平均值有区别吗?如何进行分析:方差分析。

在R中编写程序如下:

#单因素方法分析

#定义数据灯泡寿命向量

X

1500,1640,1400,1700,1750,

1640,1550,1600,1620,1640,1600,1740,1800,

1510,1520,1530,1570,1640,1600)

#定义一个因子用于指定每个数据所属的组

A

#定义数据框

lamp

#进行方差分析

lampAov

#提取方差分析表

sm

print(sm) #输出方差分析信息

#数据满足正态性要求吗?

#对数据进行正态性符合性检验(Shapiro-Wilk)

#该检验中计算的W值越接近1,正态性越好

#对数据框中的X列值因素水平为1的进行正态性检验

shapiro.test(lamp$X[lamp$A==1])

#对数据框中的X列值因素水平为2的进行正态性检验

shapiro.test(lamp$X[lamp$A==2])

#对数据框中的X列值因素水平为3的进行正态性检验

shapiro.test(lamp$X[lamp$A==3])

#对数据框中的X列值因素水平为4的进行正态性检验

shapiro.test(lamp$X[lamp$A==4])

#当水平数较多时,运用上面的写法比较麻烦,可以借助with()函数和tapply()函数

with(lamp,tapply(X,A,shapiro.test))

#方差齐性检验

bartlett.test(X~A,data=lamp)

在R中的运行结果如下:

从结果中看,P值>0.05,则在0.05的显著性水平下,没有充分理由拒绝原假设,也就是说4种品牌的寿命没有显著性区别,则在购买时,挑拣便宜的进行购买就行了。

正态性检验结果如下:

从检验结果来看,各组数据都符合正态性。

方差齐性检验结果:

由检验结果的p值=0.1215 > 0.05可知,在0.05的置信水平下,没有充分理由拒绝原假设(每组的方差相等),则可以认为每组的方差相等,即满足方差齐性。

本文为本站原创,如需转载请注明出处:翔宇亭IT乐园(www.biye5u.com)-使用R语言进行单因素方差分析(http://www.biye5u.com/article/R/2019/6401.html)

在r中弄方差分析表_使用R语言进行单因素方差分析相关推荐

  1. 在r中弄方差分析表_医学统计与R语言: qvalue

    微信公众号:医学统计与R语言如果你觉得对你有帮助,欢迎转发 (FalseDiscoveryRate(FDR)=Expected(FalsePositive/(FalsePositive+TruePos ...

  2. 如何在 R 中计算调整后的 R 平方

    如果有什么问题和项目作业关于R语言,可以微信call我:RunsenLiu R 平方,通常写成 R 2,是响应变量中的方差比例,它可以由线性回归模型中的预测变量来解释. R-squared 的值可以在 ...

  3. R语言实现单因素方差分析

    1.方差分析基本原理:是一种分析各类别自变量对数值因变量影响的一种统计方法.自变量对因变量的影响也称为自变量效应.由于影响效应的大小体现为因变量的误差里有多少是由自变量造成的,因此,方差分析通过对数据 ...

  4. 方差分析中怎么看有无显著性影响_用R语言做单因素方差分析及多重比较

    SPSS方差分析的应用已经做得非常好了,绝大多数的方差分析问题均可通过SPSS"点菜单"的方式得以解决,R语言在统计和可视化方面有自己的特色,我们不妨来对比着学习.选用R语言自带案 ...

  5. matlab中find函数_在R中使用Matlab函数

    R, Matlab MATLAB是一款商业数学软件, R是一个拥有庞大工具库的数据统计.建模.可视化分析软件.R 不仅支持C/C++, python代码的运行和工程移植, 也支持在R中使用MATLAB ...

  6. r中汇率市场_如何在Word 2013表中汇总行和列

    r中汇率市场 If you're working in Word and you need to total values in a table, you can do so without havi ...

  7. 聚类分析在用户行为中的实例_序列模式挖掘在用户行为分析中的应用

    作者:闲鱼技术-楚丰 背景 在互联网产品中,用户行为分析,通常是指通过统计.分析用户在产品上的各种行为事件,挖掘.发现出有用的信息,为产品的设计,运营策略提供有意义的依据. 通常,用户行为分析包含以下 ...

  8. break在java语言中什么意思_在Java语言的控制结构中,break语句是经常用到的语句。在switch语句中break语句的作用是( )_学小易找答案...

    [单选题]( )是一个综合性的网络营销工具,在所有的网络营销工具中也是最基本.最重要的一个. [单选题]给出下列的代码,哪行在编译时可能会有错误( ) 1 public static void mai ...

  9. 矩阵分析理论在实际工程中的应用_一文讲解视频智能分析技术,在文博安防工程中如何应用...

    引言 视频监控系统在文博安防中的使用已经走过了几十个年的历程,从最早的进口摄像机的模拟视频监控系统到今天的网络高清视频监控系统,从QCIF(176*144)到现在的百万像素(1920*1080)高清图 ...

  10. java程序中语句隔开_《Java语言程序设计》填空题.doc

    您所在位置:网站首页 > 海量文档 &nbsp>&nbsp计算机&nbsp>&nbspJava <Java语言程序设计>填空题.doc9页 ...

最新文章

  1. 分布式锁之三:Redlock实现分布式锁
  2. idea远程调试修改代码_使用IDEA远程调试线上代码
  3. 03_Android项目中读写文本文件的代码
  4. 面试官:请手写一个带取消功能的延迟函数,axios 取消功能的原理是什么
  5. vlan 间路由+单臂路由(实验思路讲解+配置)
  6. Python中groupby的简单使用
  7. sql 查询表共多少列
  8. Android 程序调试
  9. 微信小程序识别html代码
  10. idea风格ui java_IDEA主题美化
  11. 访问控制和网络冗余--ACL+NAT
  12. 嗖嗖移动业务大厅(源码下载+注释全 值得收藏)
  13. 计算机休眠设置xp系统,【xp怎么让电脑不休眠】xp怎么设置电脑不休眠_xp电脑休眠设置...
  14. C语言自然数各自出现的次数,2010年计算机等考二级C语言上机考试练习(1)
  15. 计算机系统时钟中断,什么是时钟中断时钟中断的举例
  16. feign调用不经过网关
  17. Vulnhub--bulldog
  18. Linux解压压缩包到同名目录,里面的文件会自动覆盖吗?
  19. 中国筒仓罐市场现状研究分析与发展前景预测报告(2022)
  20. andro studio关于Intel HAXM is required to run this AVD

热门文章

  1. Qt Creator配置FreeImage库
  2. Latex、XeLatex无法加粗
  3. 安装roboware
  4. Keil MDK5解决error: L6002U: Could not open file …\obj\main.o: No such file or directory
  5. Hive建表语句Location与HDFS创建目录
  6. 服务器游戏协议,游戏服务器tcp协议
  7. 利用python处理pdf文本,帮我省下不少钱
  8. 中国气象站点原数据集(1942-2022年3月)
  9. 路由器刷机教程图解_小米路由器刷机教程
  10. 信息学奥赛一本通网站