应用统计学方差分析之单因素方差分析原理解析(含Python代码)
基本概念:
在试验中,把考察的指标称为试验指标,影响试验指标的条件称为因素。因素可分为两类,-类是人为可控的测量数据,比如温度、身高等;一类是不可控的随机因素,例如,测量误差,气象条件等。因素所处的状态称为因素的水平。如果在试验过程中,只有一个因素在改变,称为单因素试验。方差分析Q (Analysis ofVariance,简称ANOVA)主要用于验证两组样本,或者两组以上的样本均值是否有显著性差异(是否一致)。
实例:
单因素方差分析的假设条件:
注:现实中当用到方差分析时候,一定是两组数据很相似,所以用到方差分析,若两组数据差异均值方差较大,则仅通过均值定性判断,就可以了。
通常实际应用中要先做同方差显著性水平检验(方差齐次性检验)
分析步骤:
现在假定一个因素B具有c个水平的因变量进行方差分析检验,例如上面提到的工厂轧制设备是因素,分别试验轧制了10块板材是水平。
1、建立假设
H0: μ1=μ2=…=μc;
H1: μ1,μ2,…,μc不全相等。
2、计算样本均值和样本方差。
3、计算组间方差
组间方差:反映不同组样本数据波动情形和不同组内部波动情形。
4、组内方差的估计:
组内方差:反映该组样本数据波动情况。
组内方差和组间方差的关系:
将组间方差与组内方差相比,可以得到一个F统计量(F=组间方差/组内方差),可以证明该统计量服从F分布。
5、构造F统计量进行检验
F=组间方差/组内方差=MSB/MSE~F(c-1, nT-1)
如果c个总体均值不相等,则组间方差(MSB)会大于组内方差(MSE)。当F值大到某一临界值时,就可以拒绝H0。临界值的大小由给定的α和自由度决定。所以,当给定显著性水平为α时,F的拒绝域为F>Fα(c-1,nT-c)。
6、方差分析表
7,应用
实例分析:
例题:有8位食品专家对三种配方的食品随机品尝,然后给食品的口感分别打分(满分10分),如下表。问三种配方的平均分数是否相同?(α=0.05)(假定打分服从标准相等的正态分布)。
解:设μA,μB,μC分别代表配方1、2、3。已知因变量是分数,因素是配方,水平为3,具有相同的样本容量8。根据题意建立假设:
H0: μA=μB=μC;
H1: 总体均值不全相等。
首先,计算样本均值及方差
Python代码案例分析:
案例:
某保险公司想了解一下某险种在不同的地区是否有不同的索赔额。于是他们就搜集了四个不同地区一年的索赔额情况的记录如下表:
尝试判断一下, 地区这个因素是否对与索赔额产生了显著的影响?
import pandas as pd
import numpy as npfrom scipy import stats
from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm# 这是那四个水平的索赔额的观测值
A1 = [1.6, 1.61, 1.65, 1.68, 1.7, 1.7, 1.78]
A2 = [1.5, 1.64, 1.4, 1.7, 1.75]
A3 = [1.6, 1.55, 1.6, 1.62, 1.64, 1.60, 1.74, 1.8]
A4 = [1.51, 1.52, 1.53, 1.57, 1.64, 1.6]data = [A1, A2, A3, A4]
# 方差的齐性检验
w, p = stats.levene(*data)
if p < 0.05:print('方差齐性假设不成立')# 成立之后, 就可以进行单因素方差分析
f, p = stats.f_oneway(*data)
print(f, p) # 2.06507381767795 0.13406910483160134
应用统计学方差分析之单因素方差分析原理解析(含Python代码)相关推荐
- 拉普拉斯变形的原理解析和python代码
背景 拉普拉斯变形是图形学处理mesh的常用方法,它假定mesh的顶点,在变化前后,顶点的拉普拉斯距离应该是一致的. 最常见的拉普拉斯矩阵的定义如下: L = D − A = D ( I − D − ...
- excel显著性检验_数据分析系列 10/32 | Excel方差分析之单因素方差分析
无论是什么活动,影响产品质量和产品的因素都有多种,如影响农作物产量的因素有品种.天气.施肥量.肥料的种类等等.如果我们想要了解这些因素中哪些因素对产量有显著性影响,或各个因素之间的交互作用,以及对结果 ...
- LDA主题模型原理解析与python实现
本文转自:LDA主题模型原理解析与python实现_wind_blast的博客-CSDN博客 python实现: #-*- coding:utf-8 -*- import logging impo ...
- 【算法思想】Reed-Solomon 纠错编码基础概念,编码、解码算法原理、数学公式 Python代码实现
[算法思想]Reed-Solomon 纠错编码基础概念,编码.解码算法原理.数学公式 & Python代码实现 文章目录 [算法思想]Reed-Solomon 纠错编码基础概念,编码.解码算法 ...
- 方差分析(单因素方差分析)
单因素方差分析 问题: 消费者与产品生产者.销售者或服务提供者之间经常发生纠纷.发生纠纷后,消费者常常会向消费者协会投诉.为了对几个行业的服务质量进行评价,消费者协会在零售业.旅游业.航空公司.家电制 ...
- 单因素方差分析_基于R语言开展方差分析(一)——单因素方差分析
基本原理 方差分析(Analysis of variance, ANOVA)是用于两个或两个以上样本均数比较的方法,还可以分析两个或多个研究因素的交互交互作用以及回归方程的线性假设检验等.其基本思想是 ...
- 方差分析与单因素方差分析
研究分类型自变量对数值型因变量的影响.检验统计的设定和检验方法与变量间的方差是否相等有关. 例如研究行业.服务等级对投诉数的影响:如表格中给出4个行业.每个行业有3个服务等级.样本容量为7.观测值为投 ...
- 方差分析之单因素方差分析
作者:DD 来源:数据科学家联盟 方差分析是一种能使多因素(多组间)检验变得简洁的一种检验方式,它能同时考虑所有的样本,不仅能使检验过程变得简洁还能排除因两两检验可能造成的错误累积 ...
- 统计学习-方差分析之单因素方差分析
1.数据背景 有A.B.C.D四个地区,不同地区的销售量不一样,现抽取了不同时间段内每个地区的销售量,试使用方差分析的方法解决: 1.每个地区间的销售量是否相同? 2.不同月份的销售量是否相同? 3. ...
- Fisher线性判别分析原理解析及其Python程序实现两例
一.Fisher线性判别分析原理解析与算法描述 Fisher:1890-1962, 英国数学家,生物学家,现代统计学奠基人之一,证明了孟德尔的遗传律符合达尔文的进化论. Fisher线性判别分析(Li ...
最新文章
- Windows Server 2003 服务应用大全之DNS服务使用详解
- LMDB中的mmap、Copy On Write、MVCC深入理解——讲得非常好,常来看看!
- Asp.net Core基于MVC框架实现PostgreSQL操作
- Qt中的QByteArray和自定义结构体之间的相互转换
- GitHub动作简介
- markdown常见问题
- Eclipse Java Build Path详解
- 密钥短语密码加密,解密同理。
- python自定义包的发布与安装
- html取元素的文本,解析HTML以获取元素内的文本
- 如何使Session永不过期
- excel计算机一级知识点,计算机一级考试考点:Excel电子表格
- javascript自动分号补齐带来的坑
- 伊利诺伊大学在线计算机硕士,UIUC伊利诺伊大学厄巴纳香槟分校计算机科学硕士MSc in Computer Science...
- 笔记本计算机提升性能,如何加快笔记本电脑的运行速度?
- markdown编辑器推荐(附官网)
- Geek ? 什么是 Geek ? 谁是 Geek ?
- 【数据结构】(六)树与二叉树
- 【opencv4.3.0教程】05之基础结构2之矩形结构Rect_详解
- ue4创建一个游戏模式Game mode