鄙人学习笔记


文章目录

  • 方差分析
    • 方差分析引论
      • 方差分析的基本思想
      • 方差分析基本假定
      • 问题的一般提法
    • 单因素方差分析
      • 分析步骤
      • 关系强度测量
      • 方差分析中的多重比较
    • 双因素方差分析
      • 无交互作用的双因素方差分析
        • 分析步骤(与单因素方差分析步骤类似)
        • 关系强度测量
      • 有交互作用的双因素方差分析
        • 分析步骤(与单因素方差分析步骤类似)
        • 关系强度测量

方差分析

从形式上看,方差分析是比较多个总体的均值是否相等,但本质上它所研究的是变量之间的关系。在研究一个(或多个)分类型自变量与一个数值型因变量之间的关系时,方差分析就是其中的主要方法之一。

方差分析引论

  • 方差分析

表面上看,方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型因变量的影响。例如,变量之间有没有关系,关系的强度如何等。
方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。

  • 方差分析与假设检验的比较

①假设检验进行两两比较繁琐。例如,设4个总体的均值分别为μ1234,如果用一般假设检验方法,如t检验,一次只能研究两个样本,要检验4个总体的均值是否相等,需要作6次检验。

②一般来说,随着增加个体显著性检验的次数,偶然因素导致差别的可能性也会增加(并非均值真的存在差别)。

  • 因素、水平和观测值

在方差分析中,所要检验的对象称为因素或因子。因素的不同表现称为水平或处理。每个因子水平下得到的样本数据称为观测值。

方差分析的基本思想

  • 误差分解

在方差分析中,数据的误差是用平方和来表示,总平方和可分解为组内平方和与组间平方和。

总平方和:记为SST。它反映了全部观测值的离散状况。
组内平方和:也称为误差平方和或残差平方和,记为SSE。它反映了每个样本内各观测值的离散状况。组内误差只含有随机误差。
组间平方和:也称为因素平方和,记为SSA。它反映了样本均值之间的差异程度。组间误差包含随机误差和系统误差。

误差分解图:

  • 误差分析

如果在组间误差中只包含随机误差,而没有系统误差。这时,组间误差与组内误差经过平均后的数值(称为均方或方差),就应该很接近,它们的比值就会接近1。相反,如果在组间误差中不仅包含随机误差,而且包含系统误差。这时组间误差平均后的数值就会大于组内误差平均后的数值,它们之间的比值就会大于1。当这个比值大到某种程度时,就认为因素的不同水平之间存在着显著差异,也就是自变量对因变量有显著影响。

方差分析基本假定

①每个总体都应服从正态分布。也就是说,对于因素的每一个水平,其观测值是来自正态分布总体的简单随机样本。
②各个总体的方差必须相同。也就是说,各组观察数据是从具有相同方差的正态总体中抽取的。
③观测值是独立的。

在上述假定成立的前提下,要分析自变量对因变量是否有影响,形式上也就转化为检验自变量的各个水平(总体)的均值是否相等。

问题的一般提法

设因素有k个水平,每个水平的均值分别用μ1,μ2,…,μk表示,要检验k个水平(总体)的均值是否相等,需要提出如下假设:

单因素方差分析

根据所分析的分类型自变量的多少,方差分析可分为单因素方差分析和双因素方差分析。当方差分析中只涉及一个分类型自变量时称为单因素方差分析

分析步骤

  • 数据结构

  • 分析步骤

  • 表格结构

关系强度测量

实际上,只要组间平方和不等于零.就表明两个变量之间有关系(只是是否显著的问题)。

如何度量两个变量之间的关系呢?可以用组间平方和(SSA)占总平方和(SST)的比例大小来反映,这一比例记为R2:

其平方根R就可以用来测量两个变量之间的关系强度。

方差分析中的多重比较

要判断到底哪些均值之间存在差异,可以使用多重比较的方法。

多重比较方法有许多种,这里介绍由费希尔提出的最小显著差异方法,缩写为LSD。
使用该方法进行检验的具体步骤为:

双因素方差分析

当方差分析中涉及两个分类型自变量时,称为双因素方差分析

在双因素方差分析中,有两个影响因素。
若两个因素对因变量影响是相互独立的,这时的双因素方差分析称为无交互作用的双因素方差分析。
若两个因素的搭配还会对因变量产生一种新的影响,这时的双因素方差分析称为有交互作用的双因素方差分析,或称为可重复双因素分析。

无交互作用的双因素方差分析

分析步骤(与单因素方差分析步骤类似)
  • 数据结构


  • 表格结构

关系强度测量

两个变量合起来与因变量之间的关系强度究竟如何呢?首先我们看一下联合效应这个概念。
两个自变量对因变量的联合效应为行平方和与列平方和的加总。
联合效应与总平方和的比值定义为R2,即:

其平方根R则反映了这两个自变量合起来与因变量之间的关系强度.

有交互作用的双因素方差分析

分析步骤(与单因素方差分析步骤类似)
  • 数据结构

  • 表格结构


关系强度测量

R2

其平方根R则反映了这两个自变量合起来与因变量之间的关系强度.

《统计学》学习笔记之方差分析相关推荐

  1. 数据分析知识——统计学学习笔记(拉勾数据分析训练营)

    模块1 统计学基本概念 1 测量尺度 人文社科中的分类尺度 1定类尺度 功能:分类作用,比如性别.英文:Norminal 2定序尺度 功能:分类.排序作用,比如喜欢的艺人.年级.英文:Ordinal ...

  2. 《白话统计》学习笔记之方差分析与变异分解

    1. 方差分析中变异分解的思想 假如现有3组共60人的血压值各不相同,即我们所说的变异.当这些人服用降压药后,有的人血压降低了,有的却没有?要回答这一问题,需要考虑两个原因.第一个是由于个体间差异引起 ...

  3. 统计学学习笔记——(4)差异性

    箱线图和IQR 箱线图(Box Plot):是由一组数据的最大值(maximum),最小值(minimum),中位数(median),两个四分位数(quartiles)这五个特征值绘制而成的,它主要用 ...

  4. 统计学习笔记:方差分析

    方差分析(ANOVA)又称F检验.方差分析是判定方差在组间和组内是否(明显)具有区别的一种方法.如果组内差异相对于组间差异较小,则可以推断出组与组之间是有明显差异的. 从形式上看,方差分析与t检验或z ...

  5. 统计学学习笔记:L1-总体、样本、均值、方差

    目录 一.总体和样本 二.集中趋势分析 2.1 均值 2.1.1 样本均值 2.1.2 总体均值 2.2 众数,中位数 三.离散趋势分析 3.1 总体方差 3.2 样本方差 3.3 标准差 一.总体和 ...

  6. Khan公开课 - 统计学学习笔记 (四)泊松分布 大数定理

    泊松分布 假设概率分布是一致的,例如不会因时间段不同而异,又假设各事件的概率是不相关的(即不相互影响),符合泊松分布Poission distribution.例如某个路口一小时内有多少量车经过. E ...

  7. 数据科学的统计学知识笔记

    1.描述统计 1.数字特征(描述统计) 集中趋势 众数 中位数 四分位数 平均数:样本平均数( x ˉ \bar{x} xˉ)与总体平均数( μ \mu μ) 离中趋势(离散趋势) 异众比率:非众数组 ...

  8. 《统计学》(贾俊平)考研初试完整学习笔记10~14章

    贾俊平<统计学第6版>学习笔记 这是我自己去年考研时整理的笔记,希望能给到432考研以及正在学习统计学的小伙伴们一点帮助吧,我是把这份笔记当作复习时的框架来用的,时不时过一遍,有不熟悉的地 ...

  9. 《统计学:从数据到结论》学习笔记(part3)--任何统计量,只要人们觉得合适就可以当成估计量

    学习笔记 学习书籍:<统计学:从数据到结论>-吴喜之: 参考书目:<统计学>-贾俊平 用估计量估计总体参数 我们都知道样本的函数称之为统计量,而用于估计的统计量则被称为估计量. ...

最新文章

  1. oracle一条sql的执行过程,请问执行一条sql的整个过程是怎样的,谢谢!
  2. 访华为5G首席科学家童文:针尖战略引领5G突破
  3. 哈工大 c语言测试与系统控制 ad,哈工大——c语言在测量与控制中应用实验报告.pdf...
  4. 【AI白身境】一文览尽计算机视觉研究方向
  5. C_C++指针指针应用详解
  6. 使用 GraalVM 将纯 JavaFX 项目打包成 EXE
  7. 数据结构栈的知识_数据知识栈
  8. 学习:重写hashCode()方法的必要性
  9. SQLSTATE[HY000]: General error: 1030 Got error 28 from storage engine
  10. v-html可能导致的问题
  11. nginx ---- 目录结构
  12. 传统图像降噪算法之BM3D原理详解
  13. 不用U盘从linux重装win系统,不用U盘和光盘安装win7旗舰版系统
  14. 独家解读 | 基于优化的对抗攻击:CW攻击的原理详解与代码解读
  15. 微生活时光机:去项目中挖掘JS模块化简史
  16. 车架号VIN码精准查询车辆信息
  17. 文件资源管理器Ranger的使用
  18. 数据结构分析:红黑树、B+树
  19. 科技企业捐赠武汉最新最全排名(截止2月13日)
  20. win7计算机管理找不到文件夹,win7系统中电脑文件夹选项不见了的具体解决方法...

热门文章

  1. 图像工程之图像处理 CH1绪论
  2. linux中xjvf指令,linux解压缩命令小结
  3. SpaceEmacs Rock Day5 学习笔记
  4. eclipse 国际化 $NON-NLS-1$ 含义
  5. Unix基本操作指令备忘
  6. 【转】Nginx服务器的反向代理proxy_pass配置方法讲解
  7. Python学习预备
  8. 设计模式(5)----模板方法
  9. Python基础入门笔记(二)
  10. 第九章:Java_枚举类和注解