在学习统计学贾书的过程,在第6—14章节出有许多需要理解与记忆的公式和概念,在此通过博客的形式做一次梳理,主要内容为统计学中抽样分布、假设检验、参数估计、分类数据分析、方差分析、一元二元线性分析、时间序列分析、指数的理论知识,不足之处望多多指正。

什么是方差分析

表面上,方差分析是检验多个总体均值是否相等的统计方法,但本质上它所研究的是分类型自变量对数值型自变量的影响,定义:就是通过验证各总体均值是否相等来判定分类型自变量是否有显著性影响。

  • 误差类型
    (1)随机误差:因素的同一水平(总体)下,样本各观察值之间的差异
    (2)系统误差:因素的不同水平(不同总体)之间观察值的差异

  • 误差计算公式
    (1)第i个总体均值:xˉi=∑j=1nixijni(i=1,2,⋯,k)\bar{x}_{i}=\frac{\sum_{j=1}^{n_{i}} x_{i j}}{n_{i}}(i=1,2, \cdots, k)xˉi​=ni​∑j=1ni​​xij​​(i=1,2,⋯,k)
    (2)总体均值:xˉ‾=∑i=1k∑j=1nixijn=∑i=1knxˉin\overline{\bar{x}}=\frac{\sum_{i=1}^{k} \sum_{j=1}^{n_{i}} x_{i j}}{n}=\frac{\sum_{i=1}^{k} n \bar{x}_{i}}{n}xˉ=n∑i=1k​∑j=1ni​​xij​​=n∑i=1k​nxˉi​​ 式中: n=n1+n2+⋯+nkn=n_{1}+n_{2}+\cdots+n_{k}n=n1​+n2​+⋯+nk​

  • 一般的假设
    H0:μ1=μ2=μ3...=μkH_0:\mu_1=\mu_2=\mu_3...=\mu_kH0​:μ1​=μ2​=μ3​...=μk​;
    H1:μ1、μ2、μ3...μk不全相等H_1:\mu_1、\mu_2、\mu_3...\mu_k不全相等H1​:μ1​、μ2​、μ3​...μk​不全相等;

单因素方差分析

  • 假设:
    (1)每个总体都应服从正态分布;
    (2)各个总体的方差必须相同;
    (3)观察值是独立的。

单因素方差分析

  • 误差计算公式
    (1)总误差平方和SST:SST=∑i=1k∑j=1ni(xij−xˉ‾)2S S T=\sum_{i=1}^{k} \sum_{j=1}^{n_{i}}\left(x_{i j}-\overline{\bar{x}}\right)^{2}SST=∑i=1k​∑j=1ni​​(xij​−xˉ)2;自由度由n-1,总体均方和:MST=SST/n-1;
    (2)组内平方和SSE:SSE=∑i=1k∑j=1ni(xij−xˉi)2S S E=\sum_{i=1}^{k} \sum_{j=1}^{n_{i}}\left(x_{i j}-\bar{x}_{i}\right)^{2}SSE=∑i=1k​∑j=1ni​​(xij​−xˉi​)2;自由度由k-1,组内均方和:MSE=SSE/k-1;
    (3)组间平方和SSA:SSA=∑i=1k∑j=1ni(xˉi−xˉ‾)2S S A=\sum_{i=1}^{k} \sum_{j=1}^{n_{i}}\left(\bar{x}_{i}-\overline{\bar{x}}\right)^{2}SSA=∑i=1k​∑j=1ni​​(xˉi​−xˉ)2 ;自由度为n-k,总体均方和:MSA=SSA/n-k;
    (4)SST = SSA + SSE。

  • 检验统计量计算公式:F=MSAMSE∼F(k−1,n−k)F=\frac{M S A}{M S E} \sim F(k-1, n-k)F=MSEMSA​∼F(k−1,n−k)

  • 单因素方差分析表

  • 关系强度:R2=SSASSTR^2=\frac{SSA}{SST}R2=SSTSSA​:自变量对因变量的影响效应。

多重比较

  • 作用:检验两个总体均值是否相等
  • t分布检验统计量计算公式:
    LSD=tα/2∗MSE(1ni+1nj)L S D=t_{\alpha / 2} *\sqrt{M S E\left(\frac{1}{n_{i}}+\frac{1}{n_{j}}\right)}LSD=tα/2​∗MSE(ni​1​+nj​1​)​
  • 决策:
    若∣xˉi−xˉj∣>LSD\left|\bar{x}_{i}-\bar{x}_{j}\right|>L S D∣xˉi​−xˉj​∣>LSD,拒绝H0,反之接受。

双因素方差分析

  • 假设
    (1)每个总体都服从正态分布;
    (2)各个总体的方差必须相同;
    (3)观察值是独立的。

无交互作用的双因素方差分析

  • 误差计算公式
    (1)总误差平方和SST:SST=∑i=1k∑j=1ni(xij−xˉ‾)2S S T=\sum_{i=1}^{k} \sum_{j=1}^{n_{i}}\left(x_{i j}-\overline{\bar{x}}\right)^{2}SST=∑i=1k​∑j=1ni​​(xij​−xˉ)2;自由度由n-1,总体均方和:MST=SST/kr-1;
    (2)组内平方和SSE:SSE=∑i=1k∑j=1ni(xij−xˉi)2S S E=\sum_{i=1}^{k} \sum_{j=1}^{n_{i}}\left(x_{i j}-\bar{x}_{i}\right)^{2}SSE=∑i=1k​∑j=1ni​​(xij​−xˉi​)2;自由度由k-1,组内均方和:MSE=SSE/(k-1)(r-1);
    (3)列因素误差平方和:SSC=∑i=1k∑j=1r(xˉj−xˉ)2S S C=\sum_{i=1}^{k} \sum_{j=1}^{r}\left(\bar{x}_{j}-\bar{x}\right)^{2}SSC=∑i=1k​∑j=1r​(xˉj​−xˉ)2自由度由k-1,组内均方和:MSC=SSC/r-1;;
    (4)行因素误差平方和:SSR=∑i=1k∑j=1r(xˉi.−xˉ)2S S R=\sum_{i=1}^{k} \sum_{j=1}^{r}\left(\bar{x}_{i .}-\bar{x}\right)^{2}SSR=∑i=1k​∑j=1r​(xˉi.​−xˉ)2自由度由k-1,组内均方和:MSR=SSR/k-1;
    (5)SST = SSR +SSC+SSE。

  • F分布检验量计算公式:
    FR=MSRMSE∼F(k−1,(k−1)(r−1))F_{\mathrm{R}}=\frac{M S R}{M S E} \sim F(k-1,(k-1)(r-1))FR​=MSEMSR​∼F(k−1,(k−1)(r−1))
    FC=MSCMSE∼F(r−1,(k−1)(r−1))F_{\mathrm{C}}=\frac{M S C}{M S E} \sim F(r-1,(k-1)(r-1))FC​=MSEMSC​∼F(r−1,(k−1)(r−1))

  • 方差分析表:

  • 关系强度:R2=SSC+SSRSSTR^2=\frac{SSC+SSR}{SST}R2=SSTSSC+SSR​:自变量对因变量的影响效应。

有交互作用的双因素方差分析

  • 误差计算公式
    (1)总误差平方和SST:SST=∑i=1k∑j=1r∑l=1m(xijl−xˉ‾)2S S T=\sum_{i=1}^{k} \sum_{j=1}^{r} \sum_{l=1}^{m}\left(x_{i j l}-\overline{\bar{x}}\right)^{2}SST=∑i=1k​∑j=1r​∑l=1m​(xijl​−xˉ)2;自由度由n-1,总体均方和:MST=SST/kr-1;
    (2)组内平方和SSE:SSE=SST−SSR−SSC−SSRCS S E=SST-SSR-SSC-SSRCSSE=SST−SSR−SSC−SSRC;自由度由k-1,组内均方和:MSE=SSE/kr(m-1);
    (3)列因素误差平方和:SSC=m∑i=1k∑j=1r(xˉj−xˉ)2S S C=m\sum_{i=1}^{k} \sum_{j=1}^{r}\left(\bar{x}_{j}-\bar{x}\right)^{2}SSC=m∑i=1k​∑j=1r​(xˉj​−xˉ)2自由度由k-1,组内均方和:MSC=SSC/r-1;;
    (4)行因素误差平方和:SSR=m∑i=1k∑j=1r(xˉi.−xˉ)2S S R=m\sum_{i=1}^{k} \sum_{j=1}^{r}\left(\bar{x}_{i .}-\bar{x}\right)^{2}SSR=m∑i=1k​∑j=1r​(xˉi.​−xˉ)2自由度由k-1,组内均方和:MSR=SSR/k-1;
    (5)SSRC⁡=m∑i=1k∑j=1r(xˉij−xˉi.−xˉ.j+xˉ‾)2\operatorname{SSRC}=m \sum_{i=1}^{k} \sum_{j=1}^{r}\left(\bar{x}_{i j}-\bar{x}_{i .}-\bar{x}_{. j}+\overline{\bar{x}}\right)^{2}SSRC=m∑i=1k​∑j=1r​(xˉij​−xˉi.​−xˉ.j​+xˉ)2自由度由(k-1)(r-1),组内均方和:MSRC=SSRC/(k-1*)(r-1);
    (6)SST = SSR +SSC+SSE+SSRC。
    同上计算得到相关F分布统计量。
  • 误差分析表

统计学理论—方差分析相关推荐

  1. 统计学理论—抽样分布

    在学习统计学贾书的过程,在第6-14章节出有许多需要理解与记忆的公式和概念,在此通过博客的形式做一次梳理,主要内容为统计学中抽样分布.假设检验.参数估计.分类数据分析.方差分析.一元二元线性分析.时间 ...

  2. 地统计学半方差分析几个名词含义说明

    1.半方差函数:也称空间变异函数是地统计学的重要组成部分,是抽样间隔为h时样本值方差数学期望的一半.以变异函数K(h)为Y轴,抽样间隔h为x轴,可绘成变异函数曲线图. 2.块金值(Nugget)用Co ...

  3. 数据分析——统计学理论和方法

    1.描述统计 描述统计是通过图表或数学方法,对数据资料进行整理.分析,并对数据的分布状态.数字特征和随机变量之间关系进行估计和描述的方法.描述统计分为集中趋势分析和离中趋势分析和相关分析三大部分. 集 ...

  4. Python统计学07——方差分析

    参考书目:贾俊平. 统计学--Python实现. 北京: 高等教育出版社,2021. 方差分析的定义是检验分类型自变量对数值型因变量是否有显著性影响. 方差分析的简称是ANOVA,在心理学医学等领域运 ...

  5. 数学建模、统计学之方差分析

    文章目录 概述 前提 实验设计三原则 单因素方差分析 单因素方差分析基本步骤 数学模型 统计分析 方差分析表 Matlab 实现 均衡数据 非均衡数据 总结 双因素方差分析 例 3 例 4 正交试验设 ...

  6. 【应用统计学】方差分析

    一.问题的提出 [例7-1] 三台设备平均灌装时间分别是15.82秒.16.67秒和14.97秒.试用样本数据检验这3台机器灌装过程的时间是否存在显著不同,以便对设备的购买做出决策.( α=0.05 ...

  7. 学习统计学之方差分析

    方差分析是用来研究诸多控制变量中哪些变量对观测变量的变化有显著性性的影响,对观测变量有显著性影响的各个控制变量的不同水平以及各个水平的交互搭配是如何影响观测变量的.方差分析认为观测变量值的变化是有控制 ...

  8. 数据分析的统计学基础--方差分析

  9. 应用统计学与R语言实现学习笔记(八)——方差分析

    Chapter 8 ANOVA 本篇是第八章,内容是方差分析.前一段考试,汇报,作业.忙不过来,停更了一段时间,现在重新开始更这一部分内容.方差分析是很多实验的基础以及很重要的分析手段,这一章内容相比 ...

  10. r语言算巢式设计方差分析_应用统计学与R语言实现学习笔记(八)——方差分析...

    Chapter 8 ANOVA 本篇是第八章,内容是方差分析.前一段考试,汇报,作业.忙不过来,停更了一段时间,现在重新开始更这一部分内容.方差分析是很多实验的基础以及很重要的分析手段,这一章内容相比 ...

最新文章

  1. 另类无法在ESXi上添加存储器故障
  2. mysql五大引擎之间的区别和优劣之分
  3. innodb_force_recovery的值意思
  4. 《数据库原理与应用》(第三版)第15章 备份和恢复数据库 基础 习题参考答案
  5. 圣地亚哥的计算机科学在哪个学院,加州大学圣地亚哥分校计算机科学在哪个学院?...
  6. java生成动态验证码_动态生成验证码案例
  7. python mssql github_GitHub上最热门的开源项目都在这里了
  8. yolov5-pytorch训练自己的数据集
  9. BPTT算法推导以及LSTM是如何解决梯度消失的
  10. 转:Android应用Icon大小在不同分辨率下定义
  11. 数据库常用sql语句总结
  12. 机器学习之MATLAB代码--基于VMD与SSA优化lssvm的功率预测(多变量)(七)
  13. 【linux内核分析与应用-陈莉君】物理内存分配与回收机制下
  14. matlab实现通信系统,香农定理的介绍
  15. C++类和对象——设计一个长方形类
  16. [spring源码学习]六、IOC源码-BeanFactory和factory-bean
  17. untiy 怎么把物体显示在最上层
  18. 雷达感应智能化技术,让家居生活更智能,雷达传感器技术应用
  19. GEE--LandTrendr
  20. Spring源码分析(十)依赖注入源码解析3:DefaultListableBeanFactory#doResolveDependency 真正开始解析依赖项

热门文章

  1. 计算机系毕业论文指导老师评语,设计指导教师的评语
  2. 2012移动开发者经济学
  3. 快递100 物流公司编码
  4. 058.克鲁斯卡尔(Kruskal)算法的原理以及解决最小生成树问题
  5. 非线性曲线拟合和多项式曲线拟合
  6. 抖音seo,抖音优化系统,抖音seo矩阵系统源码技术搭建
  7. Python验证信用卡号码是否有效
  8. ubuntu 20.04 不能鼠标双击打开 .desktop (桌面快捷方式图标)文件(双击变为使用文本编辑器打开)的解决办法
  9. gitbub上传代码
  10. 软件测试语句覆盖,软件测试中的语句覆盖,分支覆盖,条件覆盖以及路径覆盖...