学习内容:

因子、水平、单因素方差分析、双因素方差分析、协方差分析

概述

通过对数据误差来源的分析检验各总体的均值是否相等来判断分类型的自变量对数值型的因变量是否有显著影响。
因素:即因子,所要检验的对象
水平:又称处理,即因素的不同表现
观测值:每个因子水平下得到的样本数据
仅有一个因素的方差分析称为单因素方差分析,包含两个因素的方差分析称为双因素方差分析,两个以上的称为多因素方差分析。

例题

消费者与产品生产者、销售者或服务的提供者之间经常发生纠纷。为了对几个行业的服务质量进行评价,消费者协会在零售业,旅游业,航空公司,家电制造业分别抽取了不同的企业作为样本。一共抽取了23家企业,统计出消费者对总共23家企业投诉的次数,结果如下表所示:

消费者协会想知道这几个行业之间的服务质量是否有显著差异,实际是是判断行业对被投诉次数是否有显著影响,即要检验这四个行业被投诉次数的均值是否相等。
如果均值相等,则意味这服务质量没有显著性差异。
如果均值不全相等,则意味着行业对被投诉次数是有影响的,服务质量是有显著性差异的。

回顾方差分析的定义:是对数据误差来源的分析,来判断均值是否相等。所以在进行方差分析之前,需要考虑数据误差的来源

误差分解

组内误差:由于抽样的随机性所造成的随机误差,即来自水平内部的数据误差,反映一个样本内部数据的离散程度,只含有随机误差。例如:总体数据分布有[40,41,100,42]等,抽样时刚好抽到[40,100]。
组间误差:来自不同水平之间的误差,这种误差包括抽样本身的误差和行业本身系统性因素造成的系统误差。例如:可能航空公司的投诉次数本身就比旅游业低。

对于方差分析来说:数据的误差时用平方和表示的。即

总平方和(SST):反应全部数据误差大小的平方和,反应全部观测值的离散状况。
组内平方和(SSE):反应组内误差大小的平方和,也称误差平方和或残差平方和,反映的是每个样本内各观测值的离散状况。
组间平方和(SSA):反应组间误差大小的平方和,也称因素平方和,反映样本均值的差异。

均方:各平方和除以他们所对应的自由度,也称为方差。
此时:
若原假设成立,组间误差中将只包含随机误差,组间均方与组内均方的数值就会很接近,比值就会接近于1。
若原假设不成立,组间误差中将既包含随机误差又包含系统误差,组间均方会大于组内均方,他们之间的比值将大于1。
当比值大于某种程度(α \alphaα)时,就可以说不同水平之间存在显著差异。
这个比值服从分子自由度为n-1,分布自由度为n-k的F分布

解题

上题中,因素是行业,水平是不同行业的不同表现,观测值是具体的被投诉次数。
涉及两个变量:
一个是分类型自变量,如行业
一个是数值型自变量,如被投诉次数
方差分析就是要研究行业对被投诉次数是否有显著影响

步骤

步骤和假设检验中的类似,区别是在于构建统计量的异同。

第一步:建立原假设和备择假设
分别使用ABCD来代替零售业,旅游业,航空公司,家电制造业。

第二步:选择合适的显著性水平
默认为 α=0.05 \alpha=0.05α=0.05
第三步:选择合适的抽样分布及其统计量
方差分析适用的都是F分布和F统计量
第四步:从总体中抽取随机样本,计算P值




第五步:进行判别,得出结论
可以看到,在自由度(3,16)时,置信度为95%的值为3.24,2.92<3.24,所以我们接受原假设的概率为95%,所以接受原假设。所以行业对被投诉次数没有显著影响。

##############################################################
@ 2020.01.13 木居居士的统计学小组 第十四周 打卡
安利公益监督学习组织 - 【公众号】数据科学家联盟
https://mp.weixin.qq.com/s/1WWmbLZucz9vIp-4tKKQ5Q
感谢木东大佬、饼干大佬、南头大佬、星空妹砸、Desitiny、 DD-Kylin的无私付出,抱拳ing~

统计学习第十四周-方差分析相关推荐

  1. Linux学习笔记十四周一次课(5月9日)

    14.1 NFS介绍 14.2 NFS服务端安装配置 服务端安装nfs-utils和rpcbind:客户端只安装nfs-utils #yum install -y nfs-utils rpcbind ...

  2. 2017-2018-1 20155320 《信息安全系统设计基础》第十四周学习总结

    2017-2018-1 20155320 <信息安全系统设计基础>第十四周学习总结 参考老师提供的教材内容导读 本周的内容是要找出全书你认为学得最差的一章,深入重新学习一下 我决定学习第十 ...

  3. 第十四周学习周报(20180604-20180610)

    第十四周学习周报 一.本周学习情况 1.本周主要学习李宏毅老师的机器学习课程 没有学习吴恩达老师微专业课<深度学习工程师> 2.看了机器学习的两篇算法博客.关于逻辑回归和线性回归算法 3. ...

  4. 2017-2018-1 20155328 《信息安全系统设计基础》第十四周学习总结

    2017-2018-1 20155328 <信息安全系统设计基础>第十四周学习总结 本周学习任务是找出自己本学期学得最差的一章,重新学,总结新的收获.我认为自己学得最差的一章是教材第七章& ...

  5. 统计学习:方差分析(ANOVA2)

    统计学习 最近在做信号处理的时候发现自己的理论知识不够,因此,开始了理论的重学之路,特开此系列帖子,总结自己的学习收获以及方便后来的小伙伴. 方差分析ANOVA 方差的分析,通常被叫做ANOVA,可以 ...

  6. 2017-2018-1 20155324 《信息安全系统设计基础》第十四周学习总结

    2017-2018-1 20155324 <信息安全系统设计基础>第十四周学习总结 找出全书你认为学得最差的一章,深入重新学习一下,要求(期末占5分): •总结新的收获 •给你的结对学习搭 ...

  7. 2017-2018-1 20155229 《信息安全系统设计基础》第十四周学习总结

    2017-2018-1 20155229 <信息安全系统设计基础>第十四周学习总结 对"第三章 程序机器级表示"的深入学习 我选择这章的理由是第一次学的时候还是不太理解 ...

  8. 20145240《信息安全系统设计基础》第十四周学习总结

    20145240<信息安全系统设计基础>第十四周周学习总结 教材学习内容总结 第九章 虚拟存储器 1.虚拟存储器3个重要的能力: (1)将主存看作是一个存储在磁盘上的地址空间的高速缓存,在 ...

  9. 2017-2018-1 20155323 《信息安全系统设计基础》第十四周学习总结

    2017-2018-1 20155323 <信息安全系统设计基础>第十四周学习总结 找出全书你认为学得最差的一章,深入重新学习一下,要求: 总结新的收获 给你的结对学习搭档讲解或请教,并获 ...

最新文章

  1. ZIL (ZFS intent log) zil.c
  2. 04. Mybatis的resultMap基本应用
  3. 关闭串口_USART串口通信,DMA方式,一分钟从入门到大师
  4. 同事查询多行_从零学会SQL-简单查询
  5. 文件上传函数(get post assert)
  6. windows命令提示符_如何个性化Windows命令提示符
  7. mysql5.5提示Deprecated: mysql_query(): The mysql extension is deprecated
  8. echarts实现双Y轴之散点和折线图
  9. 密码库LibTomCrypt学习记录——(0)LibTomCrypt简介
  10. sqlmap使用教程(超详细)
  11. QQ应用自动登录最小化功能
  12. Ubuntu VirtualBox 安装问题解决
  13. 封装jquery的方法
  14. 蓝狐SEO关键词按天计费系统_seo扣费系统源码
  15. c语言 小学生测试题,C语言编程测试题(含答案)
  16. Java开发学习路线,大拿告诉你Java学习都应该学什么
  17. ADOBE AIR是什么?
  18. PHP面试题(遇到的)
  19. GDB定位诡异的FreeSWITCH编译问题
  20. [转]国外人气最旺的软件测试网站

热门文章

  1. Android中图片圆形设置三种方法介绍
  2. 2020-09-04 CD40193十六进制加减Multisim仿真
  3. 恒讯科技讲解:量子云计算是什么?
  4. 关于后缀表达式的转换
  5. 同时删除Excel表格中多行隔行空白行
  6. 什么是http接口?
  7. matlab系统辨识工具箱原理,matlab常用工具箱介绍
  8. Win11用户名和密码备份方法
  9. 转载:刚入职美团两个月,就想离职了,每天加班到吐
  10. I2S、TDM详细介绍