因为不能期望点估计量能给出总体参数的精确值,故常在点估计量上加减一个边际误差来计算区间估计。

8.1 当总体标准差已知时,总体均值的区间估计

区间估计

1-α表示置信系数。

比如置信系数为0.95时,则这个区间称为95%的置信区间,有95%的把握相信区间内包含总体均值μ。或者换种说法,从区间中随机取100个数,再次组成区间,约有95个区间包含总体均值。

如果总体的分布不服从正态分布,那样本容量要尽量大。

8.2 总体均值的区间估计:σ未知的情况

更常见的情况是σ未知,用样本标准差估计总体标准差,边际误差和总体均值的区间估计都已t分布的概率分布为依据。

t分布是一类相似的概率分布组成的分布族,某个特定的t分布依赖于自由度。

随着自由度的增大,t分布和标准正态分布越来越像。

区间估计

8.3 样本容量的确定

E表示希望达到的边际误差

样本容量

8.4 总体比率

区间估计

假设检验

9.1 原假设和备择假设的建立

将研究中的假设作为备择假设,将受到挑战的假说设为原假设。

9.2 第一类错误和第二类错误

第一类错误是拒真,第二类错误是纳伪。

当原假设为真且以等式出现时犯第一类错误的概率称为检验的显著性水平,用α表示,通常取0.05或0.01。

9.3 总体均值的检验,当总体标准差已知

假设检验的步骤:先提出原假设和备择假设,指定检验中的显著性水平,收集样本数据并计算检验统计量。

此处进行的是总体均值的检验,且假定总体标准差已知,故检验统计量的计算方法为

p-值法:利用检验统计量的值计算出p值,与显著性水平进行比较,如果p-值≤α,则拒绝原假设。

临界值方法:通过显著性水平计算出临界值和拒绝法则,用检验统计量确定是否拒绝原假设。

区间估计和假设检验的关系,可以通过区间估计来进行假设检验,设置信水平为0.95,显著性水平为0.05,如果原假设中的总体均值在置信区间中,则不能拒绝原假设。

9.4 总体标准差未知时检验总体均值

检验统计量

检验统计量服从自由度为n-1的t分布。

检验步骤和上面一样。

9.5 总体比率

检验统计量服从标准正态概率分布。

9.6 假设检验与决策

前面都是控制了第一类错误,所以得出的结论是不能拒绝原假设而不是接受原假设,因为没有控制第二类错误。

9.7 计算第二类错误的概率

9.8 对总体均值进行假设检验时样本容量的确定

两总体均值和比例的推断

10.1 两总体均值之差的推断,两个总体方差已知时

样本均值之差的标准误差

两总体均值之差的区间估计

两总体均值之差的假设检验

假设两总体均值之差为D0,对其进行假设检验。

计算检验统计量

计算出p值,如果小于显著性水平,则拒绝均值之差为D0的原假设。

10.2 两总体均值之差的推断,总体方差均未知时

总体均值之差的区间估计

服从t分布,自由度需要计算,计算结果向下取整。

得到自由度后选择对应的t分布表,即可求出区间估计。

均值之差的假设检验

检验统计量的计算

根据检验统计量求出p值并与显著性水平比较。

10.3 两总体均值之差的推断:匹配样本

搜集生产时间数据时有两种方案,一种基于独立样本,一种基于匹配样本。

独立样本设计:抽取两个随机样本,第一个样本中的工人用方法一进行生产,第二个样本中的工人用方法二进行生产。

匹配样本设计:抽取一个随机样本,样本中的工人分别用方法一、二进行生产。

匹配样本设计消除了工人间的差异,误差会比较小。

检验统计量的计算

进一步算出p值,和α进行比较。

10.4 两总体比例之差的推断

总体方差的统计推断

11.1 一个总体方差的统计推断

样本方差

总体方差的区间估计

卡方值为基于自由度为n-1的卡方分布。

假设检验

检验统计量

后面用p值法或者临界值法进行判断。

11.2 两个总体方差的统计推断

当两个正态总体的方差相等时,样本方差之比的抽样分布服从F分布

分子自由度为n1-1,分母自由度为n2-1。

s1是取自总体1的样本量为n1的样本标准差。

检验两个总体方差是否相等,所作假设如下

检验统计量

样本方差较大的放上面。

多个比例的比较,独立性及拟合优度检验

12.1 三个或多个总体比例的相等性的检验

原假设是多个总体的比例全部相等,备择假设是不全相等。

举个例子,调查三种车的顾客品牌忠诚度

如果三种车的顾客品牌忠诚度相等,计算出期望频数

根据观测值和期望值计算出检验统计量,检验统计量服从自由度为k-1的卡方分布,k表示总体个数。

从例子中得到拒绝原假设的结论,下一个问题是确定那几个比例间存在差异,通过多重比较方法判断——Marascuilo方法。

12.2 独立性检验

卡方检验的一个重要应用是利用样本数据检验两个分类变量的独立性。

检验的原假设是两个分类变量独立。

举个例子,抽取200名饮酒者,调查啤酒类型和性别是否存在关系。

求出观察频数

根据两个频数表计算出卡方值

设分类变量1有n个,分类变量2有m个,那么自由度为(n-1)(m-1)个。

12.3 拟合优度检验

通过卡方检验来确定被抽样的总体是否服从某个特殊的概率分布。

检验总体是否服从多项概率分布。

举个例子,市场上产品A、B、C的占有率为30%,50%,20%,C产品后来搞了个改进,对总体抽取样本,进行假设检验,看这个改进是否对占有率产生了影响。

原假设是总体仍然服从原来的概率分布,即改进没有影响。

根据样本得到观察频数表

根据原概率分布得到期望频数表

计算检验统计量

自由度为3-1=2。

检验某总体是否服从正态分布。

举个例子,求下面的测试分数是否服从正态分布

将样本数除5,即可得到应该建立的区间个数。除5表示每个区间的期望频数应该是5。

这里样本数为50,可以建立10个区间

将观测数据分配到区间

根据观测频数和期望频数计算出检验统计量

此处自由度为10-2-1=7,2表示两个样本估计的参数:均值和标准差。

实验设计与方差分析

因子可以理解为分类变量,因子中的处理理解为分类变量有多少个。

应用方差分析需要三个假定:一是对每个总体,响应变量服从正态分布,二是响应变量的方差对所有总体是相同的,三是观测值必须是独立的。

利用方差分析可以确定,在三个样本均值之间观察到的差异是否足够大到可以拒绝三个样本均值相等的原假设。

如果三个总体均值相等,我们就可以期望三个样本均值很接近。

如果方差分析的假设成立并且原假设为真,则每一个样本都是来自均值为μ,方差为σ^2的正态分布。

来自正态总体的容量为n的一个简单随机样本,其样本均值的抽样分布仍然服从正态分布,均值为μ,方差为σ^2/n。

举个例子,公司有三种生产方法,假设三个方法的总体均值相等,那么三个样本来自同一个正态分布,通过三个样本均值的均值与方差可以用来估计该抽样分布的均值与方差。

此处样本均值抽样分布的均值的一个估计值是三个样本均值相加除3,等于60,通过抽样分布的均值再算出抽样分布的方差。

由于抽样分布的方差等于总体方差除样本数,可以求出总体方差,这个总体方差被称为方差的处理间估计。

总体方差还有一个估计值,叫处理内估计,即将三个样本的方差相加除3,等于28.33。

无论原假设是真是假,处理内估计都是总体方差的一个好的估计量,若原假设为假,则处理间估计会高估总体方差。

13.2 方差分析和完全随机化实验设计

应用方差分析检验k个总体均值是否相等,原假设一般为k个总体均值全相等,备择假设是不全相等。

总样本均值等于分样本均值的均值,分样本的样本容量相等。

总体方差的处理间估计:称总体方差的这个估计量为均方处理

k表示样本个数,nj表示样本容量,xj表示样本均值,x拔拔表示总样本均值。

如果原假设为真,那么MSTR给出了总体方差的一个无偏估计,否则会高估总体方差。

总体方差的处理内估计:称总体方差的这个估计量为均方误差

k表示样本个数,nT表示总样本容量,nj表示样本容量,sj^2表示样本方差。

MSE永远给出总体方差的无偏估计。

方差估计量的比较:F检验

对于正态总体,总体方差的两个独立的估计量之比的抽样分布服从F分布。如果原假设为真且方差分析的假定得到满足,则MSTR/MSE的抽样分布服从分子自由度为k-1,分母自由度为nT-k的F分布。

ANOVA表

13.3 多重比较方法

当原假设被拒绝时,需要判断哪几个总体均值之间存在差异。

Fisher的LSD方法

13.4 随机化区组设计

这种方法通过消除MSE项中来自外部的变异,以达到控制变异外部来源的目的。

举个例子

参加测试的管理员对每个系统进行测试,消除了个体间的差异。

ANOVA方法

13.5 析因试验

为了得到两个或以上因子同时存在时的一些统计结论。

例子,研究辅导课程和本科院校这两个因子对考试分数的影响。

每个处理组合的样本容量为2。

ANOVA方法

商务与经济统计阅读笔记2相关推荐

  1. 商务与经济统计阅读笔记3

    简单线性回归 回归分析:利用统计学方法来建立一个表示变量间相互关系的方程. 被预测的变量称为因变量,用来预测的是自变量. 14.1 简单线性回归模型 ε是一个随机变量,称为模型的误差项,包含在y中,但 ...

  2. 研究生如何做文献阅读笔记

    ** 研究生如何做文献阅读笔记 ** 研究生如何做文献阅读笔记? 说实在的,我自己也不是很会读书.读书的速度也不快,只是喜欢读书罢了.阅读文献,对于开题期间的研究生和写论文期间的研究生是很重要的功课, ...

  3. 文档资源推荐 研究生如何做文献阅读笔记(强力推荐!!!)

    转自:http://www.soudoc.com/bbs/viewthread.php?tid=9056542&extra=&page=1 研究生如何做文献阅读笔记? 说实在的,我自己 ...

  4. trainer setup_Detectron2源码阅读笔记-(一)Configamp;Trainer

    一.代码结构概览 1.核心部分 configs:储存各种网络的yaml配置文件 datasets:存放数据集的地方 detectron2:运行代码的核心组件 tools:提供了运行代码的入口以及一切可 ...

  5. VoxelNet阅读笔记

    作者:Tom Hardy Date:2020-02-11 来源:VoxelNet阅读笔记

  6. Transformers包tokenizer.encode()方法源码阅读笔记

    Transformers包tokenizer.encode()方法源码阅读笔记_天才小呵呵的博客-CSDN博客_tokenizer.encode

  7. 源码阅读笔记 BiLSTM+CRF做NER任务 流程图

    源码阅读笔记 BiLSTM+CRF做NER任务(二) 源码地址:https://github.com/ZhixiuYe/NER-pytorch 本篇正式进入源码的阅读,按照流程顺序,一一解剖. 一.流 ...

  8. Mina源码阅读笔记(一)-整体解读

    2019独角兽企业重金招聘Python工程师标准>>> 今天的这一节,将从整体上对mina的源代码进行把握,网上已经有好多关于mina源码的阅读笔记,但好多都是列举了一下每个接口或者 ...

  9. “CoreCLR is now Open Source”阅读笔记

    英文原文:CoreCLR is now Open Source 阅读笔记如下: CoreCLR是.NET Core的执行引擎,功能包括GC(Garbage Collection), JIT(将CIL代 ...

  10. QCon 2015 阅读笔记 - 团队建设

    QCon 2015阅读笔记 QCon 2015 阅读笔记 - 移动开发最佳实践 QCon 2015 阅读笔记 - 团队建设 中西对话:团队管理的五项理论和实战 - 谢欣.董飞(今日头条,LinkedI ...

最新文章

  1. 13 个 Python 新手练级项目
  2. 浅谈JavaScript中闭包
  3. SQL2008数据类型
  4. [转载] Python中的set(集合)数据类型
  5. 解决本地工具无法连接服务器上的mysql的问题
  6. java 代码段 执行超时 抛异常_Java 并发队列详解TransferQueue、BlockingQueue、BlockingDeque
  7. 【LOJ#10170】国王
  8. 虚机使用技巧几则(经验交流)
  9. 计算机u启动无法识别,电脑不识别u盘启动盘
  10. IDC将中国城市分成六级:每一级具体的城市是那几个市,谢谢回复
  11. LeetCode——75. 颜色分类(面试题)
  12. 中国民用航空飞行学院 - 人事工资薪酬管理系统
  13. Ubuntu16安装Nvidia驱动(GTX1060显卡)
  14. spring aop切面执行顺序
  15. 这是一个赞赏码(附赞赏码生成方法)
  16. 3D结构光能否决定未来行业发展新方向?
  17. 小红书如何营销?各大品牌小红书运营投放营销策划方案合集(13份)
  18. Flink Table Api SQL 初体验,Blink的使用
  19. python调用so库 undefind symbol_内嵌Python import时undefined symbol错误及解决 | 学步园
  20. 【HTML】语义化标签

热门文章

  1. 学习英语02——词汇——02
  2. 威富通对账单下载并且解析为对象列表展示
  3. c语言矩阵键盘控制四个led灯,51单片机矩阵键盘与左右流水灯控制C程序
  4. 分析法 :3W1H --- 5W1H 的解释
  5. 2022R1快开门式压力容器操作考试模拟100题模拟考试平台操作
  6. postman脚本文件存放的地址
  7. Linux进程间通信-消息队列
  8. 软件设计师中级考试,软考
  9. ArcGIS计算图斑地类面积
  10. 谷歌浏览器主题背景图片保存方法