目录

置信区间:

置信区间求解步骤:

置信区间求解:

总体均值的置信区间:

总体的标准差已知:

总体的标准差未知:

样本容量的确定

总体比率的置信区间

样本容量的确定


置信区间:

通过点估计量加减一个边际误差值,来计算区间估计,均值落入这一区间具有特点的概率。目的是为了得出点估计量与总体参数的接近程度

置信区间求解步骤:

  1. 选择总体统计量——用于构建置信区间的总体统计量
  2. 求出其抽样分布
  3. 决定置信水平——选择的区间包含总体统计量的概率
  4. 求出置信区间的上下限

置信区间求解:

总体均值的置信区间:

总体的标准差已知:

公式1:

  1. X拔为样本均值;
  2. δ为总标准差,抽样前可以根据大量的历史记录估计总体标准差,可以看作标准差已知;
  3. n为样本容量;
  4. 确定置信系数,通常置信系数为1-a=0.95(或0.99),即置信区间有95%(99%)的概率包含总体均值;
  5. 根据标准正态概率表,查询1-a=0.95对应的Z值,但由于需要计算上限和下限,故需要查询a/2水平下的Z,即Za/2。

注:

1.总体服从正态分布,则上图中公式给出的置信区间实准确的,同时样本容量n可大可小;

2.总体不服从正态分布,则上图中公式给出的置信区间是近似的,同时样本容量n需要很大;

3.绝大部分样本容量n>=30即可

4.若总体分布不服从正态分布但大致对称,样本容量n至少为15时,置信区间才是一个好的近似

总体的标准差未知:

公式2:与公式1类似,不做单独说明

注:该图出自深入浅出统计学,置信区间计算公式中的C与公式1中的Za/2计算方式一致,只是不同书籍表达方式不同

公式3:

适用条件:

δ^2未知,样本容量可大可小;

公式说明:

  1. X拔为样本均值;
  2. S为样本标准差,抽样前可以根据大量的历史记录估计总体标准差,可以看作标准差已知;
  3. n为样本容量;
  4. 确定置信系数,通常置信系数为1-a=0.95(或0.99),即置信区间有95%(99%)的概率包含总体均值;
  5. 根据t分布概率表,查询1-a=0.95、自由度为n-1对应的t值,但由于需要计算上限和下限,故需要查询a/2水平下的t值,即ta/2。

注:.t分布依赖称为自由度的参数,当样本自由度不同时(如1,2,3....)有且仅有唯一的t分布概率与之相应

补充:样本标准差S公式

关于标准正态分布与t分布差别的讨论:

如图所示,随着自由度的增加,t分布与标准正态分布之间的差距越来越小。

注:

1.总体服从正态分布,则上图中公式给出的置信区间实准确的,同时样本容量n可大可小;

2.总体不服从正态分布,则上图中公式给出的置信区间是近似的,同时样本容量n需要很大;

3.绝大部分样本容量n>=30即可

4.若总体分布不服从正态分布但大致对称,样本容量n至少为15时,置信区间才是一个好的近似

5.若总体分布严重偏斜或者包含异常点,建议将样本容量增加到50或者更大?????

样本容量的确定

公式4:

E代表希望达到的边际误差,Za/2,总体标准差,样本容量共同决定边际误差

通过公式变型,得到计算样本容量的公式:

注:该公式要求总体标准差必须已知

总体标准差未知处理办法:

  1. 根据历史数据计算总体标准差的估计值;
  2. 选取初始样本,以初始样本的标准差作为总标准差的估计值;
  3. 估计总体的最大值和最小值,极差除以4作为总体标准差。

总体比率的置信区间

根据中心极限定理,当np>=5和n(1-p)>=5,P的抽样分布近似服从正态分布

公式5:

  1. P拔为样本比例;
  2. n为样本容量;
  3. 确定置信系数,通常置信系数为1-a=0.95(或0.99),即置信区间有95%(99%)的概率包含总体均值;
  4. 根据标准正态概率表,查询1-a=0.95对应的Z值,但由于需要计算上限和下限,故需要查询a/2水平下的Z,即Za/2。

样本容量的确定

同理公式4的推导过程:

由于抽样前样本比例P值未知,故需要估计一个P*来代替P

P*的估计方法:

1.利用历史数据的样本比例

2.选取一个初始样本,以初始样本的样本比例P1作为P*

3.合理猜测

4.上述均不适用时,取P*=0.5

原因如下表:P*(1-P*)数值最大,进而使样本容量尽量大

置信区间构建---商务与经济统计+深入浅出统计学相关推荐

  1. 商务与经济统计 | 推断统计学

    一.概率 事件 若干样本点的集合 事件的概率 等于事件中所有的样本点概率之和 条件概率 贝叶斯定理 二.离散型概率分布 随机变量 是一次试验的结果的数值性描述 离散型随机变量 指的是有穷个数值或一系列 ...

  2. 深入浅出统计学 第四五章 离散概率的计算与分布

    离散概率计算与分布的应用 在原书的这两章离散概率计算与分布的应用,重点在于概念的理解和公式的记忆. 而对于整本书而言,四五六章其实都作为第七章:三种离散概率分布,第八,九章,正态分布(连续概率分布之一 ...

  3. 深入浅出统计学 第二三章 量度

    量度 两类量度: (1) 集中趋势的量度->平均值,中位数,众数 (2) 分散性与变异性的亮度->全距(极值),四分位数(扩展:箱型图),方差与标准差,标准分 获取数据 import pa ...

  4. 深入浅出统计学 第一章 数据的可视化

    序言 在深入浅出统计学的第一张中一共出现了4类图像: 1. 比较基本比例->饼图 2. 比较数值的高低条形图(基本条形图,堆积条形图,分段条形图) 3. 连续数据的对比(等距直方图->频数 ...

  5. 正态分布表怎么查表_《深入浅出统计学》-读书笔记-再谈正态分布的应用

    目录: 橘猫吃不胖:<深入浅出统计学>-读书笔记-正态分布的应用​zhuanlan.zhihu.com <深入浅出统计学>,第九章,再谈正态分布的应用 上一篇提到的都是单一连续 ...

  6. 整理总结:深入浅出统计学——排列与组合

    参考资料:电子工业出版社的<深入浅出统计学> 前言 顺序是概率计算过程中不可避免的事情,通过学习简便方法来完成概率计算的进阶. 本篇目录 参考资料:电子工业出版社的<深入浅出统计学& ...

  7. 深入浅出统计学第七章 几何分布,二项分布,柏松分布

    简介 <深入浅出统计学>第七章详细介绍了三种概率分布及其应用,而我们则将进行程序编写,来计算这三种概率分布. 几何分布 scipy几何分布原文地址 下面是书中一些重要公式的代码实现,此处我 ...

  8. 整理总结:深入浅出统计学——正态分布的运用

    参考资料:电子工业出版社的<深入浅出统计学> 前言 并非所有数据集合都是离散的.可以指定确切数值的概率分布,其中也有数值型的概率分布,最典型的便是正态分布. 本篇目录 参考资料:电子工业出 ...

  9. 深入浅出统计学(十二)置信区间

    问题 总结 置信区间简便算法 章节理解 和点估计量相比,置信区间是另一种更'稳妥'的估计方法

最新文章

  1. careercup-高等难度 18.9
  2. 这段AI的深情告白在外网爆火:我并非真实,从未出生,永不死亡,你能爱我吗?...
  3. centos7查看内核以及删除旧内核
  4. jquery 使用方法
  5. Windows下创建软硬链接
  6. Bootstrap 按钮的尺寸
  7. Android 最火高速开发框架AndroidAnnotations使用具体解释
  8. 当WEB2.0从概念变成电子商务网站的工具
  9. 用python画简单的图案-使用 Python Turtle 设计简单而又美丽的图形
  10. ACCP学习旅程之----- 使用Dreamweaver制作网页
  11. 计算机网络复习-物理层
  12. ubuntu 系统获取和阅读 linux 源码
  13. python函数手册 stata_Eviews、Stata、Python描述性分析教程汇总
  14. PCB各种表面工艺差异说明
  15. 资料,丰富资料,丰富资料(模式识别......)
  16. python是真刑啊!爬虫这样用,离好日子越铐越近了~
  17. CSS - 响应式布局(二)响应式栅格系统
  18. 大数据开发,就要掌握哪些技术?
  19. 使用ArcPy实现创建ags文件
  20. 060201面积-定积分在几何学上的应用-定积分的应用

热门文章

  1. 在某高层建筑物中只有一部电梯,由N个正整数组成一个请求序列,列表中的数字表示电梯将在哪层停,电梯按列表顺序依次停靠电梯每上行一层需要花6秒时间,每下行一层需要花4秒时间,电梯每停一次需要用时5秒。
  2. [附源码]计算机毕业设计JAVA文章管理系统查重PPT
  3. android 图像处理sdk,用于AndroidSDK的快速位图模糊
  4. JS运算保留一位小数
  5. 爱普森发布3D头戴式显示器Moverio
  6. Ubuntu NVIDIA Intel双显卡,安装NVIDIA驱动
  7. Corel VideoStudio Ultimate 会声会影2022
  8. STORLEAD X5A 2.5” SATA 固态硬盘
  9. adrv9003/ADRV9001/ADRV9002 FPGA驱动开发(硬件开发)
  10. encode和tokenize的区别