置信区间构建---商务与经济统计+深入浅出统计学
目录
置信区间:
置信区间求解步骤:
置信区间求解:
总体均值的置信区间:
总体的标准差已知:
总体的标准差未知:
样本容量的确定
总体比率的置信区间
样本容量的确定
置信区间:
通过点估计量加减一个边际误差值,来计算区间估计,均值落入这一区间具有特点的概率。目的是为了得出点估计量与总体参数的接近程度
置信区间求解步骤:
- 选择总体统计量——用于构建置信区间的总体统计量
- 求出其抽样分布
- 决定置信水平——选择的区间包含总体统计量的概率
- 求出置信区间的上下限
置信区间求解:
总体均值的置信区间:
总体的标准差已知:
公式1:
- X拔为样本均值;
- δ为总标准差,抽样前可以根据大量的历史记录估计总体标准差,可以看作标准差已知;
- n为样本容量;
- 确定置信系数,通常置信系数为1-a=0.95(或0.99),即置信区间有95%(99%)的概率包含总体均值;
- 根据标准正态概率表,查询1-a=0.95对应的Z值,但由于需要计算上限和下限,故需要查询a/2水平下的Z,即Za/2。
注:
1.总体服从正态分布,则上图中公式给出的置信区间实准确的,同时样本容量n可大可小;
2.总体不服从正态分布,则上图中公式给出的置信区间是近似的,同时样本容量n需要很大;
3.绝大部分样本容量n>=30即可
4.若总体分布不服从正态分布但大致对称,样本容量n至少为15时,置信区间才是一个好的近似
总体的标准差未知:
公式2:与公式1类似,不做单独说明
注:该图出自深入浅出统计学,置信区间计算公式中的C与公式1中的Za/2计算方式一致,只是不同书籍表达方式不同
公式3:
适用条件:
δ^2未知,样本容量可大可小;
公式说明:
- X拔为样本均值;
- S为样本标准差,抽样前可以根据大量的历史记录估计总体标准差,可以看作标准差已知;
- n为样本容量;
- 确定置信系数,通常置信系数为1-a=0.95(或0.99),即置信区间有95%(99%)的概率包含总体均值;
- 根据t分布概率表,查询1-a=0.95、自由度为n-1对应的t值,但由于需要计算上限和下限,故需要查询a/2水平下的t值,即ta/2。
注:.t分布依赖称为自由度的参数,当样本自由度不同时(如1,2,3....)有且仅有唯一的t分布概率与之相应
补充:样本标准差S公式
关于标准正态分布与t分布差别的讨论:
如图所示,随着自由度的增加,t分布与标准正态分布之间的差距越来越小。
注:
1.总体服从正态分布,则上图中公式给出的置信区间实准确的,同时样本容量n可大可小;
2.总体不服从正态分布,则上图中公式给出的置信区间是近似的,同时样本容量n需要很大;
3.绝大部分样本容量n>=30即可
4.若总体分布不服从正态分布但大致对称,样本容量n至少为15时,置信区间才是一个好的近似
5.若总体分布严重偏斜或者包含异常点,建议将样本容量增加到50或者更大?????
样本容量的确定
公式4:
E代表希望达到的边际误差,Za/2,总体标准差,样本容量共同决定边际误差
通过公式变型,得到计算样本容量的公式:
注:该公式要求总体标准差必须已知
总体标准差未知处理办法:
- 根据历史数据计算总体标准差的估计值;
- 选取初始样本,以初始样本的标准差作为总标准差的估计值;
- 估计总体的最大值和最小值,极差除以4作为总体标准差。
总体比率的置信区间
根据中心极限定理,当np>=5和n(1-p)>=5,P的抽样分布近似服从正态分布
公式5:
- P拔为样本比例;
- n为样本容量;
- 确定置信系数,通常置信系数为1-a=0.95(或0.99),即置信区间有95%(99%)的概率包含总体均值;
- 根据标准正态概率表,查询1-a=0.95对应的Z值,但由于需要计算上限和下限,故需要查询a/2水平下的Z,即Za/2。
样本容量的确定
同理公式4的推导过程:
由于抽样前样本比例P值未知,故需要估计一个P*来代替P
P*的估计方法:
1.利用历史数据的样本比例
2.选取一个初始样本,以初始样本的样本比例P1作为P*
3.合理猜测
4.上述均不适用时,取P*=0.5
原因如下表:P*(1-P*)数值最大,进而使样本容量尽量大
置信区间构建---商务与经济统计+深入浅出统计学相关推荐
- 商务与经济统计 | 推断统计学
一.概率 事件 若干样本点的集合 事件的概率 等于事件中所有的样本点概率之和 条件概率 贝叶斯定理 二.离散型概率分布 随机变量 是一次试验的结果的数值性描述 离散型随机变量 指的是有穷个数值或一系列 ...
- 深入浅出统计学 第四五章 离散概率的计算与分布
离散概率计算与分布的应用 在原书的这两章离散概率计算与分布的应用,重点在于概念的理解和公式的记忆. 而对于整本书而言,四五六章其实都作为第七章:三种离散概率分布,第八,九章,正态分布(连续概率分布之一 ...
- 深入浅出统计学 第二三章 量度
量度 两类量度: (1) 集中趋势的量度->平均值,中位数,众数 (2) 分散性与变异性的亮度->全距(极值),四分位数(扩展:箱型图),方差与标准差,标准分 获取数据 import pa ...
- 深入浅出统计学 第一章 数据的可视化
序言 在深入浅出统计学的第一张中一共出现了4类图像: 1. 比较基本比例->饼图 2. 比较数值的高低条形图(基本条形图,堆积条形图,分段条形图) 3. 连续数据的对比(等距直方图->频数 ...
- 正态分布表怎么查表_《深入浅出统计学》-读书笔记-再谈正态分布的应用
目录: 橘猫吃不胖:<深入浅出统计学>-读书笔记-正态分布的应用zhuanlan.zhihu.com <深入浅出统计学>,第九章,再谈正态分布的应用 上一篇提到的都是单一连续 ...
- 整理总结:深入浅出统计学——排列与组合
参考资料:电子工业出版社的<深入浅出统计学> 前言 顺序是概率计算过程中不可避免的事情,通过学习简便方法来完成概率计算的进阶. 本篇目录 参考资料:电子工业出版社的<深入浅出统计学& ...
- 深入浅出统计学第七章 几何分布,二项分布,柏松分布
简介 <深入浅出统计学>第七章详细介绍了三种概率分布及其应用,而我们则将进行程序编写,来计算这三种概率分布. 几何分布 scipy几何分布原文地址 下面是书中一些重要公式的代码实现,此处我 ...
- 整理总结:深入浅出统计学——正态分布的运用
参考资料:电子工业出版社的<深入浅出统计学> 前言 并非所有数据集合都是离散的.可以指定确切数值的概率分布,其中也有数值型的概率分布,最典型的便是正态分布. 本篇目录 参考资料:电子工业出 ...
- 深入浅出统计学(十二)置信区间
问题 总结 置信区间简便算法 章节理解 和点估计量相比,置信区间是另一种更'稳妥'的估计方法
最新文章
- careercup-高等难度 18.9
- 这段AI的深情告白在外网爆火:我并非真实,从未出生,永不死亡,你能爱我吗?...
- centos7查看内核以及删除旧内核
- jquery 使用方法
- Windows下创建软硬链接
- Bootstrap 按钮的尺寸
- Android 最火高速开发框架AndroidAnnotations使用具体解释
- 当WEB2.0从概念变成电子商务网站的工具
- 用python画简单的图案-使用 Python Turtle 设计简单而又美丽的图形
- ACCP学习旅程之----- 使用Dreamweaver制作网页
- 计算机网络复习-物理层
- ubuntu 系统获取和阅读 linux 源码
- python函数手册 stata_Eviews、Stata、Python描述性分析教程汇总
- PCB各种表面工艺差异说明
- 资料,丰富资料,丰富资料(模式识别......)
- python是真刑啊!爬虫这样用,离好日子越铐越近了~
- CSS - 响应式布局(二)响应式栅格系统
- 大数据开发,就要掌握哪些技术?
- 使用ArcPy实现创建ags文件
- 060201面积-定积分在几何学上的应用-定积分的应用
热门文章
- 在某高层建筑物中只有一部电梯,由N个正整数组成一个请求序列,列表中的数字表示电梯将在哪层停,电梯按列表顺序依次停靠电梯每上行一层需要花6秒时间,每下行一层需要花4秒时间,电梯每停一次需要用时5秒。
- [附源码]计算机毕业设计JAVA文章管理系统查重PPT
- android 图像处理sdk,用于AndroidSDK的快速位图模糊
- JS运算保留一位小数
- 爱普森发布3D头戴式显示器Moverio
- Ubuntu NVIDIA Intel双显卡,安装NVIDIA驱动
- Corel VideoStudio Ultimate 会声会影2022
- STORLEAD X5A 2.5” SATA 固态硬盘
- adrv9003/ADRV9001/ADRV9002 FPGA驱动开发(硬件开发)
- encode和tokenize的区别