【应用统计学】简单随机抽样的区间估计和样本容量的确定
一、置信度和置信区间
二、总体均值的置信区间
1.总体服从正态分布,且方差已知
若随机变量X服从正态分布,那么它抽样分布的样本均值也服正态分布。同时,我们可以先将它转化为标准正态分布
根据区间估计的定义,我们可以构造总体均值μ的置信区间。对于给定的显著性水平α,有
将式(5.13)代入上式得到:
对上式括号内做不等式的等价变换后得到:
于是置信度1- α置信区间μ的上下限是:
将放回抽样和不放回抽样的抽样平均误差的计算公式代入式(5.16),可得置信度为1- α的总体均值置信区间公式:
例5-3 某银行想对本月银行储户提取的现金平均数做估计,现采用随机不放回抽样方式在现有的2000名客户中抽取400名储户的提现记录,测得样本的平均提现额度为1000元。已知储户提现额度服从正态分布,且标准差为150元。试以95%的置信度估计本月该行客户的提现平均额的置信区间。
因此,在置信度95%下,该行储户的提现平均额度的置信区间为986.85元~1013.15元。
2.总体服从正态分布,但是方差未知
若随机变量X服从正态分布,但是方差未知,那么它抽样分布的样本均值也用类似于正态分布的T分布来进行近似计算。样本均值经过标准化以后,得到的随机变量服从自由度为n-1的t分布
同上,对于放回抽样和不放回抽样,置信度为1- α的总体均值的置信区间公式为:
例5-4
excel扩展
3.非正态总体
对于总体非正态分布的情况,如果样本容量足够大(n>30);那么对于方差已知,抽样分布的样本均值可用正态分布来进行近似计算。同理,对于方差未知,抽样分布的平均数可用类似于正态分布的T分布来进行近似计算。
三、总体成数的置信区间
同理,大样本情况下,总体成数的置信区间公式如下:
例5.5 某保险公司欲了解本地区汽车保险的出险情况。随机抽查了100辆机动车过去一年的保单,其中有25份保单有出险记录。试以95%的置信度估计该地区汽车保险出险率的置信区间。
四、两个总体均值之差的置信区间
当总体服从正态分布时,根据正态分布再生定理,样本平均数服从正态分布。当总体不服从正态分布时,根据中心极限定理,当n充分大时(通常要求n≥30),样本平均数近似服从正态分布。所以,我们可以推断出:
例5-6
例5-7
备注:5.30式需要大样本条件才成立,即一般要求样本数量n>=30.
五、两个总体成数之差的置信区间
例5-8
某饮料公司对其所做的报纸广告在两个城市的效果进行了比较,他们从两个城市中分别随机调查了1000个成年人,其中看过该广告的样本成数分别为0.18和0.14,试求两个城市成年人中看过该广告的成数之差的95%的置信区间。
六、 估计总体均值样本容量的确定
1、放回抽样
例5-9
某企业想估计本企业职工上个月上下班花在路途上的平均时间。经验表明,总体标准为4.3分钟。以置信度95%的置信区间进行估计,并使估计值处在真正平均值附近1分钟的误差范围之内。该企业应抽取多大的样本?
说明:当公式计算的结果带有小数时,样本容量应取比这个数大的最小整数。
2、不放回抽样
七、 估计总体成数样本容量的确定
1、放回抽样
例5-10
一家公司想估计某地区拥有彩色电视机的家庭所占的比例。该公司希望对的估计误差不超过0.05,要求置信度为95%,这时应取多大容量的样本?
解:根据相关知识,当P=0.5时,样本成数方差达到最大值。因此,在无法得到P值时,可以用P=0.5计算。这样得出的必要样本容量虽然可能比实际需要的容量大一些,但可以充分保证有足够高的置信水平和尽可能小的置信区间。
故为了以95%的置信度保证估计误差不超过0.05,应取385户进行调查。
2、不放回抽样
同理,可由不放回抽样总体成数的置信区间估计公式推得:
其中的样本成数P代替了未知的总体成数。
【应用统计学】简单随机抽样的区间估计和样本容量的确定相关推荐
- 【抽样技术】CH2 简单随机抽样
目录 前言 一.定义 二.概述 1.总体 2.单元 3.抽样比 4.样本抽取原则 5.在抽样理论中的地位与作用 三.参数估计 1.参数表示 2.对总体特征的估计思路 3.对总体均值的估计 (1)引理 ...
- excel随机抽取_简单随机抽样及其进阶分层随机抽样方法展示
一.分享简单随机抽样的几种方法 1.抽样分析工具抽样 2.INDIRECT+RANDBETWEEN函数抽样 3.RAND+排序抽样 4.SAS抽样 二.分层抽样方法 1.Python分层抽样 2.SA ...
- 抽样技术--简单随机抽样
文章目录 简单随机抽样 简单估计量及其性质 对总体均值的估计 简单随机抽样 简单例子 对总体总量的估计 例子 对总体比例的估计 例子 比率估计量及其性质 辅助变量 比率估计量 总体均值的期望咋算 总体 ...
- python不放回抽样_PYTHON :有(无)放回简单随机抽样
模拟概率论中的无放回简单随机抽样问题. 问题:从1,2,3,4,5中无放回的抽取三个数字,组成一个三位数,并输出. 顺序编程,易理解 import random ## 1.目标数字集合 number_ ...
- 【抽样技术】CH2 简单随机抽样补充——比率估计与回归估计
目录 一.概述 1.问题的提出 2.比率估计与回归估计的作用和使用条件 3.辅助变量的特点 4.相关符号 二.比率估计量编辑 编辑 1.问题的提出 2.定义 3.比估计与简单估计的比较 4.比率估 ...
- 《抽样技术》第2章 简单随机抽样(SRS)
1.简单随机抽样 ①简单: 因为估计量与总体参数"同形同构",因此估计量通常被视为是总体参数的简单估计. 直接单纯的从总体中抽取个体. 是其他抽样方式的基础. 容易操作. ②随机: ...
- matlab向量的简单随机抽样,matlab随机抽样
1.程序实现 设数据存放于向量a中,需要重复n次简单随机采样,程序及说明如下: m=length(a); %dimension idx= ceil(m*rand(1,n)) ; %generate n ...
- Python简单随机抽样之choice的replace参数解释
数据集有时候很大,通过程序对所有的数据都进行处理可能成本太高,于是我看到了choice函数,通过这个函数我们可以产生一些随机的序列,以便对数据集中的数据进行随机采样.之前没有细细考虑其中每一个参数的含 ...
- Struggle to 搞懂统计学——点估计 区间估计 置信区间
文章目录 点估计 区间估计 置信区间 理解 操作(重中之重) 总体方差已知 总体方差未知 假设检验 在统计学的应用过程中,总有那么几个重要的基础概念似懂非懂,就像雾里看花,你对它有一个总体的印象,但说 ...
- 数据分析概率及统计学基础
一.数据分析概述 1. 数据分析的概念 数据分析就是分析数据,从一大堆数据中提取你想要的信息.比较专业的回答:数据分析是有针对性的收集.加工.整理数据,并采用统计.挖掘技术分析和解释数据的科学与艺术. ...
最新文章
- 今天收到了学校给出的退学警告
- centos6.2安装桌面环境 与中文支持
- 【自动化__持续集成】___java___对象
- 【转】Power Platform(简介)
- java实现语音发送,Java实现发送手机短信语音验证功能代码实例
- 地铁建设 (Standard IO)
- 华为畅享20不能升级鸿蒙,华为mate20可以升级鸿蒙os吗-mate20能不能更新鸿蒙系统...
- VB判断文件及目录的存在性
- 数据分析数据可视化(三)
- Nginx笔记总结十一:Nginx重写规则指南
- 黑马程序员《JavaWeb程序设计案例教程》_课后习题答案
- 键盘计算机的区别吗,机械键盘如何选购? 它和普通键盘有什么区别?
- PN转CANopen调试案例
- 上海计算机一级同等水平,上海计算机等级考试哪一级最难(全国计算机一级考试难吗)...
- python 爬取天猫店铺商品评论
- 什么是域名邮箱?发出的邮件可以撤回吗?
- matlab从大到小排序的语句,从小到大排序的方法
- 传入的表格格式数据流(TDS)远程过程调用(RPC)协议流不正确。参数 1 (“@xx“): 对于类型特定的元数据,数据类型 0x62 (sql_variant)的类型无效。
- 上海建融家园获资本数百万元天使轮融资
- Python版名片管理系统源代码