抽样和抽样分布-样本均值的抽样分布
抽样分布:
现在,假设将抽取n个样本组成一个简单随机样本的过程重复进行下去,每次都计算 x¯ \bar{x} 和 p¯ \bar{p} 的值。
在不同的简单随机样本中,这些样本统计量的值有各种可能的结果,它们是随机变量。是随机变量就能得到其概率分布,我们称这些随机变量的概率分布为它们的抽样分布。
这一节,我们先来看看样本均值 x¯ \bar{x} 的抽样分布。
和其他概率分布一样, x¯ \bar{x} 的抽样分布也有期望、标准差以及形态特征。
x¯ \bar{x} 的数学期望:
E(x¯)=μ E(\bar{x})=\mu , E(x¯) E(\bar{x}) 为 x¯ \bar{x} 的期望, μ \mu 为总体均值。
x¯ \bar{x} 的标准差:
x¯ \bar{x} 的标准差公式与总体是否有限有关。
有限总体下:
σx¯=N−nN−1‾‾‾‾√⋅(σn√) \sigma _{\bar{x}}=\sqrt{\frac{N-n}{N-1}}\cdot\left ( \frac{\sigma }{\sqrt{n}} \right )
无限总体下:
σx¯=σn√ \sigma _{\bar{x}}= \frac{\sigma }{\sqrt{n}}
式中的 N−nN−1‾‾‾‾√ \sqrt{\frac{N-n}{N-1}} 称为有限总体修正系数。在很多实际抽样中,总体的容量很大,样本容量相对很小,修正系数 N−nN−1‾‾‾‾√ \sqrt{\frac{N-n}{N-1}} 趋近于1,有限总体和无限总体 x¯ \bar{x} 的标准差计算之间的差别可以忽略,我们可以用通式 σx¯=σn√ \sigma _{\bar{x}}= \frac{\sigma }{\sqrt{n}} 计算样本均值的标准差。那具体是总体容量大到什么程度,样本容量小到什么程度,两条公式间的差别才可以忽略呢?我们约定,当 nN⩽0.05 \frac{n}{N}\leqslant 0.05,即样本容量不超过总体容量的5%时,两者间误差可忽略。
另外,为强调 σx¯ \sigma _{\bar{x}} 和总体标准差 σ \sigma 的不同( σx¯ \sigma _{\bar{x}} 是总体的简单随机样本的均值的抽样分布的标准差),我们称 σx¯ \sigma _{\bar{x}} 为均值 x¯ \bar{x} 的标准误差。
x¯ \bar{x} 的抽样分布的形态
考虑以下两种情形:总体服从正态分布、总体不服从正态分布。
总体服从正态分布时,任何样本容量下 x¯ \bar{x} 的抽样分布都是正态分布;
总体不服从正态分布时,我们引入中心极限定理:
从总体中抽取容量为n的简单随机样本,当样本容量很大时,样本均值 x¯ \bar{x} 的抽样分布近似服从抽样分布。
下图给出了样本容量分别为 n=2 n= 2、 n=5 n= 5 和 n=30 n= 30时抽样分布的形状:
可以看到,随着样本容量的增加,抽样分布的形态逐渐趋近于正态分布。
在一般统计实践中,对大多数应用,假定样本容量超过或等于30时, x¯ \bar{x} 的抽样分布可用正态分布近似;当总体严重偏态或出现异常点时,可能需要样本容量达到50;当总体为离散型时,正态近似中所需样本容量一般依赖于总体的比率。
抽样和抽样分布-样本均值的抽样分布相关推荐
- 样本均值的抽样分布/置信区间
样本均值的抽样分布: 最高的是正峰态分布,中间的是正态分布,最低的是负峰态分布 正偏态分布,右尾长,负偏态分布,左尾长 样本容量越大,样本均值越趋近于总体均值 随着样本容量n趋近于无穷,样本均值的抽样 ...
- 样本均值的抽样分布的均值问题
声明: 仅仅个人小记 为什么用样本均值来作为总体均值的估计? 这样真的好吗?如果好,到底好到什么程度. 目的 本文用来解释下面这句话(本人对下面这句话的逻辑一开始是不接受的,故而写文记录,以分享个人的 ...
- 数据分析师必掌握的统计学知识!
众所周知,统计学是数据分析的基石.学了统计学,你会发现很多时候的分析并不那么准确,比如很多人都喜欢用平均数去分析一个事物的结果,但是这往往是粗糙的.而统计学可以帮助我们以更科学的角度看待数据,逐步接近 ...
- [统计学笔记](五)统计量及其抽样分布
统计量 统计学中最主要的提取信息的方式就是对原始数据进行一定的运算,得出某些代表性的数字,以反映数据某些方面的特征,这种数字称为统计量.用统计学的语言表述就是:统计量是样本的函数,它不依赖于任何未知参 ...
- 常用的统计量及其对应的抽样分布(python)
1.样本均值 设 x1,x2,⋯,xn为取自某总体的样本, 其算术平均值称为样本均值,一 般用表示,即 如果把样本中的数据与样本均值的差称为偏差, 则样本所有偏差之和为 0, 即 # 从总体/总体的分 ...
- 数据挖掘--统计学模块 05 抽样分布
文章目录 抽样分布 楔子 大数法则 中心极限定理 自助法 抽样分布: Z分布和T分布: 卡方分布和F分布 卡方分布 F分布 从抽样分布到置信区间 抽样分布 统计量:样本均值.样本方差.样本变异系数.样 ...
- 【统计学】各统计量及其抽样分布(z分布,t分布,卡方分布)
1. 前言 数据分析行业不可避免会与统计学打交道.常见的分析总体的过程如图所示: 常见的假设检验中,AB测试是最为出名的假设检验的过程,而需要深刻理解假设检验,先验知识统计量及其抽样分布的理解至关重要 ...
- NO5 -- 抽样分布
抽样分布 抽样指按一定方式从总体中选择或抽出样本的过程. 1.抽样作为人们从部分认识整体这一过程的关键环节,是实现"由部分认识总体"这一目标的途径和手段: 2.抽样主要解决的是对象 ...
- 统计学基础之常用统计量和抽样分布
目录: 一.统计量 1.概念 2.常用统计量 二.抽样分布 1.常见三大抽样分布 一.统计量: 1.概念: 统计量是统计理论中用来对数据进行分析.检验的变量.在实际应用中,当我们从某个总体中抽取一个样 ...
最新文章
- android canvas 保存图片,ionic3 html5 video 抓图保存到手机相册,解决Android手机不支持Canvas drawImage问题...
- KubeEdge vs K3S:Kubernetes在边缘计算场景的探索
- 十四个方法提高博客的页面访问量
- python在线搭建教程_理解python web开发,轻松搭建web app!
- Python批量提取PowerPoint文件中所有幻灯片标题和备注文本
- python 遍历矩阵_Python3算法之十:矩阵旋转
- 蓝桥杯 基础练习 完美的代价
- 24.Creating Customer Groups
- Linux系统centos6.7上安装libevent
- 如何恢复SVN被删除文件、文件夹
- 《光剑文集》自渡:125首
- 21.运行Consent Page
- Ternary Tree
- 三只松鼠商品评论分析
- 《羊了个羊》还在火!创始人被制成展牌,竟成母校招生“活广告”?
- React Native开发环境配置检测
- VS2017使用gtest
- 隐藏label标签中指定文字
- java main 运行_使用maven运行Java Main的三种方法解析
- 面向对象的三大基本特征