抽样分布:

现在,假设将抽取n个样本组成一个简单随机样本的过程重复进行下去,每次都计算 x¯ \bar{x} 和 p¯ \bar{p} 的值。
在不同的简单随机样本中,这些样本统计量的值有各种可能的结果,它们是随机变量。是随机变量就能得到其概率分布,我们称这些随机变量的概率分布为它们的抽样分布

这一节,我们先来看看样本均值 x¯ \bar{x} 的抽样分布。
和其他概率分布一样, x¯ \bar{x} 的抽样分布也有期望、标准差以及形态特征。

x¯ \bar{x} 的数学期望:

E(x¯)=μ E(\bar{x})=\mu , E(x¯) E(\bar{x}) 为 x¯ \bar{x} 的期望, μ \mu 为总体均值。

x¯ \bar{x} 的标准差:

x¯ \bar{x} 的标准差公式与总体是否有限有关。
有限总体下:
σx¯=N−nN−1‾‾‾‾√⋅(σn√) \sigma _{\bar{x}}=\sqrt{\frac{N-n}{N-1}}\cdot\left ( \frac{\sigma }{\sqrt{n}} \right )
无限总体下:
σx¯=σn√ \sigma _{\bar{x}}= \frac{\sigma }{\sqrt{n}}
式中的 N−nN−1‾‾‾‾√ \sqrt{\frac{N-n}{N-1}} 称为有限总体修正系数。在很多实际抽样中,总体的容量很大,样本容量相对很小,修正系数 N−nN−1‾‾‾‾√ \sqrt{\frac{N-n}{N-1}} 趋近于1,有限总体和无限总体 x¯ \bar{x} 的标准差计算之间的差别可以忽略,我们可以用通式 σx¯=σn√ \sigma _{\bar{x}}= \frac{\sigma }{\sqrt{n}} 计算样本均值的标准差。那具体是总体容量大到什么程度,样本容量小到什么程度,两条公式间的差别才可以忽略呢?我们约定,当 nN⩽0.05 \frac{n}{N}\leqslant 0.05,即样本容量不超过总体容量的5%时,两者间误差可忽略。
另外,为强调 σx¯ \sigma _{\bar{x}} 和总体标准差 σ \sigma 的不同( σx¯ \sigma _{\bar{x}} 是总体的简单随机样本的均值的抽样分布的标准差),我们称 σx¯ \sigma _{\bar{x}} 为均值 x¯ \bar{x} 的标准误差

x¯ \bar{x} 的抽样分布的形态

考虑以下两种情形:总体服从正态分布、总体不服从正态分布。
总体服从正态分布时,任何样本容量下 x¯ \bar{x} 的抽样分布都是正态分布;
总体不服从正态分布时,我们引入中心极限定理:

从总体中抽取容量为n的简单随机样本,当样本容量很大时,样本均值 x¯ \bar{x} 的抽样分布近似服从抽样分布。

下图给出了样本容量分别为 n=2 n= 2、 n=5 n= 5 和 n=30 n= 30时抽样分布的形状:

可以看到,随着样本容量的增加,抽样分布的形态逐渐趋近于正态分布。
在一般统计实践中,对大多数应用,假定样本容量超过或等于30时, x¯ \bar{x} 的抽样分布可用正态分布近似;当总体严重偏态或出现异常点时,可能需要样本容量达到50;当总体为离散型时,正态近似中所需样本容量一般依赖于总体的比率。

抽样和抽样分布-样本均值的抽样分布相关推荐

  1. 样本均值的抽样分布/置信区间

    样本均值的抽样分布: 最高的是正峰态分布,中间的是正态分布,最低的是负峰态分布 正偏态分布,右尾长,负偏态分布,左尾长 样本容量越大,样本均值越趋近于总体均值 随着样本容量n趋近于无穷,样本均值的抽样 ...

  2. 样本均值的抽样分布的均值问题

    声明: 仅仅个人小记 为什么用样本均值来作为总体均值的估计? 这样真的好吗?如果好,到底好到什么程度. 目的 本文用来解释下面这句话(本人对下面这句话的逻辑一开始是不接受的,故而写文记录,以分享个人的 ...

  3. 数据分析师必掌握的统计学知识!

    众所周知,统计学是数据分析的基石.学了统计学,你会发现很多时候的分析并不那么准确,比如很多人都喜欢用平均数去分析一个事物的结果,但是这往往是粗糙的.而统计学可以帮助我们以更科学的角度看待数据,逐步接近 ...

  4. [统计学笔记](五)统计量及其抽样分布

    统计量 统计学中最主要的提取信息的方式就是对原始数据进行一定的运算,得出某些代表性的数字,以反映数据某些方面的特征,这种数字称为统计量.用统计学的语言表述就是:统计量是样本的函数,它不依赖于任何未知参 ...

  5. 常用的统计量及其对应的抽样分布(python)

    1.样本均值 设 x1,x2,⋯,xn为取自某总体的样本, 其算术平均值称为样本均值,一 般用表示,即 如果把样本中的数据与样本均值的差称为偏差, 则样本所有偏差之和为 0, 即 # 从总体/总体的分 ...

  6. 数据挖掘--统计学模块 05 抽样分布

    文章目录 抽样分布 楔子 大数法则 中心极限定理 自助法 抽样分布: Z分布和T分布: 卡方分布和F分布 卡方分布 F分布 从抽样分布到置信区间 抽样分布 统计量:样本均值.样本方差.样本变异系数.样 ...

  7. 【统计学】各统计量及其抽样分布(z分布,t分布,卡方分布)

    1. 前言 数据分析行业不可避免会与统计学打交道.常见的分析总体的过程如图所示: 常见的假设检验中,AB测试是最为出名的假设检验的过程,而需要深刻理解假设检验,先验知识统计量及其抽样分布的理解至关重要 ...

  8. NO5 -- 抽样分布

    抽样分布 抽样指按一定方式从总体中选择或抽出样本的过程. 1.抽样作为人们从部分认识整体这一过程的关键环节,是实现"由部分认识总体"这一目标的途径和手段: 2.抽样主要解决的是对象 ...

  9. 统计学基础之常用统计量和抽样分布

    目录: 一.统计量 1.概念 2.常用统计量 二.抽样分布 1.常见三大抽样分布 一.统计量: 1.概念: 统计量是统计理论中用来对数据进行分析.检验的变量.在实际应用中,当我们从某个总体中抽取一个样 ...

最新文章

  1. android canvas 保存图片,ionic3 html5 video 抓图保存到手机相册,解决Android手机不支持Canvas drawImage问题...
  2. KubeEdge vs K3S:Kubernetes在边缘计算场景的探索
  3. 十四个方法提高博客的页面访问量
  4. python在线搭建教程_理解python web开发,轻松搭建web app!
  5. Python批量提取PowerPoint文件中所有幻灯片标题和备注文本
  6. python 遍历矩阵_Python3算法之十:矩阵旋转
  7. 蓝桥杯 基础练习 完美的代价
  8. 24.Creating Customer Groups
  9. Linux系统centos6.7上安装libevent
  10. 如何恢复SVN被删除文件、文件夹
  11. 《光剑文集》自渡:125首
  12. 21.运行Consent Page
  13. Ternary Tree
  14. 三只松鼠商品评论分析
  15. 《羊了个羊》还在火!创始人被制成展牌,竟成母校招生“活广告”?
  16. React Native开发环境配置检测
  17. VS2017使用gtest
  18. 隐藏label标签中指定文字
  19. java main 运行_使用maven运行Java Main的三种方法解析
  20. 面向对象的三大基本特征

热门文章

  1. 足球大师服务器维护,《足球大师2018》新服活动介绍
  2. 支付宝 激活开发者模式
  3. 巨坑警告!去银行写代码千万别去分行
  4. 工业感应电机市场现状及未来发展趋势
  5. CSS3 制作动态相册
  6. 弘辽科技:淘宝直通车如何开精准词?有什么途径?
  7. 橄榄油 - 可以吃的天然化妆品
  8. 【重磅】一图看懂阿里云两个新大脑:ET 医疗大脑和 ET 工业大脑
  9. linux命令行下的BT软件(转)
  10. c语言中funx的作用,C语言中,fun函数到底是干什么用的?