本文介绍关于总体、样本、样本抽样分布的理解,及2个重要的统计学原理:中心极限定理和大数定理。

总体:就是一个概率分布。
样本:从总体中随机抽取的一个子集。其中,样本具有和总体相同的分布,样本之间两两独立。
抽样分布:对原来的分布总体,以一定样本容量抽取样本值,多次抽取后,样本的统计量(比如均值或方差)形成的分布。
其中,
样本容量(大小)/样本量:每个样本里有多少个数据,每一次试验的样本值个数,通常说n个(x1,x2,...,xn)x_1,x_2,...,x_n)x1​,x2​,...,xn​)。
样本数量(空间):抽样的时候,包含多少个样本,或者说抽多少次。
抽样分布可以分为两类:
一类:关于均值的分布:正态分布和t-分布;
一类:关于方差的分布:卡方分布和F-分布。

今天先说样本均值的抽样分布,此处涉及中心极限定理
通俗的说,给定一个任意分布的总体,每次从这些总体中随机抽取 n 个样本值(样本容量),一共抽 m 次(样本数量),然后把这 m 组样本分别求出平均值, 这些平均值(样本均值)的分布接近正态分布。
其中,
1、总体本身的分布不要求正态分布;
2、样本容量n越大,样本均值的分布约趋近于正态分布,标准差越小,即分布越集中。

所以,样本均值的抽样分布是服从正态分布,即x‾\overline{x}x~N(μ,σ2/n\mu,σ^2/nμ,σ2/n)

(参考:网易公开课-可汗学院-统计学
网站:http://onlinestatbook.com/stat_sim/sampling_dist/index.html)

通过模拟试验,可以看到有关于样本均值抽样分布的图形化过程,当n取不同值时,抽样分布的形状。
下图是从视频中截取的示例图,最上面深灰色的是总体分布,中间的是n=5的样本均值抽样分布,最下面是n=25的样本均值抽样分布。
可以发现抽样发生10000次时,不同样本容量的均值相差不大分别为14.48和14.44,和总体均值近似。但是标准差相差较多,n=5时,sd=4.34;n=25时,st=1.91,即样本容量更大时,分布更集中了。另外n=25时的偏度和峰度都比n=5时更小。

接下来,再看看上述3类分布的均值、方差、标准差常用的基本符号和计算:
p.s.第一次编辑数学公式,方法参考:https://www.zybuluo.com/codeep/note/163962

均值 方差 标准差
总体(容量N) μ\muμ σ2σ^2σ2 σ\sigmaσ
样本(容量n) x‾\overline{x}x S2S^2S2 SSS
样本均值的抽样分布(容量n) μx‾\mu_{\overline{x}}μx​ σx‾2\sigma_{\overline{x}}^{2}σx2​ σx‾\sigma_{\overline{x}}σx​

其中,

  • 均值

    • 总体均值:μ=∑i=1NxiN\mu=\frac { \sum_{i=1}^N{x_i} } {N}μ=N∑i=1N​xi​​

    • 样本均值:x‾=x‾n=∑i=1nxin\overline{x}=\overline{x}_n=\frac { \sum_{i=1}^n{x_i }} {n}x=xn​=n∑i=1n​xi​​

    • 大数定理:当n—>∞时,x‾n\overline{x}_nxn​—>E(X)=μ。即当样本量n足够大的时候,样本均值收敛于总体均值或随机变量期望值,揭示了频率和概率的关系。

    • 样本均值抽样分布的均值:μx‾\mu_{\overline{x}}μx​是总体均值μ的估计,即可以认为:μx‾=μ\mu_{\overline{x}}=\muμx​=μ

  • 方差

    • 总体方差:σ2=∑i=1N(xi−μ)2Nσ^2=\frac { \sum_{i=1}^N(x_i - \mu)^2 } {N}σ2=N∑i=1N​(xi​−μ)2​

    • 样本方差:Sn2=∑i=1n(xi−x‾)2nS_{n}^2=\frac { \sum_{i=1}^n(x_i - {\overline{x}})^2 } {n}Sn2​=n∑i=1n​(xi​−x)2​
      因为n<N,抽到的样本会比总体相对更集中,波动更小一些,即样本方差S2S^2S2通常会比总体方差σ2σ^2σ2小,所以需要对样本方差进行了修正。

    • 修正后的样本方差(无偏方差):Sn−12=∑i=1n(xi−x‾)2n−1S_{n-1}^2=\frac { \sum_{i=1}^n(x_i - {\overline{x}})^2 } {{n-1} }Sn−12​=n−1∑i=1n​(xi​−x)2​

    • 如果知道总体均值μμμ,那么就不用(n-1)进行无偏估计,可以直接写成:Sn2=∑i=1n(xi−μ)2nS_{n}^2=\frac { \sum_{i=1}^n(x_i - \mu)^2 } {n}Sn2​=n∑i=1n​(xi​−μ)2​

    • 样本均值抽样分布的方差(均值方差)
      这里区分总体方差已知和总体方差未知2种情况:
      总体方差σ2σ^2σ2已知:σx‾2=σ2n\sigma_{\overline{x}}^{2}=\frac {σ^2 } {n}σx2​=nσ2​
      总体方差σ2σ^2σ2未知,则用样本方差S2S^2S2来估计:
      σx‾2=σ2n≈S2n\sigma_{\overline{x}}^{2}=\frac {σ^2 } {n}≈\frac {S^2 } {n}σx2​=nσ2​≈nS2​

当样本容量n>30时,可以认为,样本方差SSS可以比较好的估计总体方差σ\sigmaσ,根据中心极限定理,认为样本均值的抽样分布符合正态分布;
n<30时,样本方差SSS和总体方差σ\sigmaσ相差比较大,认为符合t分布。

总体、样本、样本的抽样分布相关推荐

  1. 【读书笔记->统计学】11-02 总体和样本的估计-总体比例、样本比例、根据总体预测样本比例概念简介

    总体比例与样本比例 假设一个情境:曼帝糖果公司再一次进行了抽样,以便利用调查结果预测:总体中有多大比例的人"可能偏爱曼帝公司的糖球". 结果发现,在40个人中有32个人偏爱他们的口 ...

  2. 深入浅出统计学(十一)总体和样本的估计

    基本概念 . 问题 章节理解 上一章主要讲解如何用样本估计总体参数 这一章主要是讲解如何用总体估计样本的概率分布

  3. 【定量分析、量化金融与统计学】统计推断基础(1)---总体、样本、标准差、标准误

    目录 一.前言 二.总体与样本 1.总体(population)的概念 2.总体的性质与参数 首先是:平均数(mean)µ 标准差(standard deviation,SD)σ希腊字母sigma 3 ...

  4. 数理统计笔记3:样本方差的抽样分布,两个样本方差比的抽样分布,t统计量的分布

    引言 数理统计笔记的第3篇总结了数理统计中样本方差的分布(卡方分布),两个样本方差比的抽样分布(F分布)以及t统计量的分布. 样本方差的抽样分布 两个样本方差比的抽样分布 附:T统计量的分布

  5. 抽样和抽样分布-样本比率的抽样分布

    样本比率 p¯ \bar{p} 是总体比率 p p 的点估计. p¯\bar{p} 的抽样分布是样本比率 p¯ \bar{p} 的所有可能值的概率分布. 下面我们了解下 p¯ \bar{p} 的期望. ...

  6. 【读书笔记->统计学】11-03 总体和样本的估计-样本均值的概率、中心极限定理概念简介

    样本均值的概率 假设一个情境:曼帝糖果公司也生产小袋装糖球,每一个小包装袋里的糖球数目均值为10,方差为1.然而,有一个顾客买了30袋糖球,结果发现每袋糖球中的糖球平均数目只有8.5.求这种事情发生概 ...

  7. 数理统计-5.1 总体与样本

    **总体:**在一个统计问题中,我们把研究对象的全体成为全体 **个体:**构成总体的每个成员 用概率分布可描述与归纳总体,总体可看作是一个分布 从总体中抽样等价于从分布中抽样 总体分为有限总体与无限 ...

  8. 【统计学】从样本到总体

    总体和样本均值的符号: n = 样本容量 u = 总体均值 x = 样本均值 σ = 总体标准差 s = 样本标准差 样本均值分布的特征: 对于任何样本均值的分布: 样本容量越大,样本均值的分布越接近 ...

  9. 统计学基础(一)—样本与总体

    样本与总体 1 什么是样本? 样本是用来估计总体的 样本应与总体的情况相似(比如,利用埃菲尔铁塔的模型去研究真正的埃菲尔铁塔的结构.那么这个样本应该在结构上,比例上与原来的母体相似(总体 popula ...

  10. 概率论与数理统计--样本及抽样分布

    文章目录 总体和样本 统计量 三大分布 四大定理 总体和样本 统计量 三大分布 四大定理

最新文章

  1. GTONE清理维护建议方案
  2. 与《管理幸福》一书作者Jurgen Appelo的访谈
  3. python——画一个笑脸
  4. IOS上传图片旋转90度问题出现原因及解决方案
  5. 最近,又一家互联网公司裁员了,失业来得太突然…
  6. Excel异常Cannot get a text value from a numeric cell
  7. Python中的高阶函数filter
  8. 文献记录(part21)--Gestalt laws based tracklets analysis for human crowd understanding
  9. Unity 游戏开发技巧集锦之使用忍者飞镖创建粒子效果
  10. 解析 Linux 中的 VFS 文件系统机制
  11. java 数组map_Java之数组array和集合list、set、map
  12. .Net语言 APP开发平台——Smobiler学习日志:如何设置页面的title
  13. 如何让你产品的用户拥有一流的上传体验
  14. R语言—如何下载和使用包
  15. vue播放flv格式视频
  16. Flutter开发之——动画-Lottie
  17. 顶级域名 一级域名 二级域名 三级域名什么区别?
  18. DNT精英论坛(暨.NET北京俱乐部)第3期沙龙:区块链跨链技术的设计与实践
  19. java中explain什么意思_Java架构-面试前必须知道的MySQL命令【explain】
  20. 大厂经典数据库(MongoDB)面试题整理汇总

热门文章

  1. 百度网盘不能下载文件,如何用迅雷下载(链接为网盘链接)
  2. 手机用计算机解锁,如何用电脑解锁手机屏幕
  3. 削峰填谷 matlab,风电与电动汽车协同并网调度环境模型
  4. office起动缓慢_如何解决Microsoft Outlook启动缓慢的问题
  5. 鸿蒙5G的营业执照,华为鸿蒙系统疑似被曝光 工信部向三大运营商颁发5G牌照​...
  6. Elasticsearch文档内部的父子关系
  7. SPSS 进行两因素重复测量方差分析(Two-way repeated-measures ANOVA)详细操作步骤 (上)
  8. dtm源码编译安装-运行客户端demo
  9. NodeJS+七牛云实现图片上传
  10. 俄亥俄州立大学计算机科学转学成功,录取捷报|努力定有回报,斩获俄亥俄州立计算机转学录取...