1 统计量

统计量:由样本构造一个函数,不依赖任何参数
常用统计量:样本均值(X ¯  \bar{X})、样本方差(S 2  S^2)、样本变异系数(V=SX ¯   V=\dfrac{S}{\bar{X}})、样本k阶距、样本k阶中心距、样本偏度、样本峰度
次序统计量:样本极差(最大值减最小值)
充分统计量:统计量加工过程中一点信息都不损失的统计量。判别定理:因子分解定理

2 由正态分布导出的几个重要分布

1 χ 2  \chi^2分布

设随机变量X 1 ,X 2 ,...,X n  X_1,X_2,...,X_n相互独立,且X i (i−1,2,...,n) X_i(i-1,2,...,n)服从标准正态分布N(0,1) N(0,1),则它们的平方和∑ n i=1 X 2 i  \sum_{i=1}^{n}{X_i^2}服从自由度为n n的χ 2  \chi^2分布。
E(χ 2 )=n;D(χ 2 )=2n E(\chi^2)=n;D(\chi^2)=2n
χ 2  \chi^2分布具有可加性,即若χ 2 1 ∼χ 2 (n 1 ),χ 2 2 ∼χ 2 (n 2 ) \chi_1^2\sim\chi^2(n_1),\chi_2^2\sim\chi^2(n_2),且独立,则
χ 1 1 +χ 2 2 ∼χ 2 (n 1 )+χ 2 (n 2 ) \chi_1^1+\chi_2^2\sim\chi^2(n_1)+\chi^2(n_2)
χ 2  \chi^2的密度函数如下图所示:

2 t t分布

设随机变量X∼N(0,1),Y∼χ 2 (n) X\sim{N(0,1)},Y\sim\chi^2(n),且X X与Y Y独立,则
t=XY/n − − − −  √   t=\dfrac{X}{\sqrt{Y/n}}
称为t t分布,记为t(n) t(n),其中n n为自由度。
当n≥2 n\geq2时,t t分布的数学期望E(t)=0 E(t)=0
当n≥3 n\geq3时,t t分布的方差D(t)=nn−2  D(t)=\dfrac{n}{n-2}
t t的密度函数如下图所示:

3 F F分布

设随机变量Y Y与Z Z相互独立,且Y Y和Z Z分别服从自由度为m m和n n的χ 2  \chi^2分布,随机变量X X有如下表达式:
X=Y/mZ/n =nYmZ  X=\dfrac{Y/m}{Z/n}=\dfrac{nY}{mZ}
则称X X服从第一自由度为m m,第二自由度为n n的F F分布 ,记为F(m,n) F(m,n)
E(X)=nn=2 ,n>2 E(X)=\dfrac{n}{n=2},n>2
D(X)=2n 2 (m+n−2)m(n−2(n−4)) ,n>4 D(X)=\dfrac{2n^2(m+n-2)}{m(n-2(n-4))},n>4
F F的密度函数如下图所示:

如果随机变量X X服从t(n) t(n),则X 2  X^2服从F(1,n)的F F分布。这在回归分析的回归系数检验中有用。

3 样本均值的分布于中心极限定理

当总体分布为正态分布N(μ,σ 2 ) N(\mu, \sigma^2)时,则X ¯  \bar{X}的抽样分布仍为正态分布,期望为μ \mu,方差为σ 2 /n \sigma^2/n。这说明用样本均值X ¯  \bar{X}去估计总体均值μ \mu时,平均来说没有偏差(无偏性);当n n越来越大时,X ¯  \bar{X}的散布程度越来越小,即用X ¯  \bar{X}估计mu mu越来越准确。
实际情况中,总体的分布不总是正态分布或近似正态分布,此时X ¯  \bar{X}的分布也将取决于总体分布情况。——中心极限定理
中心极限定理:设从均值为μ \mu、方差为σ 2  \sigma^2(有限)的任意一个总体总抽取样本量为n n的样本,当n n充分大时,样本均值X ¯  \bar{X}的抽样分布近似服从为均值为μ \mu、方差为σ 2 /n \sigma^2/n的正态分布。
注意:什么是当n充分大呢?大样本、小样本之间的区分并不是以样本容量大小来区分的。在样本容量固定的条件下所进行的统计推断、问题分析,不管样本容量有多大,都称为小样本问题,而在样本容量n—>∞的条件下所进行的统计推断、问题分析则称为大样本问题。一般统计学中的n≥30为大样本,n<30为小样本只是一直经验说法。

4 样本比例的抽样分布

如果在样本大小为n的样本中具有某一特征的个体数为X X,则样本比例用p p表示:p=X/n p=X/n
则可以用样本比例p p来估计总体比例π \pi。
当n n充分大时,p ^  \hat{p}的分布可用正态分布去逼近,此时,p ^  \hat{p}服从均值为π \pi、方差为π(1−π)n  \dfrac{\pi(1-\pi)}{n}的正态分布,则
p ^ ∼N(π,π(1−π)n ) \hat{p}\sim{N(\pi,\dfrac{\pi(1-\pi)}{n})}

5 两个样本平均值之差的分布

设X 1  ¯  \bar{X_1}是独立地抽自总体X 1 ∼N(μ 1 ,σ 2 1 ) X_1\sim{N(\mu_1,\sigma_1^2)}的一个容量为n 1  n_1的样本的均值,X 2  ¯  \bar{X_2}是独立地抽自总体X 1 ∼N(μ 2 ,σ 2 2 ) X_1\sim{N(\mu_2,\sigma_2^2)}的一个容量为n 2  n_2的样本的均值,则有
E(X 1 −X 2 )=μ 1 −μ 2  E(X_1-X_2)=\mu_1-\mu_2
D(X 1 −X 2 )=σ 2 1 n 1  +σ 2 2 n 2   D(X_1-X_2)=\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}
如果两个总体均为正态分布,则X 1 −X 2  X_1-X_2也为正态分布;当n 1  n_1和n 2  n_2比较大时,一般要求n1≥30,n2≥30 n1\geq30,n2\geq30,则X 1 −X 2  X_1-X_2的抽样分布不管总体分布如何均可用正态分布来近似。

6 关于样本方差的分布

1样本方差的分布

设X 1 ,X 2 ,...,X n  X_1,X_2,...,X_n为来自正态分布的样本,则可以推出:
设总体分布为N(μ,σ 2 ) N(\mu,\sigma^2)的正态分布,则样本方差S 2  S^2的分布为:
(n−1)S 2 /σ 2 ∼χ 2 (n−1) (n-1)S^2/{\sigma^2}\sim{\chi^2(n-1)}

2 两个样本方差比的分布

设X 1 ,X 2 ,...,X n 1   X_1,X_2,...,X_{n_1}为来自正态总体N(μ 1 ,σ 2 1 ) N(\mu_1,\sigma_1^2)的一个样本,Y 1 ,Y 2 ,...,Y n 1   Y_1,Y_2,...,Y_{n_1}为来自正态总体N(μ 2 ,σ 2 2 ) N(\mu_2,\sigma_2^2)的一个样本,且X i  X_i与Y i  Y_i相互独立,则
S 2 x /S 2 y σ 2 1 /σ 2 2  =S 2 x /σ 2 1 S 2 y /σ 2 2  ∼F(n 1 −1,n 2 −1) \dfrac{S_x^2/S_y^2}{\sigma_1^2/\sigma_2^2}=\dfrac{S_x^2/\sigma_1^2}{S_y^2/\sigma_2^2}\sim{F(n_1-1,n_2-1)}

第六章 统计量及其抽样分布相关推荐

  1. 《统计学》第八版贾俊平第六章统计量及抽样分布知识点总结及课后习题答案

    一.知识框架 二.练习题 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差σ=1.0盎司的正态分布.随机抽取这台机器灌装的9个瓶子组成一个样本,并测定每 ...

  2. 第六章 样本与抽样分布

    引言 题型总结中推荐例题有蓝皮书的题型较为重要,只有吉米多维奇的题型次之. 思维导图中,标红的是重点内容,标黄的是次重点. 码字不易,如果这篇文章对您有帮助的话,希望您能点赞.收藏.加关注!您的鼓励就 ...

  3. Excel在统计分析中的应用—第六章—抽样与抽样分布-Part2(等距抽样)

    "先将总体的全部单元按照一定顺序排列,采用简单随机抽样抽取第一个样本单元(或称为随机起点),再顺序抽取其余的样本单元,这类抽样方法被称为等距抽样(Systematic Sampling).等 ...

  4. 李永乐复习全书概率论与数理统计 第五、六章 大数定律和中心极限定理及数理统计的基本概念

    目录 第五章  大数定律和中心极限定理 第六章  数理统计的基本概念 6.1  总体.样本.统计量和样本数字特征 例4  设总体X∼P(λ)X\sim P(\lambda)X∼P(λ),则来自总体XX ...

  5. 概率论与数理统计系列笔记之第五章——统计量及其分布

    概率论与数理统计笔记(第五章--统计量及其分布) 对于统计专业来说,书本知识总有遗忘,翻看教材又太麻烦,于是打算记下笔记与自己的一些思考,主要参考用书是茆诗松老师编写的<概率论与数理统计教程&g ...

  6. 统计学:第六章-总体均数得估计

    统计学:第六章-总体均数得估计 雪柯 大工生物信息 提笔为写给奋进之人 已关注 致知计划 · 科学季收录 点击报名 29 人赞同了该文章 该书作者:李晓松 本文引自医学统计学教材,作为统计学入门经典教 ...

  7. 概率论||期末考试复习手写笔记-第五六七章(知识点+例题)第五章 常用统计分布 第六章 参数估计 第七章 假设检验

    第五章  常用统计分布 考点一:常用统计量 考点二:三大统计分布 考点三:抽样分布(单正态总体+双正态总体) 第六章 参数估计 考点一: 估计量的评价标准(无偏性+有效性+相合性) 考点二:点估计的常 ...

  8. ggplot2读书笔记9:第六章 标度(二)

    今天来学习第六章标度部分的最后一节~ 6.6 标度工具箱(Scales Toolbox) 除了调整标度的默认选项之外,你也可以重新创建新的标度,主要分为以下四类: 连续型位置标度:用于将整数.数值.日 ...

  9. [统计学教程] 第六章 抽样推断

    导读: 第六章 抽样推断 一.参数与统计量 参数是指描述总体分布状况的数: 统计量是指由样本构造出来的数. 例如,一个班的学生的平均年龄为22岁,平均年龄即为班组总体的一个参数:在班级中抽出10名学生 ...

最新文章

  1. 基于PyTorch的Seq2Seq翻译模型详细注释介绍(一)
  2. Github 高赞的 YOLOv5 引发争议?Roboflow 和开发者这样说...
  3. 【鉴轻尘】你说你炒的了币,开发得了项目,然而这些你都知道吗?
  4. 使用supervisor支持Python3程序 (解决找不到Module的问题)
  5. 加入收藏 lsk的BLOG
  6. 9、 InnoDB行锁
  7. linux与windows互传文件、用户与用户组管理、密码配置文件
  8. AJAX DELETE
  9. 为什么要使用Node.js进行数据科学
  10. mediasoup 安裝
  11. 《现代操作系统第四版》第一章课后答案
  12. 几个免费的中文分词模块
  13. apple id两步验证服务器,【安全可靠】Apple ID 两步验证支持中国地区 - 爱应用
  14. 洛谷P3356 火星探险问题(费用流)
  15. 核心网技术之SDN学习总结
  16. IDEA 2020.1.2 无法显示图片的魔幻解决方法
  17. 发现一个免费虚拟主机和云服务器的网站
  18. Ubuntu磁盘分区和内存查看
  19. storm笔记:storm集群
  20. 怎么渗透验证 mysql_mysql-渗透测试

热门文章

  1. express 框架之 路由与中间件
  2. iOS学习笔记之typedef
  3. Extjs FormPanel/TabPanel/GridPanel混合
  4. kde菜单图标显示不全_大小仅 1M!在电脑菜单栏上自定义日历,规划时间更方便...
  5. 如何计算k段流水线执行n条指令的执行时间
  6. 大一c语言操作题期末考答案,大一期末考试c语言操作题答案
  7. c语言无符号数除法,[求助]关于双字节无符号数除法
  8. pdo sqlite_ sqlite2 pdo_mysql_php使用pdo连接sqlite3的配置示例
  9. 01.Python基础_菜单_快捷键_基本语法_变量_输入输出
  10. 9.Excel数据透视表