第六章 统计量及其抽样分布
1 统计量
统计量:由样本构造一个函数,不依赖任何参数
常用统计量:样本均值(X ¯ \bar{X})、样本方差(S 2 S^2)、样本变异系数(V=SX ¯ V=\dfrac{S}{\bar{X}})、样本k阶距、样本k阶中心距、样本偏度、样本峰度
次序统计量:样本极差(最大值减最小值)
充分统计量:统计量加工过程中一点信息都不损失的统计量。判别定理:因子分解定理
2 由正态分布导出的几个重要分布
1 χ 2 \chi^2分布
设随机变量X 1 ,X 2 ,...,X n X_1,X_2,...,X_n相互独立,且X i (i−1,2,...,n) X_i(i-1,2,...,n)服从标准正态分布N(0,1) N(0,1),则它们的平方和∑ n i=1 X 2 i \sum_{i=1}^{n}{X_i^2}服从自由度为n n的χ 2 \chi^2分布。
E(χ 2 )=n;D(χ 2 )=2n E(\chi^2)=n;D(\chi^2)=2n
χ 2 \chi^2分布具有可加性,即若χ 2 1 ∼χ 2 (n 1 ),χ 2 2 ∼χ 2 (n 2 ) \chi_1^2\sim\chi^2(n_1),\chi_2^2\sim\chi^2(n_2),且独立,则
χ 1 1 +χ 2 2 ∼χ 2 (n 1 )+χ 2 (n 2 ) \chi_1^1+\chi_2^2\sim\chi^2(n_1)+\chi^2(n_2)
χ 2 \chi^2的密度函数如下图所示:
2 t t分布
设随机变量X∼N(0,1),Y∼χ 2 (n) X\sim{N(0,1)},Y\sim\chi^2(n),且X X与Y Y独立,则
t=XY/n − − − − √ t=\dfrac{X}{\sqrt{Y/n}}
称为t t分布,记为t(n) t(n),其中n n为自由度。
当n≥2 n\geq2时,t t分布的数学期望E(t)=0 E(t)=0
当n≥3 n\geq3时,t t分布的方差D(t)=nn−2 D(t)=\dfrac{n}{n-2}
t t的密度函数如下图所示:
3 F F分布
设随机变量Y Y与Z Z相互独立,且Y Y和Z Z分别服从自由度为m m和n n的χ 2 \chi^2分布,随机变量X X有如下表达式:
X=Y/mZ/n =nYmZ X=\dfrac{Y/m}{Z/n}=\dfrac{nY}{mZ}
则称X X服从第一自由度为m m,第二自由度为n n的F F分布 ,记为F(m,n) F(m,n)
E(X)=nn=2 ,n>2 E(X)=\dfrac{n}{n=2},n>2
D(X)=2n 2 (m+n−2)m(n−2(n−4)) ,n>4 D(X)=\dfrac{2n^2(m+n-2)}{m(n-2(n-4))},n>4
F F的密度函数如下图所示:
如果随机变量X X服从t(n) t(n),则X 2 X^2服从F(1,n)的F F分布。这在回归分析的回归系数检验中有用。
3 样本均值的分布于中心极限定理
当总体分布为正态分布N(μ,σ 2 ) N(\mu, \sigma^2)时,则X ¯ \bar{X}的抽样分布仍为正态分布,期望为μ \mu,方差为σ 2 /n \sigma^2/n。这说明用样本均值X ¯ \bar{X}去估计总体均值μ \mu时,平均来说没有偏差(无偏性);当n n越来越大时,X ¯ \bar{X}的散布程度越来越小,即用X ¯ \bar{X}估计mu mu越来越准确。
实际情况中,总体的分布不总是正态分布或近似正态分布,此时X ¯ \bar{X}的分布也将取决于总体分布情况。——中心极限定理
中心极限定理:设从均值为μ \mu、方差为σ 2 \sigma^2(有限)的任意一个总体总抽取样本量为n n的样本,当n n充分大时,样本均值X ¯ \bar{X}的抽样分布近似服从为均值为μ \mu、方差为σ 2 /n \sigma^2/n的正态分布。
注意:什么是当n充分大呢?大样本、小样本之间的区分并不是以样本容量大小来区分的。在样本容量固定的条件下所进行的统计推断、问题分析,不管样本容量有多大,都称为小样本问题,而在样本容量n—>∞的条件下所进行的统计推断、问题分析则称为大样本问题。一般统计学中的n≥30为大样本,n<30为小样本只是一直经验说法。
4 样本比例的抽样分布
如果在样本大小为n的样本中具有某一特征的个体数为X X,则样本比例用p p表示:p=X/n p=X/n
则可以用样本比例p p来估计总体比例π \pi。
当n n充分大时,p ^ \hat{p}的分布可用正态分布去逼近,此时,p ^ \hat{p}服从均值为π \pi、方差为π(1−π)n \dfrac{\pi(1-\pi)}{n}的正态分布,则
p ^ ∼N(π,π(1−π)n ) \hat{p}\sim{N(\pi,\dfrac{\pi(1-\pi)}{n})}
5 两个样本平均值之差的分布
设X 1 ¯ \bar{X_1}是独立地抽自总体X 1 ∼N(μ 1 ,σ 2 1 ) X_1\sim{N(\mu_1,\sigma_1^2)}的一个容量为n 1 n_1的样本的均值,X 2 ¯ \bar{X_2}是独立地抽自总体X 1 ∼N(μ 2 ,σ 2 2 ) X_1\sim{N(\mu_2,\sigma_2^2)}的一个容量为n 2 n_2的样本的均值,则有
E(X 1 −X 2 )=μ 1 −μ 2 E(X_1-X_2)=\mu_1-\mu_2
D(X 1 −X 2 )=σ 2 1 n 1 +σ 2 2 n 2 D(X_1-X_2)=\dfrac{\sigma_1^2}{n_1}+\dfrac{\sigma_2^2}{n_2}
如果两个总体均为正态分布,则X 1 −X 2 X_1-X_2也为正态分布;当n 1 n_1和n 2 n_2比较大时,一般要求n1≥30,n2≥30 n1\geq30,n2\geq30,则X 1 −X 2 X_1-X_2的抽样分布不管总体分布如何均可用正态分布来近似。
6 关于样本方差的分布
1样本方差的分布
设X 1 ,X 2 ,...,X n X_1,X_2,...,X_n为来自正态分布的样本,则可以推出:
设总体分布为N(μ,σ 2 ) N(\mu,\sigma^2)的正态分布,则样本方差S 2 S^2的分布为:
(n−1)S 2 /σ 2 ∼χ 2 (n−1) (n-1)S^2/{\sigma^2}\sim{\chi^2(n-1)}
2 两个样本方差比的分布
设X 1 ,X 2 ,...,X n 1 X_1,X_2,...,X_{n_1}为来自正态总体N(μ 1 ,σ 2 1 ) N(\mu_1,\sigma_1^2)的一个样本,Y 1 ,Y 2 ,...,Y n 1 Y_1,Y_2,...,Y_{n_1}为来自正态总体N(μ 2 ,σ 2 2 ) N(\mu_2,\sigma_2^2)的一个样本,且X i X_i与Y i Y_i相互独立,则
S 2 x /S 2 y σ 2 1 /σ 2 2 =S 2 x /σ 2 1 S 2 y /σ 2 2 ∼F(n 1 −1,n 2 −1) \dfrac{S_x^2/S_y^2}{\sigma_1^2/\sigma_2^2}=\dfrac{S_x^2/\sigma_1^2}{S_y^2/\sigma_2^2}\sim{F(n_1-1,n_2-1)}
第六章 统计量及其抽样分布相关推荐
- 《统计学》第八版贾俊平第六章统计量及抽样分布知识点总结及课后习题答案
一.知识框架 二.练习题 调节一个装瓶机使其对每个瓶子的灌装量均值为μ盎司,通过观察这台装瓶机对每个瓶子的灌装量服从标准差σ=1.0盎司的正态分布.随机抽取这台机器灌装的9个瓶子组成一个样本,并测定每 ...
- 第六章 样本与抽样分布
引言 题型总结中推荐例题有蓝皮书的题型较为重要,只有吉米多维奇的题型次之. 思维导图中,标红的是重点内容,标黄的是次重点. 码字不易,如果这篇文章对您有帮助的话,希望您能点赞.收藏.加关注!您的鼓励就 ...
- Excel在统计分析中的应用—第六章—抽样与抽样分布-Part2(等距抽样)
"先将总体的全部单元按照一定顺序排列,采用简单随机抽样抽取第一个样本单元(或称为随机起点),再顺序抽取其余的样本单元,这类抽样方法被称为等距抽样(Systematic Sampling).等 ...
- 李永乐复习全书概率论与数理统计 第五、六章 大数定律和中心极限定理及数理统计的基本概念
目录 第五章 大数定律和中心极限定理 第六章 数理统计的基本概念 6.1 总体.样本.统计量和样本数字特征 例4 设总体X∼P(λ)X\sim P(\lambda)X∼P(λ),则来自总体XX ...
- 概率论与数理统计系列笔记之第五章——统计量及其分布
概率论与数理统计笔记(第五章--统计量及其分布) 对于统计专业来说,书本知识总有遗忘,翻看教材又太麻烦,于是打算记下笔记与自己的一些思考,主要参考用书是茆诗松老师编写的<概率论与数理统计教程&g ...
- 统计学:第六章-总体均数得估计
统计学:第六章-总体均数得估计 雪柯 大工生物信息 提笔为写给奋进之人 已关注 致知计划 · 科学季收录 点击报名 29 人赞同了该文章 该书作者:李晓松 本文引自医学统计学教材,作为统计学入门经典教 ...
- 概率论||期末考试复习手写笔记-第五六七章(知识点+例题)第五章 常用统计分布 第六章 参数估计 第七章 假设检验
第五章 常用统计分布 考点一:常用统计量 考点二:三大统计分布 考点三:抽样分布(单正态总体+双正态总体) 第六章 参数估计 考点一: 估计量的评价标准(无偏性+有效性+相合性) 考点二:点估计的常 ...
- ggplot2读书笔记9:第六章 标度(二)
今天来学习第六章标度部分的最后一节~ 6.6 标度工具箱(Scales Toolbox) 除了调整标度的默认选项之外,你也可以重新创建新的标度,主要分为以下四类: 连续型位置标度:用于将整数.数值.日 ...
- [统计学教程] 第六章 抽样推断
导读: 第六章 抽样推断 一.参数与统计量 参数是指描述总体分布状况的数: 统计量是指由样本构造出来的数. 例如,一个班的学生的平均年龄为22岁,平均年龄即为班组总体的一个参数:在班级中抽出10名学生 ...
最新文章
- 基于PyTorch的Seq2Seq翻译模型详细注释介绍(一)
- Github 高赞的 YOLOv5 引发争议?Roboflow 和开发者这样说...
- 【鉴轻尘】你说你炒的了币,开发得了项目,然而这些你都知道吗?
- 使用supervisor支持Python3程序 (解决找不到Module的问题)
- 加入收藏 lsk的BLOG
- 9、 InnoDB行锁
- linux与windows互传文件、用户与用户组管理、密码配置文件
- AJAX DELETE
- 为什么要使用Node.js进行数据科学
- mediasoup 安裝
- 《现代操作系统第四版》第一章课后答案
- 几个免费的中文分词模块
- apple id两步验证服务器,【安全可靠】Apple ID 两步验证支持中国地区 - 爱应用
- 洛谷P3356 火星探险问题(费用流)
- 核心网技术之SDN学习总结
- IDEA 2020.1.2 无法显示图片的魔幻解决方法
- 发现一个免费虚拟主机和云服务器的网站
- Ubuntu磁盘分区和内存查看
- storm笔记:storm集群
- 怎么渗透验证 mysql_mysql-渗透测试
热门文章
- express 框架之 路由与中间件
- iOS学习笔记之typedef
- Extjs FormPanel/TabPanel/GridPanel混合
- kde菜单图标显示不全_大小仅 1M!在电脑菜单栏上自定义日历,规划时间更方便...
- 如何计算k段流水线执行n条指令的执行时间
- 大一c语言操作题期末考答案,大一期末考试c语言操作题答案
- c语言无符号数除法,[求助]关于双字节无符号数除法
- pdo sqlite_ sqlite2 pdo_mysql_php使用pdo连接sqlite3的配置示例
- 01.Python基础_菜单_快捷键_基本语法_变量_输入输出
- 9.Excel数据透视表