概率论与数理统计(6):数理统计的基本概念
概率论与数理统计(6):数理统计的基本概念
至此进入数理统计部分
引入:
文章目录
- 概率论与数理统计(6):数理统计的基本概念
- 引入:
- 一.总体与样本
- 1.总体
- 2.样本
- 定义
- 3.经验分布函数(样本分布函数)
- 二.抽样分布
- 1.统计量
- 常用统计量
- 样本平均值
- 样本方差
- ==推导==
- 样本标准差
- 样本kkk阶(原点)矩
- 样本kkk阶中心矩
- 矩概念复习:
- **注:**
- 顺序统计量
- 样本中位数
- 样本极差
- 2.抽样分布
- 三.常用统计量的分布
- 1.χ2\chi^2χ2分布
- 定义
- 概率密度
- Γ函数\Gamma函数Γ函数(伽玛函数)
- 概率密度曲线
- χ2\chi^2χ2分布的性质
- ①可加性
- ②数字特征:χ2\chi^2χ2分布的数学期望和方差
- χ2\chi^2χ2分布的分位点
- 2.ttt分布
- 定义
- 概率密度
- 概率密度曲线
- ttt分布的分位点
- 回忆正态分布: ![image-20210609161508110](https://img-blog.csdnimg.cn/img_convert/6f81d63568e9cdaea1af2d888683d6f5.png)
- 3.F分布
- 定义
- 概率密度
- 概率密度曲线
- FFF分布的分位点
- 重要性质:
- 4.正态总体的样本均值与样本方差的分布
- 定理1(样本均值的分布)
- 推论(将X‾\overline{X}X标准化)
- 定理2(样本方差的分布)
- 定理3
- 定理4(方差相同)
- 定理5(方差不同)
- 5.非正态总体
一.总体与样本
1.总体
总体就是研究对象的全体元素构成的集合
把组成总体的每个元素称为个体
总体的每一个个体是随机试验的一个观察值,因此它是某一随机变量X的值,这样,一个总体对应于一个随机变量X,对总体的研究,实际上就是对某一个随机变量X的概率分布的研究,X的分布函数和数字特征就称为总体的分布函数和数字特征,为便于叙述,一旦所考察的数量指标明确以后,我们就把总体的数量指标相应的概率分布等同起来,即,总体是一个概率分布或服从这个概率分布的随机变量.
2.样本
从总体X中随机抽取n个个体,则可得到X的n个观察值:x1,x2,⋯,xn,x_1,x_2,\cdots,x_n,x1,x2,⋯,xn,我们把从总体XXX中随机抽检n个个体的试验,称为随机抽样(抽样),n称为容量
显然,对总体X的任何一个容量为n的抽样结果“x1,x2,⋯,xn,”“x_1,x_2,\cdots,x_n,”“x1,x2,⋯,xn,”是n个完全确定的数值,但由于抽样是一个随机试验,所以这n个观察值是随每次抽样而改变的,它具有随机性,in other words,对具体某次抽样来说,抽样结果是n个确定的数值:x1,x2,⋯,xn;x_1,x_2,\cdots,x_n;x1,x2,⋯,xn;而离开了某次特定抽样,则抽样结果是nnn个随机变量X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn
我们称这n个随机变量X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体XXX的一个容量为n的样本,而x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn称为样本的一个观察值(简称样本值)or样本的一个实现
容量为nnn的一个样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn可以看作n维随机变量(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1,X2,⋯,Xn),它的分布就是样本分布,样本值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn可以看做n维空间的一个点(x1,x2,⋯,xn)(x_1,x_2,\cdots,x_n)(x1,x2,⋯,xn),称为样本点,样本点的全体称为样本空间,它是n维空间或其中的一个子集
定义
设X是具有分布函数F的随机变量,若X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是具有同一分布函数F的、相互独立的随机变量,则称X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为从分布函数F(或总体F、或总体X)得到的容量为n的简单随机样本,简称样本,它们的的观察值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn称为样本值,又称为X的n个独立的观察值
注意上述反应的样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn满足的两个条件:(1)X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn相互独立 (2)每个Xi(i=1,2,⋯,n)X_i(i=1,2,\cdots,n)Xi(i=1,2,⋯,n)与总体X有相同的分布,把满足以上两个条件的抽样方法称为简单随机抽样
后文的抽样都是简单随机抽样,所说的样本都是简单随机样本
由定义得:
若X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为F的一个样本,则X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn相互独立,且它们的分布函数都是F,所以
(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1,X2,⋯,Xn) 的分布函数为:
F∗(x1,x2,⋯,xn)=∏i=1nF(xi)F^*(x_1,x_2,\cdots,x_n)=\prod^{n}_{i=1}F(x_i) F∗(x1,x2,⋯,xn)=i=1∏nF(xi)
若X具有概率密度f,则(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1,X2,⋯,Xn)的概率密度为
f∗(x1,x2,⋯,xn)=∏i=1nf(xi)f^*(x_1,x_2,\cdots,x_n)=\prod^{n}_{i=1}f(x_i) f∗(x1,x2,⋯,xn)=i=1∏nf(xi)
3.经验分布函数(样本分布函数)
若总体是随机变量X,则X的分布就是总体的分布,X的分布函数便是总体的分布函数。要了解总体的情况,就要了解随机变量x的分布或它的某些数字特征。样本是总体的代表和反映,简单随机样本应该能很好地反映总体的情况。那么如何由样本来推断总体的分布呢?一般做法是作出样本分布函数用以观察理论分布的概貌
设总体分布函数为F(x),F(x),F(x),X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是总体FFF的一个样本,用S(x),−∞<x<∞S(x),-\infty<x<\inftyS(x),−∞<x<∞表示X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn中不大于xxx的随机变量的个数,定义经验分布函数Fn(x)F_n(x)Fn(x)为
Fn(x)=1nS(x),−∞<x<∞F_n(x)=\frac{1}{n}S(x),-\infty<x<\infty Fn(x)=n1S(x),−∞<x<∞
对于一个样本值,那么经验分布函数Fn(x)F_n(x)Fn(x)的观察值很容易得到(Fn(x)F_n(x)Fn(x)的观察值仍以Fn(x)F_n(x)Fn(x)表示)
一般,设x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn是总体FFF的一个容量为nnn的样本值,先将x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn按自小到大的次序排列,并重新编号,设为
x(1)⩽x(2)⩽⋯⩽x(n)x_{(1)}\leqslant x_{(2)}\leqslant \cdots \leqslant x_{(n)} x(1)⩽x(2)⩽⋯⩽x(n)
则经验分布函数Fn(x)F_n(x)Fn(x)的观察值为
Fn(x)={0,若x<x(1)kn,若x(k)⩽x<x(k+1)1,若x⩾x(n)F_n(x)=\left\{ \begin{matrix} 0, & 若x<x_{(1)}\\ \frac{k}{n}, & 若x_{(k)}\leqslant x<x_{(k+1)}\\ 1, & 若x\geqslant x_{(n)} \end{matrix} \right. Fn(x)=⎩⎨⎧0,nk,1,若x<x(1)若x(k)⩽x<x(k+1)若x⩾x(n)
对于经验分布函数,有
P{limn→∞sup−∞<x<∞∣Fn(x)−F(x)∣=0}=1P\{\lim_{n\rightarrow \infty} \sup_{-\infty<x<\infty}|F_n(x)-F(x)|=0 \}=1 P{n→∞lim−∞<x<∞sup∣Fn(x)−F(x)∣=0}=1
因此,对于任一实数xxx当nnn充分大时,经验分布函数的任一个观察值Fn(x)F_n(x)Fn(x)与总体分布函数F(x)F(x)F(x)只有微小差别,从而实际上可以当作F(x)F(x)F(x)来用
二.抽样分布
1.统计量
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是来自总体XXX的一个样本,g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1,X2,⋯,Xn)是X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn的函数,若ggg中不含未知参数,则称g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1,X2,⋯,Xn)是一统计量.
因为X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn都是随机变量,而统计量g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1,X2,⋯,Xn)是随机变量的函数,因此统计量是一个随机变量,设x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn是相应于样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn的样本值,则称g(x1,x2,⋯,xn)g(x_1,x_2,\cdots,x_n)g(x1,x2,⋯,xn)是g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1,X2,⋯,Xn)的观察值
常用统计量
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是来自总体XXX的一个样本,x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn是这一样本的观察值,定义
样本平均值
X‾=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum^n_{i=1}X_i X=n1i=1∑nXi
样本方差
S2=1n−1∑i=1n(Xi−X‾)2=1n−1(∑i=1nXi2−nX‾2)S^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-n\overline{X}^2) S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX2)
推导
S2=1n−1∑i=1n(Xi−X‾)2=1n−1∑i=1n(Xi2−2XiX‾+X‾2)=1n−1(∑i=1nXi2−2X‾∑i=1nXi+∑i=1nX‾2)=1n−1(∑i=1nXi2−2nX‾2+nX‾2)=1n−1(∑i=1nXi2−nX‾2)S^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i^2-2X_i\overline X+\overline X^2)=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-2\overline X\sum^n_{i=1}X_i+\sum^n_{i=1}\overline X^2)\\=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-2n\overline X^2+n\overline X^2)=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-n\overline{X}^2) S2=n−11i=1∑n(Xi−X)2=n−11i=1∑n(Xi2−2XiX+X2)=n−11(i=1∑nXi2−2Xi=1∑nXi+i=1∑nX2)=n−11(i=1∑nXi2−2nX2+nX2)=n−11(i=1∑nXi2−nX2)
样本标准差
S=S2=1n−1∑i=1n(Xi−X‾)2S=\sqrt{S^2}=\sqrt{\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2} S=S2=n−11i=1∑n(Xi−X)2
样本kkk阶(原点)矩
Ak=1n∑i=1nXik,k=1,2,⋯;A_k=\dfrac{1}{n}\sum_{i=1}^nX_i^k,k=1,2,\cdots; Ak=n1i=1∑nXik,k=1,2,⋯;
样本kkk阶中心矩
Bk=1n∑i=1n(Xi−X‾)k,k=1,2,⋯;B_k=\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline X)^k,k=1,2,\cdots; Bk=n1i=1∑n(Xi−X)k,k=1,2,⋯;
上述统计量的观察值就是把XXX换为xxx,SSS换为sss,A,BA,BA,B换成a,ba,ba,b
矩概念复习:
注:
样本均值就是样本的一阶原点矩,常用于估计总体的均值
同时要注意样本方差与样本二阶中心矩的差别,用S∗2S^{*2}S∗2表示样本的二阶中心矩:
S∗2=1n∑i=1n(Xi−X‾)2S^{*2}=\dfrac{1}{n}\sum^n_{i=1}(X_i-\overline X)^2 S∗2=n1i=1∑n(Xi−X)2
若总体XXX的kkk阶矩E(Xk)=记成μkE(X^k)\xlongequal{记成}\mu_kE(Xk)记成μk存在,则当n→∞n\rightarrow\inftyn→∞时,Ak⟶Pμk,k=1,2,⋯A_k\stackrel{P}{\longrightarrow}\mu_k,k=1,2,\cdotsAk⟶Pμk,k=1,2,⋯,这是因为X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn独立且与XXX同分布,所以
E(X1k)=E(X2k)=⋯=E(Xnk)=μkE(X_1^k)=E(X_2^k)=\cdots=E(X_n^k)=\mu_k E(X1k)=E(X2k)=⋯=E(Xnk)=μk
从而由辛钦大数定理知
Ak=1n∑i=1nXik⟶Pμk,k=1,2,⋯A_k=\dfrac{1}{n}\sum_{i=1}^nX_i^k\stackrel{P}{\longrightarrow}\mu_k,k=1,2,\cdots Ak=n1i=1∑nXik⟶Pμk,k=1,2,⋯
进而由依概率收敛的序列的性质知道
g(A1,A2,⋯,Ak)⟶Pg(μ1,μ2,⋯,μk)g(A_1,A_2,\cdots,A_k)\stackrel{P}{\longrightarrow}g(\mu_1,\mu_2,\cdots,\mu_k) g(A1,A2,⋯,Ak)⟶Pg(μ1,μ2,⋯,μk)
其中g为连续函数
顺序统计量
若x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn是样本的观察值,将它们由小到大重新排列,得
x(1)⩽x(2)⩽⋯⩽x(n)x_{(1)}\leqslant x_{(2)}\leqslant\cdots\leqslant x_{(n)} x(1)⩽x(2)⩽⋯⩽x(n)
定义随机变量X(i),X_(i),X(i),使得不论样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn取怎样的一组观察值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn,X(i)X_{(i)}X(i)总以x(i)x_{(i)}x(i)为观察值,i=1,2,⋯,ni=1,2,\cdots, ni=1,2,⋯,n,即
X(1)⩽X(2)⩽⋯⩽X(n)X_{(1)}\leqslant X_{(2)}\leqslant\cdots\leqslant X_{(n)} X(1)⩽X(2)⩽⋯⩽X(n)
X(i)X_{(i)}X(i)称为第iii个顺序统计量
X(1)=min1⩽i⩽nXiX_{(1)}=\min\limits_{1\leqslant i\leqslant n}X_iX(1)=1⩽i⩽nminXi为最小顺序统计量,X(n)=max1⩽i⩽nXiX_{(n)}=\max\limits_{1\leqslant i\leqslant n}X_iX(n)=1⩽i⩽nmaxXi为最大顺序统计量
样本中位数
M={X(n+12),n为奇数12(X(n2)+X(n+12)),n为偶数M=\left\{ \begin{array}{lr} X_{(\frac{n+1}{2})}, & & {n为奇数}\\ \dfrac{1}{2}(X_{(\frac{n}{2})}+X_{(\frac{n+1}{2})}), & & {n为偶数}\\ \end{array} \right. M=⎩⎨⎧X(2n+1),21(X(2n)+X(2n+1)),n为奇数n为偶数
样本极差
R=X(n)−X(1)R=X_{(n)}-X_{(1)} R=X(n)−X(1)
2.抽样分布
三.常用统计量的分布
再回顾下统计量的定义
1.χ2\chi^2χ2分布
定义
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是来自总体N(0,1)N(0,1)N(0,1)的样本 (或者说:设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是独立同分布的随机变量,Xi∼N(0,1)X_i\sim N(0,1)Xi∼N(0,1)) ,则称统计量
χ2=X12+X22+⋯+Xn2\chi^2=X_1^2+X_2^2+\cdots+X_n^2 χ2=X12+X22+⋯+Xn2
服从自由度为nnn的χ2\chi^2χ2分布,记为χ2∼χ2(n)\chi^2\sim\chi^2(n)χ2∼χ2(n)
概率密度
χ2\chi^2χ2分布的概率密度为
f(x)={12n2Γ(n2)xn2−1e−n2x>00x⩽0f(x)=\left\{\begin{array}{lr}\dfrac{1}{2^{\frac{n}{2}}\Gamma(\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{n}{2}}\qquad x>0\\ 0\qquad\qquad\qquad\qquad\quad x\leqslant0 \end{array}\right. f(x)=⎩⎨⎧22nΓ(2n)1x2n−1e−2nx>00x⩽0
Γ函数\Gamma函数Γ函数(伽玛函数)
定义为Γ(s)=∫0+∞xs−1e−xdx(s>0)\Gamma(s)=\int_0^{+\infty}x^{s-1}e^{-x}dx\qquad (s>0)Γ(s)=∫0+∞xs−1e−xdx(s>0)
概率密度曲线
概率密度曲线随n不同而不同
χ2\chi^2χ2分布的性质
①可加性
设χ12∼χ2(n1),χ22∼χ2(n2)\chi_1^2\sim\chi^2(n_1),\chi_2^2\sim\chi^2(n_2)χ12∼χ2(n1),χ22∼χ2(n2),且χ12,χ22\chi_1^2,\chi_2^2χ12,χ22相互独立,则χ12+χ22∼χ2(n1+n2)\chi_1^2+\chi_2^2\sim \chi^2(n_1+n_2)χ12+χ22∼χ2(n1+n2)
②数字特征:χ2\chi^2χ2分布的数学期望和方差
若χ2∼χ2(n),\chi^2\sim\chi^2(n),χ2∼χ2(n),则有E(χ2)=n,D(χ2)=2nE(\chi^2)=n,\qquad D(\chi^2)=2nE(χ2)=n,D(χ2)=2n
∵Xi∼N(0,1),∴E(Xi2)=D(Xi)=1,D(Xi2)=E(Xi4)−[E(Xi2)]2=3−1=2,i=1,2,⋯,n\because X_i\sim N(0,1),\therefore E(X_i^2)=D(X_i)=1, D(X_i^2)=E(X_i^4)-[E(X_i^2)]^2=3-1=2,i=1,2,\cdots,n∵Xi∼N(0,1),∴E(Xi2)=D(Xi)=1,D(Xi2)=E(Xi4)−[E(Xi2)]2=3−1=2,i=1,2,⋯,n
于是
E(χ2)=E(∑i=1nXi2)=∑i=1nE(Xi2)=nD(χ2)=D(∑i=1nXi2)=∑i=1nD(Xi2)=2nE(\chi^2)=E(\sum_{i=1}^nX_i^2)=\sum_{i=1}^nE(X_i^2)=n\\ D(\chi^2)=D(\sum_{i=1}^nX_i^2)=\sum_{i=1}^nD(X_i^2)=2n\\ E(χ2)=E(i=1∑nXi2)=i=1∑nE(Xi2)=nD(χ2)=D(i=1∑nXi2)=i=1∑nD(Xi2)=2n
χ2\chi^2χ2分布的分位点
对于给定的α(0<α<1),\alpha(0<\alpha<1),α(0<α<1),存在χα2(n),\chi^2_\alpha(n),χα2(n),使得:
P{χ2⩾χα2(n)}=∫χα2(n)∞f(x)dx=αP\{\chi^2\geqslant\ \chi^2_\alpha(n)\}=\int^{\infty}_{\chi^2_{\alpha}(n)}f(x)dx=\alpha P{χ2⩾ χα2(n)}=∫χα2(n)∞f(x)dx=α
则称χα2(n)\chi^2_\alpha(n)χα2(n)为χ2\chi^2χ2分布的α\alphaα分位数,相应的χ2\chi^2χ2的1−α1-\alpha1−α分位数记为χ1−α2(n)\chi^2_{1-\alpha}(n)χ1−α2(n)
如:χ2(25)\chi^2(25)χ2(25)分布的上0.10.10.1分位点位34.38234.38234.382
2.ttt分布
定义
设X∼N(0,1),Y∼χ2(n)X\sim N(0,1),Y\sim\chi^2(n)X∼N(0,1),Y∼χ2(n),且XXX和YYY相互独立,则随机变量
T=XYnT=\dfrac{X}{\sqrt{\frac{Y}{n}}} T=nYX
所服从的分布称为自由度为nnn的ttt分布,记为T∼t(n)T\sim t(n)T∼t(n)
ttt分布也称为学生氏分布
概率密度
t(n)t(n)t(n)分布的概率密度为
h(t)=Γ(n+12)nπΓ(n2)(1+t2n)−n+12,−∞<t<+∞h(t)=\dfrac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}(1+\frac{t^2}{n})^{-\frac{n+1}{2}},\quad -\infty<t<+\infty h(t)=nπΓ(2n)Γ(2n+1)(1+nt2)−2n+1,−∞<t<+∞
概率密度曲线
由图可知,t分布的概率密度曲线很像标准正态分布的概率密度曲线,利用Γ\GammaΓ函数的性质可得
limn→∞h(t)=12πe−t22\lim_{n\rightarrow \infty}h(t)=\dfrac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}} n→∞limh(t)=2π1e−2t2
故当n无限增大时,t分布近似于N(0,1)N(0,1)N(0,1)分布,但n较小时,t分布与N(0,1)N(0,1)N(0,1)分布差别较明显
ttt分布的分位点
对于给定的α,0<α<1,\alpha,0<\alpha<1,α,0<α<1,存在tα(n)t_{\alpha}(n)tα(n)使得:
P{T⩾tα(n)}=∫tα(n)∞h(t)dt=αP\{T\geqslant t_{\alpha}(n)\}=\int^{\infty}_{t_{\alpha}(n)}h(t)dt=\alpha P{T⩾tα(n)}=∫tα(n)∞h(t)dt=α
则称tα(n)t_{\alpha}(n)tα(n)为t(n)t(n)t(n)分布α\alphaα分位数
由t分布上α\alphaα分位点的定义及h(t)图形的对称性知
t1−α(n)=−tα(n)t_{1-\alpha}(n)=-t_{\alpha}(n) t1−α(n)=−tα(n)
如t(10)t(10)t(10)分布上的上0.30.30.3和0.70.70.7分位点分别为-0.54和0.54,如图所示:
回忆正态分布:
3.F分布
定义
设X∼χ2(n1),Y∼χ2(n2),X\sim \chi^2(n_1),Y\sim \chi^2(n_2),X∼χ2(n1),Y∼χ2(n2),且X,YX,YX,Y相互独立,则随机变量
F=Xn1Yn2F=\dfrac{\frac{X}{n_1}}{\frac{Y}{n_2}} F=n2Yn1X
服从第一自由度是n1n_1n1,第二自由度是n2n_2n2的FFF分布,记为F∼F(n1,n2)F\sim F(n_1,n_2)F∼F(n1,n2)
概率密度
若F∼F(n1,n2)F\sim F(n_1,n_2)F∼F(n1,n2)
ψ(y)={Γ(n1+n22)Γ(n12)Γ(n22)n1n12n2n22yn12−1(n1y+n2)n1+n22u>00u⩽0\psi(y)=\left\{ \begin{array}{lr} \dfrac{\Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2})\Gamma(\frac{n_2}{2})}n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}}\dfrac{y^{\frac{n_1}{2}-1}}{(n_1y+n_2)^{\frac{n_1+n_2}{2}}} & & {u>0}\\ 0 \qquad\qquad\qquad\qquad\qquad\qquad \qquad\quad & & {u\leqslant0}\\ \end{array} \right. ψ(y)=⎩⎨⎧Γ(2n1)Γ(2n2)Γ(2n1+n2)n12n1n22n2(n1y+n2)2n1+n2y2n1−10u>0u⩽0
概率密度曲线
由定义可知,若F∼F(n1,n2),F\sim F(n_1,n_2),F∼F(n1,n2),则
1F∼F(n2,n1)\dfrac{1}{F}\sim F(n_2,n_1) F1∼F(n2,n1)
FFF分布的分位点
对于给定的α,0<α<1,\alpha,0<\alpha<1,α,0<α<1,称满足条件
P{F⩾Fα(n1,n2)}=∫Fα(n1,n2)∞ψ(y)dy=αP\{F\geqslant F_{\alpha}(n_1,n_2)\}=\int^{\infty}_{F_{\alpha}(n_1,n_2)}\psi(y)dy=\alpha P{F⩾Fα(n1,n2)}=∫Fα(n1,n2)∞ψ(y)dy=α
的点Fα(n1,n2)F_{\alpha}(n_1,n_2)Fα(n1,n2)为F(n1,n2)F(n_1,n_2)F(n1,n2)分布的上α\alphaα分位点
重要性质:
F1−α(n1,n2)=1Fα(n2,n1)F_{1-\alpha}(n_1,n_2)=\dfrac{1}{F_{\alpha}(n_2,n_1)} F1−α(n1,n2)=Fα(n2,n1)1
如F(12,9)F(12,9)F(12,9)分布的上0.950.950.95分位点为0.357,F(9,12)F(9,12)F(9,12)分布上的0.050.050.05分位点为2.802.802.80,它们的积为1
4.正态总体的样本均值与样本方差的分布
设总体XXX(不管服从啥分布,只要均值和方差存在)的均值为μ\muμ,方差为σ2\sigma^2σ2, X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体XXX的一个样本,X‾,S2\overline{X},S^2X,S2分别是样本均值和样本方差,则有
E(X‾)=μ,D(X‾)=σ2nE(\overline{X})=\mu,\quad D(\overline{X})=\dfrac{\sigma^2}{n} E(X)=μ,D(X)=nσ2
E(S2)=E[1n−1(∑i=1nXi2−nX‾2)]=1n−1[∑i=1nE(Xi2)−nE(X‾2)]=1n−1[∑i=1n(σ2+μ2)−n(σ2n+μ2)]=σ2E(S^2)=E[\dfrac{1}{n-1}(\sum_{i=1}^nX_i^2-n\overline{X}^2)]=\dfrac{1}{n-1}[\sum_{i=1}^nE(X_i^2)-nE(\overline{X}^2)]=\dfrac{1}{n-1}[\sum_{i=1}^n(\sigma^2+\mu^2)-n(\dfrac{\sigma^2}{n}+\mu^2)]=\sigma^2 E(S2)=E[n−11(i=1∑nXi2−nX2)]=n−11[i=1∑nE(Xi2)−nE(X2)]=n−11[i=1∑n(σ2+μ2)−n(nσ2+μ2)]=σ2
即:E(S2)=σ2E(S^2)=\sigma^2E(S2)=σ2
设X∼N(μ,σ2)X\sim N(\mu,\sigma^2)X∼N(μ,σ2),则X‾=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum\limits_{i=1}^nX_iX=n1i=1∑nXi也服从正态分布
定理1(样本均值的分布)
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本,则样本均值
X‾∼N(μ,σ2n)\overline{X}\sim N(\mu,\dfrac{\sigma^2}{n}) X∼N(μ,nσ2)
推论(将X‾\overline{X}X标准化)
设X‾\overline{X}X为正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的样本均值,则
X‾−μσ2n∼N(0,1)\dfrac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1) nσ2X−μ∼N(0,1)
定理2(样本方差的分布)
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本,则样本方差S2S^2S2与样本均值X‾\overline{X}X相互独立,且
(n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1)
定理3
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本,X‾\overline{X}X与S2S^2S2分别为样本均值和样本方差,则
X‾−μSn∼t(n−1)\dfrac{\overline{X}-\mu}{S}\sqrt{n}\sim t(n-1) SX−μn∼t(n−1)
定理4(方差相同)
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn和Y1,Y2,⋯,YnY_1,Y_2,\cdots,Y_nY1,Y2,⋯,Yn分别是两个相互独立的正态总体N(μ1,σ2),N(μ2,σ2)N(\mu_1,\sigma^2),N(\mu_2,\sigma^2)N(μ1,σ2),N(μ2,σ2)的两个样本,则
X‾−Y‾−(μ1−μ2)Sω1n1+1n2∼t(n1+n2−2)\dfrac{\overline{X}-\overline{Y}-(\mu_1-\mu_2)}{S_{\omega}\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) Sωn11+n21X−Y−(μ1−μ2)∼t(n1+n2−2)
其中,S12,S22S_1^2,S_2^2S12,S22分别是两个样本的样本方差
Sω=(n1−1)S12+(n2−1)S22n1+n2−2S_{\omega}=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} Sω=n1+n2−2(n1−1)S12+(n2−1)S22
定理5(方差不同)
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn和Y1,Y2,⋯,YnY_1,Y_2,\cdots,Y_nY1,Y2,⋯,Yn分别是两个相互独立的正态总体N(μ1,σ12),N(μ2,σ22)N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)N(μ1,σ12),N(μ2,σ22)的两个样本,则
S12σ12S22σ22∼F(n1−1,n2−1)\dfrac{\frac{S_1^2}{\sigma_1^2}}{\frac{S_2^2}{\sigma_2^2}}\sim F(n_1-1,n_2-1) σ22S22σ12S12∼F(n1−1,n2−1)
5.非正态总体
设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是来自总体XXX的容量为nnn的样本,EX=μ,DX=σ2<+∞EX=\mu,DX=\sigma^2<+\inftyEX=μ,DX=σ2<+∞,当nnn充分大时,近似地有
∑i=1nXi−nμnσ∼N(0,1)或X‾−μσn∼N(0,1)\dfrac{\sum\limits_{i=1}^nX_i -n\mu}{\sqrt n \sigma}\sim N(0,1) 或 \dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt n}}\sim N(0,1) nσi=1∑nXi−nμ∼N(0,1)或nσX−μ∼N(0,1)
概率论与数理统计(6):数理统计的基本概念相关推荐
- UA MATH563 概率论的数学基础I 概率空间1 基本概念
UA MATH563 概率论的数学基础I 概率空间1 基本概念 Kolmogorov公理化体系 概率空间的直观理解 Kolmogorov公理化体系 一个概率模型可以用概率空间来描述,也就是(Ω,F,P ...
- 概率论与数理统计--S2数理统计概念
代码实现 # numpy 是开源的数学计算扩展库,里面有很多数值计算API,用来存储和处理矩阵 import numpy as np a = [1,2,4,5,3,12,12,23,43,52,11, ...
- 【概率论基础进阶】数理统计的基本概念-常用统计分布
文章目录 χ 2 \chi^{2} χ2分布 性质 t t t分布 性质 F F F分布 性质 正态总体的抽验分布 一个正态总体 两个正态总体 χ 2 \chi^{2} χ2分布 定义:设随机变量 X ...
- 概率论与数理统计(数理统计部分)
数理统计部分 目录 数理统计部分 P60 总体和样本 1.总体 2.样本 3.简单随机抽样 P61 统计量 P62 卡方分布 1.卡方分布的定义,密度函数,函数图像,性质 2.上a分位数 P63 t分 ...
- 概率论第六章数理统计思维导图_【思维导图】第六章:气体灭火系统
思维导图(点击可查看高清大图) [例题]某单位的汽车喷漆车间采用二氧化碳灭火系统保护.下列关于二氧化碳灭火系统灭火机 理的说法中,正确的是().(2015) A.窒息和隔离 B.窒息和吸热冷却 C.窒 ...
- 数理统计-6.1 点估计的概念与无偏性
点估计以及无偏性 点估计定义:设x1,x2,-,xn是来自总体的一个样本,用于估计未知参数θ的统计量θ'=θ'(x1,x2,-,xn)称为θ的估计量,或称θ的点估计,简称估计**(利用特殊统计量的一些 ...
- 概率论与数理统计_数理统计部分
目录 相关符号 相关概念与例题 背景 总体与样本 统计量 统计量 常用统计量[重点] 直方图 经验分布函数 正态总体的抽样分布 前言复习
- 【数理统计】数理统计的基本概念
文章目录 选择题 填空题 选择题 设总体 X 的密度函数为 f ( x ) = 1 2 e − ∣ x ∣ , − ∞ < x
- 初等概率论期中复习(1)基本概念
本文为小姚的初等概率论复习资料,内容节选自清华大学邓老师的初概授课内容,并穿插有自己的理解,希望能对大家有所帮助. 0.写在前面 参照去年的期中题目,我总结了一下.初概期中考试的考题形式主要有判断题. ...
- 概率论 方差公式_【考研数学】概率论与数理统计
总论:概率论与数理统计这门课程,在考研真题中的难度是相对较小的:但由于它的概念繁杂,计算量较大,尤其是统计部分,很多同学在初学的时候都会被唬住,有的甚至放弃学概率.这种状态是要不得的,因为我总结这门课 ...
最新文章
- 10篇Nature专题报导人类微生物组计划2(iHMP)成果及展望
- 006_Ajax发送POST请求
- 【已解决】java.lang.NullPointerException at line 15, Solution.r
- Java中带有NetSuite数据实体的对象关系映射(ORM)
- C#反射读取和设置类的属性
- h3c trunk口改access_H3CNE配置VLAN的Access链路端口和Trunk链路端口
- SmallMQ实现发布
- keras 双向LSTM 简单示例
- java应用中如何连接dbproxy_GitHub - alchemystar/hero: 用c语言写的dbproxy
- vb.net 教程 目录
- CDLinux破解各种无线网络
- 机器学习丨如何理解正定矩阵和半正定矩阵
- Apk去掉签名以及重新签名的方法
- 工商银行发消息说5星级服务器,工商银行5星级客户多吗?会刷星你也可以..
- 计算摄影 | 摄像机成像原理及参数解析
- 推荐一款非常好看notepad++主题和字体
- 校园网同时连手机和电脑、用数据线给电脑连网
- matlab 数值计算课 二阶微分方程-龙格库塔方法 ODE45
- Docker技术PPT分享给大家
- namespace 命名空间
热门文章
- 有线网与无线网(WIFI)网速的限制因素与Wifi信道选择
- win11家庭中文版 安装docker 步骤
- 算法-动态规划-打家劫舍
- app android切图工具,小白自学APP切图:APP切图工具Cutterman的参数设置
- “用户请求取消当前的操作”的几种解决办法
- STM32——滴答定时器设置1us问题
- 永久关闭“WPS热点”的显示
- 与机器对话,阿里达摩院挑战新一代人机对话技术
- ESP8266编译提示:undefined reference to `app_main‘
- CentOS — 文本编辑器