概率论与数理统计(6):数理统计的基本概念

至此进入数理统计部分

引入：

文章目录

概率论与数理统计(6):数理统计的基本概念
- - 引入：
- 一.总体与样本
- - 1.总体
  - 2.样本
  - - 定义
  - 3.经验分布函数(样本分布函数)
- 二.抽样分布
- - 1.统计量
  - - 常用统计量
    - - 样本平均值
      - 样本方差
      - ==推导==
      - 样本标准差
      - 样本kkk阶(原点)矩
      - 样本kkk阶中心矩
      - 矩概念复习：
      - **注：**
      - 顺序统计量
      - 样本中位数
      - 样本极差
  - 2.抽样分布
- 三.常用统计量的分布
- - 1.χ2\chi^2χ2分布
  - - 定义
    - 概率密度
    - - Γ函数\Gamma函数Γ函数(伽玛函数)
      - 概率密度曲线
    - χ2\chi^2χ2分布的性质
    - - ①可加性
      - ②数字特征：χ2\chi^2χ2分布的数学期望和方差
    - χ2\chi^2χ2分布的分位点
  - 2.ttt分布
  - - 定义
    - 概率密度
    - - 概率密度曲线
    - ttt分布的分位点
    - - 回忆正态分布： ![image-20210609161508110](https://img-blog.csdnimg.cn/img_convert/6f81d63568e9cdaea1af2d888683d6f5.png)
  - 3.F分布
  - - 定义
    - 概率密度
    - - 概率密度曲线
    - FFF分布的分位点
    - - 重要性质：
  - 4.正态总体的样本均值与样本方差的分布
  - - 定理1(样本均值的分布)
    - - 推论(将X‾\overline{X}X标准化)
    - 定理2(样本方差的分布)
    - 定理3
    - 定理4(方差相同)
    - 定理5(方差不同)
  - 5.非正态总体

一.总体与样本

1.总体

总体就是研究对象的全体元素构成的集合

把组成总体的每个元素称为个体

总体的每一个个体是随机试验的一个观察值，因此它是某一随机变量X的值，这样，一个总体对应于一个随机变量X，对总体的研究，实际上就是对某一个随机变量X的概率分布的研究，X的分布函数和数字特征就称为总体的分布函数和数字特征，为便于叙述，一旦所考察的数量指标明确以后，我们就把总体的数量指标相应的概率分布等同起来，即，总体是一个概率分布或服从这个概率分布的随机变量.

2.样本

从总体X中随机抽取n个个体，则可得到X的n个观察值：x1,x2,⋯,xn,x_1,x_2,\cdots,x_n,x1,x2,⋯,xn,我们把从总体XXX中随机抽检n个个体的试验，称为随机抽样（抽样），n称为容量

显然，对总体X的任何一个容量为n的抽样结果“x1,x2,⋯,xn,”“x_1,x_2,\cdots,x_n,”“x1,x2,⋯,xn,”是n个完全确定的数值，但由于抽样是一个随机试验，所以这n个观察值是随每次抽样而改变的，它具有随机性，in other words,对具体某次抽样来说，抽样结果是n个确定的数值：x1,x2,⋯,xn;x_1,x_2,\cdots,x_n;x1,x2,⋯,xn;而离开了某次特定抽样，则抽样结果是nnn个随机变量X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn

我们称这n个随机变量X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体XXX的一个容量为n的样本，而x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn称为样本的一个观察值（简称样本值）or样本的一个实现

容量为nnn的一个样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn可以看作n维随机变量(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1,X2,⋯,Xn),它的分布就是样本分布，样本值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn可以看做n维空间的一个点(x1,x2,⋯,xn)(x_1,x_2,\cdots,x_n)(x1,x2,⋯,xn),称为样本点，样本点的全体称为样本空间，它是n维空间或其中的一个子集

定义

设X是具有分布函数F的随机变量，若X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是具有同一分布函数F的、相互独立的随机变量，则称X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为从分布函数F(或总体F、或总体X)得到的容量为n的简单随机样本，简称样本，它们的的观察值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn称为样本值，又称为X的n个独立的观察值

注意上述反应的样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn满足的两个条件：(1)X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn相互独立（2）每个Xi(i=1,2,⋯,n)X_i(i=1,2,\cdots,n)Xi(i=1,2,⋯,n)与总体X有相同的分布，把满足以上两个条件的抽样方法称为简单随机抽样

后文的抽样都是简单随机抽样，所说的样本都是简单随机样本

由定义得：

若X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为F的一个样本，则X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn相互独立，且它们的分布函数都是F，所以

(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1,X2,⋯,Xn) 的分布函数为：
F∗(x1,x2,⋯,xn)=∏i=1nF(xi)F^*(x_1,x_2,\cdots,x_n)=\prod^{n}_{i=1}F(x_i) F∗(x1,x2,⋯,xn)=i=1∏nF(xi)
若X具有概率密度f，则(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1,X2,⋯,Xn)的概率密度为
f∗(x1,x2,⋯,xn)=∏i=1nf(xi)f^*(x_1,x_2,\cdots,x_n)=\prod^{n}_{i=1}f(x_i) f∗(x1,x2,⋯,xn)=i=1∏nf(xi)

3.经验分布函数(样本分布函数)

若总体是随机变量X，则X的分布就是总体的分布，X的分布函数便是总体的分布函数。要了解总体的情况，就要了解随机变量x的分布或它的某些数字特征。样本是总体的代表和反映，简单随机样本应该能很好地反映总体的情况。那么如何由样本来推断总体的分布呢?一般做法是作出样本分布函数用以观察理论分布的概貌

设总体分布函数为F(x),F(x),F(x),X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是总体FFF的一个样本，用S(x),−∞<x<∞S(x),-\infty<x<\inftyS(x),−∞<x<∞表示X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn中不大于xxx的随机变量的个数，定义经验分布函数Fn(x)F_n(x)Fn(x)为
Fn(x)=1nS(x),−∞<x<∞F_n(x)=\frac{1}{n}S(x),-\infty<x<\infty Fn(x)=n1S(x),−∞<x<∞
对于一个样本值，那么经验分布函数Fn(x)F_n(x)Fn(x)的观察值很容易得到(Fn(x)F_n(x)Fn(x)的观察值仍以Fn(x)F_n(x)Fn(x)表示)

一般，设x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn是总体FFF的一个容量为nnn的样本值，先将x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn按自小到大的次序排列，并重新编号，设为
x(1)⩽x(2)⩽⋯⩽x(n)x_{(1)}\leqslant x_{(2)}\leqslant \cdots \leqslant x_{(n)} x(1)⩽x(2)⩽⋯⩽x(n)
则经验分布函数Fn(x)F_n(x)Fn(x)的观察值为
Fn(x)={0，若x<x(1)kn,若x(k)⩽x<x(k+1)1,若x⩾x(n)F_n(x)=\left\{ \begin{matrix} 0， & 若x<x_{(1)}\\ \frac{k}{n}, & 若x_{(k)}\leqslant x<x_{(k+1)}\\ 1, & 若x\geqslant x_{(n)} \end{matrix} \right. Fn(x)=⎩⎨⎧0，nk,1,若x<x(1)若x(k)⩽x<x(k+1)若x⩾x(n)
对于经验分布函数，有
P{lim⁡n→∞sup⁡−∞<x<∞∣Fn(x)−F(x)∣=0}=1P\{\lim_{n\rightarrow \infty} \sup_{-\infty<x<\infty}|F_n(x)-F(x)|=0 \}=1 P{n→∞lim−∞<x<∞sup∣Fn(x)−F(x)∣=0}=1
因此，对于任一实数xxx当nnn充分大时，经验分布函数的任一个观察值Fn(x)F_n(x)Fn(x)与总体分布函数F(x)F(x)F(x)只有微小差别，从而实际上可以当作F(x)F(x)F(x)来用

二.抽样分布

1.统计量

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是来自总体XXX的一个样本，g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1,X2,⋯,Xn)是X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn的函数，若ggg中不含未知参数，则称g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1,X2,⋯,Xn)是一统计量.

因为X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn都是随机变量，而统计量g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1,X2,⋯,Xn)是随机变量的函数，因此统计量是一个随机变量，设x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn是相应于样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn的样本值，则称g(x1,x2,⋯,xn)g(x_1,x_2,\cdots,x_n)g(x1,x2,⋯,xn)是g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1,X2,⋯,Xn)的观察值

常用统计量

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是来自总体XXX的一个样本，x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn是这一样本的观察值，定义

样本平均值

X‾=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum^n_{i=1}X_i X=n1i=1∑nXi

样本方差

S2=1n−1∑i=1n(Xi−X‾)2=1n−1(∑i=1nXi2−nX‾2)S^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-n\overline{X}^2) S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX2)

推导

S2=1n−1∑i=1n(Xi−X‾)2=1n−1∑i=1n(Xi2−2XiX‾+X‾2)=1n−1(∑i=1nXi2−2X‾∑i=1nXi+∑i=1nX‾2)=1n−1(∑i=1nXi2−2nX‾2+nX‾2)=1n−1(∑i=1nXi2−nX‾2)S^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i^2-2X_i\overline X+\overline X^2)=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-2\overline X\sum^n_{i=1}X_i+\sum^n_{i=1}\overline X^2)\\=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-2n\overline X^2+n\overline X^2)=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-n\overline{X}^2) S2=n−11i=1∑n(Xi−X)2=n−11i=1∑n(Xi2−2XiX+X2)=n−11(i=1∑nXi2−2Xi=1∑nXi+i=1∑nX2)=n−11(i=1∑nXi2−2nX2+nX2)=n−11(i=1∑nXi2−nX2)

样本标准差

S=S2=1n−1∑i=1n(Xi−X‾)2S=\sqrt{S^2}=\sqrt{\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2} S=S2=n−11i=1∑n(Xi−X)2

样本kkk阶(原点)矩

Ak=1n∑i=1nXik,k=1,2,⋯;A_k=\dfrac{1}{n}\sum_{i=1}^nX_i^k,k=1,2,\cdots; Ak=n1i=1∑nXik,k=1,2,⋯;

样本kkk阶中心矩

Bk=1n∑i=1n(Xi−X‾)k,k=1,2,⋯;B_k=\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline X)^k,k=1,2,\cdots; Bk=n1i=1∑n(Xi−X)k,k=1,2,⋯;

上述统计量的观察值就是把XXX换为xxx，SSS换为sss,A,BA,BA,B换成a,ba,ba,b

矩概念复习：

注：

样本均值就是样本的一阶原点矩，常用于估计总体的均值

同时要注意样本方差与样本二阶中心矩的差别，用S∗2S^{*2}S∗2表示样本的二阶中心矩：
S∗2=1n∑i=1n(Xi−X‾)2S^{*2}=\dfrac{1}{n}\sum^n_{i=1}(X_i-\overline X)^2 S∗2=n1i=1∑n(Xi−X)2

若总体XXX的kkk阶矩E(Xk)=记成μkE(X^k)\xlongequal{记成}\mu_kE(Xk)记成μk存在，则当n→∞n\rightarrow\inftyn→∞时，Ak⟶Pμk,k=1,2,⋯A_k\stackrel{P}{\longrightarrow}\mu_k,k=1,2,\cdotsAk⟶Pμk,k=1,2,⋯,这是因为X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn独立且与XXX同分布，所以
E(X1k)=E(X2k)=⋯=E(Xnk)=μkE(X_1^k)=E(X_2^k)=\cdots=E(X_n^k)=\mu_k E(X1k)=E(X2k)=⋯=E(Xnk)=μk
从而由辛钦大数定理知
Ak=1n∑i=1nXik⟶Pμk,k=1,2,⋯A_k=\dfrac{1}{n}\sum_{i=1}^nX_i^k\stackrel{P}{\longrightarrow}\mu_k,k=1,2,\cdots Ak=n1i=1∑nXik⟶Pμk,k=1,2,⋯
进而由依概率收敛的序列的性质知道
g(A1,A2,⋯,Ak)⟶Pg(μ1,μ2,⋯,μk)g(A_1,A_2,\cdots,A_k)\stackrel{P}{\longrightarrow}g(\mu_1,\mu_2,\cdots,\mu_k) g(A1,A2,⋯,Ak)⟶Pg(μ1,μ2,⋯,μk)
其中g为连续函数

顺序统计量

若x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn是样本的观察值，将它们由小到大重新排列，得
x(1)⩽x(2)⩽⋯⩽x(n)x_{(1)}\leqslant x_{(2)}\leqslant\cdots\leqslant x_{(n)} x(1)⩽x(2)⩽⋯⩽x(n)
定义随机变量X(i),X_(i),X(i),使得不论样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn取怎样的一组观察值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1,x2,⋯,xn，X(i)X_{(i)}X(i)总以x(i)x_{(i)}x(i)为观察值，i=1,2,⋯,ni=1,2,\cdots, ni=1,2,⋯,n，即
X(1)⩽X(2)⩽⋯⩽X(n)X_{(1)}\leqslant X_{(2)}\leqslant\cdots\leqslant X_{(n)} X(1)⩽X(2)⩽⋯⩽X(n)
X(i)X_{(i)}X(i)称为第iii个顺序统计量

X(1)=min⁡1⩽i⩽nXiX_{(1)}=\min\limits_{1\leqslant i\leqslant n}X_iX(1)=1⩽i⩽nminXi为最小顺序统计量，X(n)=max⁡1⩽i⩽nXiX_{(n)}=\max\limits_{1\leqslant i\leqslant n}X_iX(n)=1⩽i⩽nmaxXi为最大顺序统计量

样本中位数

M={X(n+12),n为奇数12(X(n2)+X(n+12)),n为偶数M=\left\{ \begin{array}{lr} X_{(\frac{n+1}{2})}, & & {n为奇数}\\ \dfrac{1}{2}(X_{(\frac{n}{2})}+X_{(\frac{n+1}{2})}), & & {n为偶数}\\ \end{array} \right. M=⎩⎨⎧X(2n+1),21(X(2n)+X(2n+1)),n为奇数n为偶数

样本极差

R=X(n)−X(1)R=X_{(n)}-X_{(1)} R=X(n)−X(1)

2.抽样分布

三.常用统计量的分布

再回顾下统计量的定义

1.χ2\chi^2χ2分布

定义

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是来自总体N(0,1)N(0,1)N(0,1)的样本 (或者说：设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是独立同分布的随机变量，Xi∼N(0,1)X_i\sim N(0,1)Xi∼N(0,1)) ，则称统计量
χ2=X12+X22+⋯+Xn2\chi^2=X_1^2+X_2^2+\cdots+X_n^2 χ2=X12+X22+⋯+Xn2
服从自由度为nnn的χ2\chi^2χ2分布，记为χ2∼χ2(n)\chi^2\sim\chi^2(n)χ2∼χ2(n)

概率密度

χ2\chi^2χ2分布的概率密度为
f(x)={12n2Γ(n2)xn2−1e−n2x>00x⩽0f(x)=\left\{\begin{array}{lr}\dfrac{1}{2^{\frac{n}{2}}\Gamma(\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{n}{2}}\qquad x>0\\ 0\qquad\qquad\qquad\qquad\quad x\leqslant0 \end{array}\right. f(x)=⎩⎨⎧22nΓ(2n)1x2n−1e−2nx>00x⩽0

Γ函数\Gamma函数Γ函数(伽玛函数)

定义为Γ(s)=∫0+∞xs−1e−xdx(s>0)\Gamma(s)=\int_0^{+\infty}x^{s-1}e^{-x}dx\qquad (s>0)Γ(s)=∫0+∞xs−1e−xdx(s>0)

概率密度曲线

概率密度曲线随n不同而不同

χ2\chi^2χ2分布的性质

①可加性

设χ12∼χ2(n1),χ22∼χ2(n2)\chi_1^2\sim\chi^2(n_1),\chi_2^2\sim\chi^2(n_2)χ12∼χ2(n1),χ22∼χ2(n2),且χ12,χ22\chi_1^2,\chi_2^2χ12,χ22相互独立，则χ12+χ22∼χ2(n1+n2)\chi_1^2+\chi_2^2\sim \chi^2(n_1+n_2)χ12+χ22∼χ2(n1+n2)

②数字特征：χ2\chi^2χ2分布的数学期望和方差

若χ2∼χ2(n),\chi^2\sim\chi^2(n),χ2∼χ2(n),则有E(χ2)=n,D(χ2)=2nE(\chi^2)=n,\qquad D(\chi^2)=2nE(χ2)=n,D(χ2)=2n

∵Xi∼N(0,1),∴E(Xi2)=D(Xi)=1,D(Xi2)=E(Xi4)−[E(Xi2)]2=3−1=2,i=1,2,⋯,n\because X_i\sim N(0,1),\therefore E(X_i^2)=D(X_i)=1, D(X_i^2)=E(X_i^4)-[E(X_i^2)]^2=3-1=2,i=1,2,\cdots,n∵Xi∼N(0,1),∴E(Xi2)=D(Xi)=1,D(Xi2)=E(Xi4)−[E(Xi2)]2=3−1=2,i=1,2,⋯,n

于是
E(χ2)=E(∑i=1nXi2)=∑i=1nE(Xi2)=nD(χ2)=D(∑i=1nXi2)=∑i=1nD(Xi2)=2nE(\chi^2)=E(\sum_{i=1}^nX_i^2)=\sum_{i=1}^nE(X_i^2)=n\\ D(\chi^2)=D(\sum_{i=1}^nX_i^2)=\sum_{i=1}^nD(X_i^2)=2n\\ E(χ2)=E(i=1∑nXi2)=i=1∑nE(Xi2)=nD(χ2)=D(i=1∑nXi2)=i=1∑nD(Xi2)=2n

χ2\chi^2χ2分布的分位点

对于给定的α(0<α<1),\alpha(0<\alpha<1),α(0<α<1),存在χα2(n),\chi^2_\alpha(n),χα2(n),使得：
P{χ2⩾χα2(n)}=∫χα2(n)∞f(x)dx=αP\{\chi^2\geqslant\ \chi^2_\alpha(n)\}=\int^{\infty}_{\chi^2_{\alpha}(n)}f(x)dx=\alpha P{χ2⩾ χα2(n)}=∫χα2(n)∞f(x)dx=α
则称χα2(n)\chi^2_\alpha(n)χα2(n)为χ2\chi^2χ2分布的α\alphaα分位数，相应的χ2\chi^2χ2的1−α1-\alpha1−α分位数记为χ1−α2(n)\chi^2_{1-\alpha}(n)χ1−α2(n)

如：χ2(25)\chi^2(25)χ2(25)分布的上0.10.10.1分位点位34.38234.38234.382

2.ttt分布

定义

设X∼N(0,1),Y∼χ2(n)X\sim N(0,1),Y\sim\chi^2(n)X∼N(0,1),Y∼χ2(n),且XXX和YYY相互独立，则随机变量
T=XYnT=\dfrac{X}{\sqrt{\frac{Y}{n}}} T=nYX
所服从的分布称为自由度为nnn的ttt分布，记为T∼t(n)T\sim t(n)T∼t(n)

ttt分布也称为学生氏分布

概率密度

t(n)t(n)t(n)分布的概率密度为
h(t)=Γ(n+12)nπΓ(n2)(1+t2n)−n+12,−∞<t<+∞h(t)=\dfrac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}(1+\frac{t^2}{n})^{-\frac{n+1}{2}},\quad -\infty<t<+\infty h(t)=nπΓ(2n)Γ(2n+1)(1+nt2)−2n+1,−∞<t<+∞

概率密度曲线

由图可知，t分布的概率密度曲线很像标准正态分布的概率密度曲线，利用Γ\GammaΓ函数的性质可得
lim⁡n→∞h(t)=12πe−t22\lim_{n\rightarrow \infty}h(t)=\dfrac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}} n→∞limh(t)=2π1e−2t2
故当n无限增大时，t分布近似于N(0,1)N(0,1)N(0,1)分布，但n较小时，t分布与N(0,1)N(0,1)N(0,1)分布差别较明显

ttt分布的分位点

对于给定的α,0<α<1,\alpha,0<\alpha<1,α,0<α<1,存在tα(n)t_{\alpha}(n)tα(n)使得：
P{T⩾tα(n)}=∫tα(n)∞h(t)dt=αP\{T\geqslant t_{\alpha}(n)\}=\int^{\infty}_{t_{\alpha}(n)}h(t)dt=\alpha P{T⩾tα(n)}=∫tα(n)∞h(t)dt=α
则称tα(n)t_{\alpha}(n)tα(n)为t(n)t(n)t(n)分布α\alphaα分位数

由t分布上α\alphaα分位点的定义及h(t)图形的对称性知
t1−α(n)=−tα(n)t_{1-\alpha}(n)=-t_{\alpha}(n) t1−α(n)=−tα(n)

如t(10)t(10)t(10)分布上的上0.30.30.3和0.70.70.7分位点分别为-0.54和0.54,如图所示：

回忆正态分布：

3.F分布

定义

设X∼χ2(n1)，Y∼χ2(n2),X\sim \chi^2(n_1)，Y\sim \chi^2(n_2),X∼χ2(n1)，Y∼χ2(n2),且X,YX,YX,Y相互独立，则随机变量
F=Xn1Yn2F=\dfrac{\frac{X}{n_1}}{\frac{Y}{n_2}} F=n2Yn1X
服从第一自由度是n1n_1n1,第二自由度是n2n_2n2的FFF分布，记为F∼F(n1,n2)F\sim F(n_1,n_2)F∼F(n1,n2)

概率密度

若F∼F(n1,n2)F\sim F(n_1,n_2)F∼F(n1,n2)
ψ(y)={Γ(n1+n22)Γ(n12)Γ(n22)n1n12n2n22yn12−1(n1y+n2)n1+n22u>00u⩽0\psi(y)=\left\{ \begin{array}{lr} \dfrac{\Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2})\Gamma(\frac{n_2}{2})}n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}}\dfrac{y^{\frac{n_1}{2}-1}}{(n_1y+n_2)^{\frac{n_1+n_2}{2}}} & & {u>0}\\ 0 \qquad\qquad\qquad\qquad\qquad\qquad \qquad\quad & & {u\leqslant0}\\ \end{array} \right. ψ(y)=⎩⎨⎧Γ(2n1)Γ(2n2)Γ(2n1+n2)n12n1n22n2(n1y+n2)2n1+n2y2n1−10u>0u⩽0

概率密度曲线

由定义可知，若F∼F(n1,n2),F\sim F(n_1,n_2),F∼F(n1,n2),则
1F∼F(n2,n1)\dfrac{1}{F}\sim F(n_2,n_1) F1∼F(n2,n1)

FFF分布的分位点

对于给定的α,0<α<1,\alpha,0<\alpha<1,α,0<α<1,称满足条件
P{F⩾Fα(n1,n2)}=∫Fα(n1,n2)∞ψ(y)dy=αP\{F\geqslant F_{\alpha}(n_1,n_2)\}=\int^{\infty}_{F_{\alpha}(n_1,n_2)}\psi(y)dy=\alpha P{F⩾Fα(n1,n2)}=∫Fα(n1,n2)∞ψ(y)dy=α

的点Fα(n1,n2)F_{\alpha}(n_1,n_2)Fα(n1,n2)为F(n1,n2)F(n_1,n_2)F(n1,n2)分布的上α\alphaα分位点

重要性质：

F1−α(n1,n2)=1Fα(n2,n1)F_{1-\alpha}(n_1,n_2)=\dfrac{1}{F_{\alpha}(n_2,n_1)} F1−α(n1,n2)=Fα(n2,n1)1

如F(12,9)F(12,9)F(12,9)分布的上0.950.950.95分位点为0.357，F(9,12)F(9,12)F(9,12)分布上的0.050.050.05分位点为2.802.802.80,它们的积为1

4.正态总体的样本均值与样本方差的分布

设总体XXX(不管服从啥分布，只要均值和方差存在)的均值为μ\muμ，方差为σ2\sigma^2σ2, X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体XXX的一个样本,X‾,S2\overline{X},S^2X,S2分别是样本均值和样本方差，则有
E(X‾)=μ,D(X‾)=σ2nE(\overline{X})=\mu,\quad D(\overline{X})=\dfrac{\sigma^2}{n} E(X)=μ,D(X)=nσ2

E(S2)=E[1n−1(∑i=1nXi2−nX‾2)]=1n−1[∑i=1nE(Xi2)−nE(X‾2)]=1n−1[∑i=1n(σ2+μ2)−n(σ2n+μ2)]=σ2E(S^2)=E[\dfrac{1}{n-1}(\sum_{i=1}^nX_i^2-n\overline{X}^2)]=\dfrac{1}{n-1}[\sum_{i=1}^nE(X_i^2)-nE(\overline{X}^2)]=\dfrac{1}{n-1}[\sum_{i=1}^n(\sigma^2+\mu^2)-n(\dfrac{\sigma^2}{n}+\mu^2)]=\sigma^2 E(S2)=E[n−11(i=1∑nXi2−nX2)]=n−11[i=1∑nE(Xi2)−nE(X2)]=n−11[i=1∑n(σ2+μ2)−n(nσ2+μ2)]=σ2

即:E(S2)=σ2E(S^2)=\sigma^2E(S2)=σ2

设X∼N(μ,σ2)X\sim N(\mu,\sigma^2)X∼N(μ,σ2),则X‾=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum\limits_{i=1}^nX_iX=n1i=1∑nXi也服从正态分布

定理1(样本均值的分布)

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本，则样本均值
X‾∼N(μ,σ2n)\overline{X}\sim N(\mu,\dfrac{\sigma^2}{n}) X∼N(μ,nσ2)

推论(将X‾\overline{X}X标准化)

设X‾\overline{X}X为正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的样本均值，则
X‾−μσ2n∼N(0,1)\dfrac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1) nσ2X−μ∼N(0,1)

定理2(样本方差的分布)

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本，则样本方差S2S^2S2与样本均值X‾\overline{X}X相互独立，且
(n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1)

定理3

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本，X‾\overline{X}X与S2S^2S2分别为样本均值和样本方差，则
X‾−μSn∼t(n−1)\dfrac{\overline{X}-\mu}{S}\sqrt{n}\sim t(n-1) SX−μn∼t(n−1)

定理4(方差相同)

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn和Y1,Y2,⋯,YnY_1,Y_2,\cdots,Y_nY1,Y2,⋯,Yn分别是两个相互独立的正态总体N(μ1,σ2),N(μ2,σ2)N(\mu_1,\sigma^2),N(\mu_2,\sigma^2)N(μ1,σ2),N(μ2,σ2)的两个样本，则
X‾−Y‾−(μ1−μ2)Sω1n1+1n2∼t(n1+n2−2)\dfrac{\overline{X}-\overline{Y}-(\mu_1-\mu_2)}{S_{\omega}\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) Sωn11+n21X−Y−(μ1−μ2)∼t(n1+n2−2)
其中，S12,S22S_1^2,S_2^2S12,S22分别是两个样本的样本方差
Sω=(n1−1)S12+(n2−1)S22n1+n2−2S_{\omega}=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} Sω=n1+n2−2(n1−1)S12+(n2−1)S22

定理5(方差不同)

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn和Y1,Y2,⋯,YnY_1,Y_2,\cdots,Y_nY1,Y2,⋯,Yn分别是两个相互独立的正态总体N(μ1,σ12),N(μ2,σ22)N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)N(μ1,σ12),N(μ2,σ22)的两个样本，则
S12σ12S22σ22∼F(n1−1,n2−1)\dfrac{\frac{S_1^2}{\sigma_1^2}}{\frac{S_2^2}{\sigma_2^2}}\sim F(n_1-1,n_2-1) σ22S22σ12S12∼F(n1−1,n2−1)

5.非正态总体

设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1,X2,⋯,Xn是来自总体XXX的容量为nnn的样本，EX=μ,DX=σ2<+∞EX=\mu,DX=\sigma^2<+\inftyEX=μ,DX=σ2<+∞,当nnn充分大时，近似地有
∑i=1nXi−nμnσ∼N(0,1)或X‾−μσn∼N(0,1)\dfrac{\sum\limits_{i=1}^nX_i -n\mu}{\sqrt n \sigma}\sim N(0,1) 或 \dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt n}}\sim N(0,1) nσi=1∑nXi−nμ∼N(0,1)或nσX−μ∼N(0,1)