概率论与数理统计(6):数理统计的基本概念

至此进入数理统计部分

引入:

文章目录

  • 概率论与数理统计(6):数理统计的基本概念
      • 引入:
    • 一.总体与样本
      • 1.总体
      • 2.样本
        • 定义
      • 3.经验分布函数(样本分布函数)
    • 二.抽样分布
      • 1.统计量
        • 常用统计量
          • 样本平均值
          • 样本方差
            • ==推导==
          • 样本标准差
          • 样本kkk阶(原点)矩
          • 样本kkk阶中心矩
          • 矩概念复习:
          • **注:**
          • 顺序统计量
          • 样本中位数
          • 样本极差
      • 2.抽样分布
    • 三.常用统计量的分布
      • 1.χ2\chi^2χ2分布
        • 定义
        • 概率密度
          • Γ函数\Gamma函数Γ函数(伽玛函数)
          • 概率密度曲线
        • χ2\chi^2χ2分布的性质
          • ①可加性
          • ②数字特征:χ2\chi^2χ2分布的数学期望和方差
        • χ2\chi^2χ2分布的分位点
      • 2.ttt分布
        • 定义
        • 概率密度
          • 概率密度曲线
        • ttt分布的分位点
          • 回忆正态分布: ![image-20210609161508110](https://img-blog.csdnimg.cn/img_convert/6f81d63568e9cdaea1af2d888683d6f5.png)
      • 3.F分布
        • 定义
        • 概率密度
          • 概率密度曲线
        • FFF分布的分位点
          • 重要性质:
      • 4.正态总体的样本均值与样本方差的分布
        • 定理1(样本均值的分布)
          • 推论(将X‾\overline{X}X标准化)
        • 定理2(样本方差的分布)
        • 定理3
        • 定理4(方差相同)
        • 定理5(方差不同)
      • 5.非正态总体

一.总体与样本

1.总体

​ 总体就是研究对象的全体元素构成的集合

​ 把组成总体的每个元素称为个体

​ 总体的每一个个体是随机试验的一个观察值,因此它是某一随机变量X的值,这样,一个总体对应于一个随机变量X,对总体的研究,实际上就是对某一个随机变量X的概率分布的研究,X的分布函数和数字特征就称为总体的分布函数和数字特征,为便于叙述,一旦所考察的数量指标明确以后,我们就把总体的数量指标相应的概率分布等同起来,即,总体是一个概率分布或服从这个概率分布的随机变量.

2.样本

​ 从总体X中随机抽取n个个体,则可得到X的n个观察值:x1,x2,⋯,xn,x_1,x_2,\cdots,x_n,x1​,x2​,⋯,xn​,我们把从总体XXX中随机抽检n个个体的试验,称为随机抽样(抽样),n称为容量

​ 显然,对总体X的任何一个容量为n的抽样结果“x1,x2,⋯,xn,”“x_1,x_2,\cdots,x_n,”“x1​,x2​,⋯,xn​,”是n个完全确定的数值,但由于抽样是一个随机试验,所以这n个观察值是随每次抽样而改变的,它具有随机性,in other words,对具体某次抽样来说,抽样结果是n个确定的数值:x1,x2,⋯,xn;x_1,x_2,\cdots,x_n;x1​,x2​,⋯,xn​;而离开了某次特定抽样,则抽样结果是nnn个随机变量X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​

​ 我们称这n个随机变量X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​为来自总体XXX的一个容量为n的样本,而x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​称为样本的一个观察值(简称样本值)or样本的一个实现

​ 容量为nnn的一个样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​可以看作n维随机变量(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1​,X2​,⋯,Xn​),它的分布就是样本分布,样本值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​可以看做n维空间的一个点(x1,x2,⋯,xn)(x_1,x_2,\cdots,x_n)(x1​,x2​,⋯,xn​),称为样本点,样本点的全体称为样本空间,它是n维空间或其中的一个子集

定义

​ 设X是具有分布函数F的随机变量,若X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​是具有同一分布函数F的、相互独立的随机变量,则称X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​为从分布函数F(或总体F、或总体X)得到的容量为n的简单随机样本,简称样本,它们的的观察值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​称为样本值,又称为X的n个独立的观察值

​ 注意上述反应的样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​满足的两个条件:(1)X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​相互独立 (2)每个Xi(i=1,2,⋯,n)X_i(i=1,2,\cdots,n)Xi​(i=1,2,⋯,n)与总体X有相同的分布,把满足以上两个条件的抽样方法称为简单随机抽样

后文的抽样都是简单随机抽样,所说的样本都是简单随机样本

由定义得:

若X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​为F的一个样本,则X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​相互独立,且它们的分布函数都是F,所以

(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1​,X2​,⋯,Xn​) 的分布函数为:
F∗(x1,x2,⋯,xn)=∏i=1nF(xi)F^*(x_1,x_2,\cdots,x_n)=\prod^{n}_{i=1}F(x_i) F∗(x1​,x2​,⋯,xn​)=i=1∏n​F(xi​)
若X具有概率密度f,则(X1,X2,⋯,Xn)(X_1,X_2,\cdots,X_n)(X1​,X2​,⋯,Xn​)的概率密度为
f∗(x1,x2,⋯,xn)=∏i=1nf(xi)f^*(x_1,x_2,\cdots,x_n)=\prod^{n}_{i=1}f(x_i) f∗(x1​,x2​,⋯,xn​)=i=1∏n​f(xi​)

3.经验分布函数(样本分布函数)

​ 若总体是随机变量X,则X的分布就是总体的分布,X的分布函数便是总体的分布函数。要了解总体的情况,就要了解随机变量x的分布或它的某些数字特征。样本是总体的代表和反映,简单随机样本应该能很好地反映总体的情况。那么如何由样本来推断总体的分布呢?一般做法是作出样本分布函数用以观察理论分布的概貌

​ 设总体分布函数为F(x),F(x),F(x),X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​是总体FFF的一个样本,用S(x),−∞<x<∞S(x),-\infty<x<\inftyS(x),−∞<x<∞表示X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​中不大于xxx的随机变量的个数,定义经验分布函数Fn(x)F_n(x)Fn​(x)为
Fn(x)=1nS(x),−∞<x<∞F_n(x)=\frac{1}{n}S(x),-\infty<x<\infty Fn​(x)=n1​S(x),−∞<x<∞
对于一个样本值,那么经验分布函数Fn(x)F_n(x)Fn​(x)的观察值很容易得到(Fn(x)F_n(x)Fn​(x)的观察值仍以Fn(x)F_n(x)Fn​(x)表示)

​ 一般,设x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​是总体FFF的一个容量为nnn的样本值,先将x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​按自小到大的次序排列,并重新编号,设为
x(1)⩽x(2)⩽⋯⩽x(n)x_{(1)}\leqslant x_{(2)}\leqslant \cdots \leqslant x_{(n)} x(1)​⩽x(2)​⩽⋯⩽x(n)​
则经验分布函数Fn(x)F_n(x)Fn​(x)的观察值为
Fn(x)={0,若x<x(1)kn,若x(k)⩽x<x(k+1)1,若x⩾x(n)F_n(x)=\left\{ \begin{matrix} 0, & 若x<x_{(1)}\\ \frac{k}{n}, & 若x_{(k)}\leqslant x<x_{(k+1)}\\ 1, & 若x\geqslant x_{(n)} \end{matrix} \right. Fn​(x)=⎩⎨⎧​0,nk​,1,​若x<x(1)​若x(k)​⩽x<x(k+1)​若x⩾x(n)​​
​ 对于经验分布函数,有
P{lim⁡n→∞sup⁡−∞<x<∞∣Fn(x)−F(x)∣=0}=1P\{\lim_{n\rightarrow \infty} \sup_{-\infty<x<\infty}|F_n(x)-F(x)|=0 \}=1 P{n→∞lim​−∞<x<∞sup​∣Fn​(x)−F(x)∣=0}=1
因此,对于任一实数xxx当nnn充分大时,经验分布函数的任一个观察值Fn(x)F_n(x)Fn​(x)与总体分布函数F(x)F(x)F(x)只有微小差别,从而实际上可以当作F(x)F(x)F(x)来用

二.抽样分布

1.统计量

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​是来自总体XXX的一个样本,g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1​,X2​,⋯,Xn​)是X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​的函数,若ggg中不含未知参数,则称g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1​,X2​,⋯,Xn​)是一统计量.

​ 因为X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​都是随机变量,而统计量g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1​,X2​,⋯,Xn​)是随机变量的函数,因此统计量是一个随机变量,设x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​是相应于样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​的样本值,则称g(x1,x2,⋯,xn)g(x_1,x_2,\cdots,x_n)g(x1​,x2​,⋯,xn​)是g(X1,X2,⋯,Xn)g(X_1,X_2,\cdots,X_n)g(X1​,X2​,⋯,Xn​)的观察值

常用统计量

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​是来自总体XXX的一个样本,x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​是这一样本的观察值,定义

样本平均值

X‾=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum^n_{i=1}X_i X=n1​i=1∑n​Xi​

样本方差

S2=1n−1∑i=1n(Xi−X‾)2=1n−1(∑i=1nXi2−nX‾2)S^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-n\overline{X}^2) S2=n−11​i=1∑n​(Xi​−X)2=n−11​(i=1∑n​Xi2​−nX2)

推导

S2=1n−1∑i=1n(Xi−X‾)2=1n−1∑i=1n(Xi2−2XiX‾+X‾2)=1n−1(∑i=1nXi2−2X‾∑i=1nXi+∑i=1nX‾2)=1n−1(∑i=1nXi2−2nX‾2+nX‾2)=1n−1(∑i=1nXi2−nX‾2)S^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2=\dfrac{1}{n-1}\sum^n_{i=1}(X_i^2-2X_i\overline X+\overline X^2)=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-2\overline X\sum^n_{i=1}X_i+\sum^n_{i=1}\overline X^2)\\=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-2n\overline X^2+n\overline X^2)=\dfrac{1}{n-1}(\sum^n_{i=1}X_i^2-n\overline{X}^2) S2=n−11​i=1∑n​(Xi​−X)2=n−11​i=1∑n​(Xi2​−2Xi​X+X2)=n−11​(i=1∑n​Xi2​−2Xi=1∑n​Xi​+i=1∑n​X2)=n−11​(i=1∑n​Xi2​−2nX2+nX2)=n−11​(i=1∑n​Xi2​−nX2)

样本标准差

S=S2=1n−1∑i=1n(Xi−X‾)2S=\sqrt{S^2}=\sqrt{\dfrac{1}{n-1}\sum^n_{i=1}(X_i-\overline X)^2} S=S2​=n−11​i=1∑n​(Xi​−X)2​

样本kkk阶(原点)矩

Ak=1n∑i=1nXik,k=1,2,⋯;A_k=\dfrac{1}{n}\sum_{i=1}^nX_i^k,k=1,2,\cdots; Ak​=n1​i=1∑n​Xik​,k=1,2,⋯;

样本kkk阶中心矩

Bk=1n∑i=1n(Xi−X‾)k,k=1,2,⋯;B_k=\dfrac{1}{n}\sum_{i=1}^n(X_i-\overline X)^k,k=1,2,\cdots; Bk​=n1​i=1∑n​(Xi​−X)k,k=1,2,⋯;

​ 上述统计量的观察值就是把XXX换为xxx,SSS换为sss,A,BA,BA,B换成a,ba,ba,b

矩概念复习:

注:

样本均值就是样本的一阶原点矩,常用于估计总体的均值

同时要注意样本方差与样本二阶中心矩的差别,用S∗2S^{*2}S∗2表示样本的二阶中心矩:
S∗2=1n∑i=1n(Xi−X‾)2S^{*2}=\dfrac{1}{n}\sum^n_{i=1}(X_i-\overline X)^2 S∗2=n1​i=1∑n​(Xi​−X)2

​ 若总体XXX的kkk阶矩E(Xk)=记成μkE(X^k)\xlongequal{记成}\mu_kE(Xk)记成μk​存在,则当n→∞n\rightarrow\inftyn→∞时,Ak⟶Pμk,k=1,2,⋯A_k\stackrel{P}{\longrightarrow}\mu_k,k=1,2,\cdotsAk​⟶P​μk​,k=1,2,⋯,这是因为X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​独立且与XXX同分布,所以
E(X1k)=E(X2k)=⋯=E(Xnk)=μkE(X_1^k)=E(X_2^k)=\cdots=E(X_n^k)=\mu_k E(X1k​)=E(X2k​)=⋯=E(Xnk​)=μk​
从而由辛钦大数定理知
Ak=1n∑i=1nXik⟶Pμk,k=1,2,⋯A_k=\dfrac{1}{n}\sum_{i=1}^nX_i^k\stackrel{P}{\longrightarrow}\mu_k,k=1,2,\cdots Ak​=n1​i=1∑n​Xik​⟶P​μk​,k=1,2,⋯
进而由依概率收敛的序列的性质知道
g(A1,A2,⋯,Ak)⟶Pg(μ1,μ2,⋯,μk)g(A_1,A_2,\cdots,A_k)\stackrel{P}{\longrightarrow}g(\mu_1,\mu_2,\cdots,\mu_k) g(A1​,A2​,⋯,Ak​)⟶P​g(μ1​,μ2​,⋯,μk​)
其中g为连续函数

顺序统计量

​ 若x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​是样本的观察值,将它们由小到大重新排列,得
x(1)⩽x(2)⩽⋯⩽x(n)x_{(1)}\leqslant x_{(2)}\leqslant\cdots\leqslant x_{(n)} x(1)​⩽x(2)​⩽⋯⩽x(n)​
定义随机变量X(i),X_(i),X(​i),使得不论样本X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​取怎样的一组观察值x1,x2,⋯,xnx_1,x_2,\cdots,x_nx1​,x2​,⋯,xn​,X(i)X_{(i)}X(i)​总以x(i)x_{(i)}x(i)​为观察值,i=1,2,⋯,ni=1,2,\cdots, ni=1,2,⋯,n,即
X(1)⩽X(2)⩽⋯⩽X(n)X_{(1)}\leqslant X_{(2)}\leqslant\cdots\leqslant X_{(n)} X(1)​⩽X(2)​⩽⋯⩽X(n)​
X(i)X_{(i)}X(i)​称为第iii个顺序统计量

​ X(1)=min⁡1⩽i⩽nXiX_{(1)}=\min\limits_{1\leqslant i\leqslant n}X_iX(1)​=1⩽i⩽nmin​Xi​为最小顺序统计量,X(n)=max⁡1⩽i⩽nXiX_{(n)}=\max\limits_{1\leqslant i\leqslant n}X_iX(n)​=1⩽i⩽nmax​Xi​为最大顺序统计量

样本中位数

M={X(n+12),n为奇数12(X(n2)+X(n+12)),n为偶数M=\left\{ \begin{array}{lr} X_{(\frac{n+1}{2})}, & & {n为奇数}\\ \dfrac{1}{2}(X_{(\frac{n}{2})}+X_{(\frac{n+1}{2})}), & & {n为偶数}\\ \end{array} \right. M=⎩⎨⎧​X(2n+1​)​,21​(X(2n​)​+X(2n+1​)​),​​n为奇数n为偶数​

样本极差

R=X(n)−X(1)R=X_{(n)}-X_{(1)} R=X(n)​−X(1)​

2.抽样分布

三.常用统计量的分布

​ 再回顾下统计量的定义

1.χ2\chi^2χ2分布

定义

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​是来自总体N(0,1)N(0,1)N(0,1)的样本 (或者说:设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​是独立同分布的随机变量,Xi∼N(0,1)X_i\sim N(0,1)Xi​∼N(0,1)) ,则称统计量
χ2=X12+X22+⋯+Xn2\chi^2=X_1^2+X_2^2+\cdots+X_n^2 χ2=X12​+X22​+⋯+Xn2​
服从自由度为nnn的χ2\chi^2χ2分布,记为χ2∼χ2(n)\chi^2\sim\chi^2(n)χ2∼χ2(n)

概率密度

​ χ2\chi^2χ2分布的概率密度为
f(x)={12n2Γ(n2)xn2−1e−n2x>00x⩽0f(x)=\left\{\begin{array}{lr}\dfrac{1}{2^{\frac{n}{2}}\Gamma(\frac{n}{2})}x^{\frac{n}{2}-1}e^{-\frac{n}{2}}\qquad x>0\\ 0\qquad\qquad\qquad\qquad\quad x\leqslant0 \end{array}\right. f(x)=⎩⎨⎧​22n​Γ(2n​)1​x2n​−1e−2n​x>00x⩽0​

Γ函数\Gamma函数Γ函数(伽玛函数)

​ 定义为Γ(s)=∫0+∞xs−1e−xdx(s>0)\Gamma(s)=\int_0^{+\infty}x^{s-1}e^{-x}dx\qquad (s>0)Γ(s)=∫0+∞​xs−1e−xdx(s>0)

概率密度曲线

​ 概率密度曲线随n不同而不同

χ2\chi^2χ2分布的性质

①可加性

​ 设χ12∼χ2(n1),χ22∼χ2(n2)\chi_1^2\sim\chi^2(n_1),\chi_2^2\sim\chi^2(n_2)χ12​∼χ2(n1​),χ22​∼χ2(n2​),且χ12,χ22\chi_1^2,\chi_2^2χ12​,χ22​相互独立,则χ12+χ22∼χ2(n1+n2)\chi_1^2+\chi_2^2\sim \chi^2(n_1+n_2)χ12​+χ22​∼χ2(n1​+n2​)

②数字特征:χ2\chi^2χ2分布的数学期望和方差

​ 若χ2∼χ2(n),\chi^2\sim\chi^2(n),χ2∼χ2(n),则有E(χ2)=n,D(χ2)=2nE(\chi^2)=n,\qquad D(\chi^2)=2nE(χ2)=n,D(χ2)=2n

∵Xi∼N(0,1),∴E(Xi2)=D(Xi)=1,D(Xi2)=E(Xi4)−[E(Xi2)]2=3−1=2,i=1,2,⋯,n\because X_i\sim N(0,1),\therefore E(X_i^2)=D(X_i)=1, D(X_i^2)=E(X_i^4)-[E(X_i^2)]^2=3-1=2,i=1,2,\cdots,n∵Xi​∼N(0,1),∴E(Xi2​)=D(Xi​)=1,D(Xi2​)=E(Xi4​)−[E(Xi2​)]2=3−1=2,i=1,2,⋯,n

于是
E(χ2)=E(∑i=1nXi2)=∑i=1nE(Xi2)=nD(χ2)=D(∑i=1nXi2)=∑i=1nD(Xi2)=2nE(\chi^2)=E(\sum_{i=1}^nX_i^2)=\sum_{i=1}^nE(X_i^2)=n\\ D(\chi^2)=D(\sum_{i=1}^nX_i^2)=\sum_{i=1}^nD(X_i^2)=2n\\ E(χ2)=E(i=1∑n​Xi2​)=i=1∑n​E(Xi2​)=nD(χ2)=D(i=1∑n​Xi2​)=i=1∑n​D(Xi2​)=2n

χ2\chi^2χ2分布的分位点

​ 对于给定的α(0<α<1),\alpha(0<\alpha<1),α(0<α<1),存在χα2(n),\chi^2_\alpha(n),χα2​(n),使得:
P{χ2⩾χα2(n)}=∫χα2(n)∞f(x)dx=αP\{\chi^2\geqslant\ \chi^2_\alpha(n)\}=\int^{\infty}_{\chi^2_{\alpha}(n)}f(x)dx=\alpha P{χ2⩾ χα2​(n)}=∫χα2​(n)∞​f(x)dx=α
则称χα2(n)\chi^2_\alpha(n)χα2​(n)为χ2\chi^2χ2分布的α\alphaα分位数,相应的χ2\chi^2χ2的1−α1-\alpha1−α分位数记为χ1−α2(n)\chi^2_{1-\alpha}(n)χ1−α2​(n)

如:χ2(25)\chi^2(25)χ2(25)分布的上0.10.10.1分位点位34.38234.38234.382

2.ttt分布

定义

​ 设X∼N(0,1),Y∼χ2(n)X\sim N(0,1),Y\sim\chi^2(n)X∼N(0,1),Y∼χ2(n),且XXX和YYY相互独立,则随机变量
T=XYnT=\dfrac{X}{\sqrt{\frac{Y}{n}}} T=nY​​X​
所服从的分布称为自由度为nnn的ttt分布,记为T∼t(n)T\sim t(n)T∼t(n)

​ ttt分布也称为学生氏分布

概率密度

t(n)t(n)t(n)分布的概率密度为
h(t)=Γ(n+12)nπΓ(n2)(1+t2n)−n+12,−∞<t<+∞h(t)=\dfrac{\Gamma(\frac{n+1}{2})}{\sqrt{n\pi}\Gamma(\frac{n}{2})}(1+\frac{t^2}{n})^{-\frac{n+1}{2}},\quad -\infty<t<+\infty h(t)=nπ​Γ(2n​)Γ(2n+1​)​(1+nt2​)−2n+1​,−∞<t<+∞

概率密度曲线

​ 由图可知,t分布的概率密度曲线很像标准正态分布的概率密度曲线,利用Γ\GammaΓ函数的性质可得
lim⁡n→∞h(t)=12πe−t22\lim_{n\rightarrow \infty}h(t)=\dfrac{1}{\sqrt{2\pi}}e^{-\frac{t^2}{2}} n→∞lim​h(t)=2π​1​e−2t2​
故当n无限增大时,t分布近似于N(0,1)N(0,1)N(0,1)分布,但n较小时,t分布与N(0,1)N(0,1)N(0,1)分布差别较明显

ttt分布的分位点

​ 对于给定的α,0<α<1,\alpha,0<\alpha<1,α,0<α<1,存在tα(n)t_{\alpha}(n)tα​(n)使得:
P{T⩾tα(n)}=∫tα(n)∞h(t)dt=αP\{T\geqslant t_{\alpha}(n)\}=\int^{\infty}_{t_{\alpha}(n)}h(t)dt=\alpha P{T⩾tα​(n)}=∫tα​(n)∞​h(t)dt=α
则称tα(n)t_{\alpha}(n)tα​(n)为t(n)t(n)t(n)分布α\alphaα分位数

​ 由t分布上α\alphaα分位点的定义及h(t)图形的对称性知
t1−α(n)=−tα(n)t_{1-\alpha}(n)=-t_{\alpha}(n) t1−α​(n)=−tα​(n)

如t(10)t(10)t(10)分布上的上0.30.30.3和0.70.70.7分位点分别为-0.54和0.54,如图所示:

回忆正态分布:

3.F分布

定义

​ 设X∼χ2(n1),Y∼χ2(n2),X\sim \chi^2(n_1),Y\sim \chi^2(n_2),X∼χ2(n1​),Y∼χ2(n2​),且X,YX,YX,Y相互独立,则随机变量
F=Xn1Yn2F=\dfrac{\frac{X}{n_1}}{\frac{Y}{n_2}} F=n2​Y​n1​X​​
服从第一自由度是n1n_1n1​,第二自由度是n2n_2n2​的FFF分布,记为F∼F(n1,n2)F\sim F(n_1,n_2)F∼F(n1​,n2​)

概率密度

​ 若F∼F(n1,n2)F\sim F(n_1,n_2)F∼F(n1​,n2​)
ψ(y)={Γ(n1+n22)Γ(n12)Γ(n22)n1n12n2n22yn12−1(n1y+n2)n1+n22u>00u⩽0\psi(y)=\left\{ \begin{array}{lr} \dfrac{\Gamma(\frac{n_1+n_2}{2})}{\Gamma(\frac{n_1}{2})\Gamma(\frac{n_2}{2})}n_1^{\frac{n_1}{2}}n_2^{\frac{n_2}{2}}\dfrac{y^{\frac{n_1}{2}-1}}{(n_1y+n_2)^{\frac{n_1+n_2}{2}}} & & {u>0}\\ 0 \qquad\qquad\qquad\qquad\qquad\qquad \qquad\quad & & {u\leqslant0}\\ \end{array} \right. ψ(y)=⎩⎨⎧​Γ(2n1​​)Γ(2n2​​)Γ(2n1​+n2​​)​n12n1​​​n22n2​​​(n1​y+n2​)2n1​+n2​​y2n1​​−1​0​​u>0u⩽0​

概率密度曲线

由定义可知,若F∼F(n1,n2),F\sim F(n_1,n_2),F∼F(n1​,n2​),则
1F∼F(n2,n1)\dfrac{1}{F}\sim F(n_2,n_1) F1​∼F(n2​,n1​)

FFF分布的分位点

​ 对于给定的α,0<α<1,\alpha,0<\alpha<1,α,0<α<1,称满足条件
P{F⩾Fα(n1,n2)}=∫Fα(n1,n2)∞ψ(y)dy=αP\{F\geqslant F_{\alpha}(n_1,n_2)\}=\int^{\infty}_{F_{\alpha}(n_1,n_2)}\psi(y)dy=\alpha P{F⩾Fα​(n1​,n2​)}=∫Fα​(n1​,n2​)∞​ψ(y)dy=α

的点Fα(n1,n2)F_{\alpha}(n_1,n_2)Fα​(n1​,n2​)为F(n1,n2)F(n_1,n_2)F(n1​,n2​)分布的上α\alphaα分位点

重要性质:

F1−α(n1,n2)=1Fα(n2,n1)F_{1-\alpha}(n_1,n_2)=\dfrac{1}{F_{\alpha}(n_2,n_1)} F1−α​(n1​,n2​)=Fα​(n2​,n1​)1​

如F(12,9)F(12,9)F(12,9)分布的上0.950.950.95分位点为0.357,F(9,12)F(9,12)F(9,12)分布上的0.050.050.05分位点为2.802.802.80,它们的积为1

4.正态总体的样本均值与样本方差的分布

​ 设总体XXX(不管服从啥分布,只要均值和方差存在)的均值为μ\muμ,方差为σ2\sigma^2σ2, X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​为来自总体XXX的一个样本,X‾,S2\overline{X},S^2X,S2分别是样本均值和样本方差,则有
E(X‾)=μ,D(X‾)=σ2nE(\overline{X})=\mu,\quad D(\overline{X})=\dfrac{\sigma^2}{n} E(X)=μ,D(X)=nσ2​

E(S2)=E[1n−1(∑i=1nXi2−nX‾2)]=1n−1[∑i=1nE(Xi2)−nE(X‾2)]=1n−1[∑i=1n(σ2+μ2)−n(σ2n+μ2)]=σ2E(S^2)=E[\dfrac{1}{n-1}(\sum_{i=1}^nX_i^2-n\overline{X}^2)]=\dfrac{1}{n-1}[\sum_{i=1}^nE(X_i^2)-nE(\overline{X}^2)]=\dfrac{1}{n-1}[\sum_{i=1}^n(\sigma^2+\mu^2)-n(\dfrac{\sigma^2}{n}+\mu^2)]=\sigma^2 E(S2)=E[n−11​(i=1∑n​Xi2​−nX2)]=n−11​[i=1∑n​E(Xi2​)−nE(X2)]=n−11​[i=1∑n​(σ2+μ2)−n(nσ2​+μ2)]=σ2

即:E(S2)=σ2E(S^2)=\sigma^2E(S2)=σ2

​ 设X∼N(μ,σ2)X\sim N(\mu,\sigma^2)X∼N(μ,σ2),则X‾=1n∑i=1nXi\overline{X}=\dfrac{1}{n}\sum\limits_{i=1}^nX_iX=n1​i=1∑n​Xi​也服从正态分布

定理1(样本均值的分布)

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本,则样本均值
X‾∼N(μ,σ2n)\overline{X}\sim N(\mu,\dfrac{\sigma^2}{n}) X∼N(μ,nσ2​)

推论(将X‾\overline{X}X标准化)

​ 设X‾\overline{X}X为正态总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的样本均值,则
X‾−μσ2n∼N(0,1)\dfrac{\overline{X}-\mu}{\sqrt{\frac{\sigma^2}{n}}}\sim N(0,1) nσ2​​X−μ​∼N(0,1)

定理2(样本方差的分布)

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本,则样本方差S2S^2S2与样本均值X‾\overline{X}X相互独立,且
(n−1)S2σ2∼χ2(n−1)\dfrac{(n-1)S^2}{\sigma^2}\sim \chi^2(n-1) σ2(n−1)S2​∼χ2(n−1)

定理3

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​为来自总体N(μ,σ2)N(\mu,\sigma^2)N(μ,σ2)的一个样本,X‾\overline{X}X与S2S^2S2分别为样本均值和样本方差,则
X‾−μSn∼t(n−1)\dfrac{\overline{X}-\mu}{S}\sqrt{n}\sim t(n-1) SX−μ​n​∼t(n−1)

定理4(方差相同)

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​和Y1,Y2,⋯,YnY_1,Y_2,\cdots,Y_nY1​,Y2​,⋯,Yn​分别是两个相互独立的正态总体N(μ1,σ2),N(μ2,σ2)N(\mu_1,\sigma^2),N(\mu_2,\sigma^2)N(μ1​,σ2),N(μ2​,σ2)的两个样本,则
X‾−Y‾−(μ1−μ2)Sω1n1+1n2∼t(n1+n2−2)\dfrac{\overline{X}-\overline{Y}-(\mu_1-\mu_2)}{S_{\omega}\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}}\sim t(n_1+n_2-2) Sω​n1​1​+n2​1​​X−Y−(μ1​−μ2​)​∼t(n1​+n2​−2)
其中,S12,S22S_1^2,S_2^2S12​,S22​分别是两个样本的样本方差
Sω=(n1−1)S12+(n2−1)S22n1+n2−2S_{\omega}=\sqrt{\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}} Sω​=n1​+n2​−2(n1​−1)S12​+(n2​−1)S22​​​

定理5(方差不同)

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​和Y1,Y2,⋯,YnY_1,Y_2,\cdots,Y_nY1​,Y2​,⋯,Yn​分别是两个相互独立的正态总体N(μ1,σ12),N(μ2,σ22)N(\mu_1,\sigma_1^2),N(\mu_2,\sigma_2^2)N(μ1​,σ12​),N(μ2​,σ22​)的两个样本,则
S12σ12S22σ22∼F(n1−1,n2−1)\dfrac{\frac{S_1^2}{\sigma_1^2}}{\frac{S_2^2}{\sigma_2^2}}\sim F(n_1-1,n_2-1) σ22​S22​​σ12​S12​​​∼F(n1​−1,n2​−1)

5.非正态总体

​ 设X1,X2,⋯,XnX_1,X_2,\cdots,X_nX1​,X2​,⋯,Xn​是来自总体XXX的容量为nnn的样本,EX=μ,DX=σ2<+∞EX=\mu,DX=\sigma^2<+\inftyEX=μ,DX=σ2<+∞,当nnn充分大时,近似地有
∑i=1nXi−nμnσ∼N(0,1)或X‾−μσn∼N(0,1)\dfrac{\sum\limits_{i=1}^nX_i -n\mu}{\sqrt n \sigma}\sim N(0,1) 或 \dfrac{\overline{X}-\mu}{\frac{\sigma}{\sqrt n}}\sim N(0,1) n​σi=1∑n​Xi​−nμ​∼N(0,1)或n​σ​X−μ​∼N(0,1)

概率论与数理统计(6):数理统计的基本概念相关推荐

  1. UA MATH563 概率论的数学基础I 概率空间1 基本概念

    UA MATH563 概率论的数学基础I 概率空间1 基本概念 Kolmogorov公理化体系 概率空间的直观理解 Kolmogorov公理化体系 一个概率模型可以用概率空间来描述,也就是(Ω,F,P ...

  2. 概率论与数理统计--S2数理统计概念

    代码实现 # numpy 是开源的数学计算扩展库,里面有很多数值计算API,用来存储和处理矩阵 import numpy as np a = [1,2,4,5,3,12,12,23,43,52,11, ...

  3. 【概率论基础进阶】数理统计的基本概念-常用统计分布

    文章目录 χ 2 \chi^{2} χ2分布 性质 t t t分布 性质 F F F分布 性质 正态总体的抽验分布 一个正态总体 两个正态总体 χ 2 \chi^{2} χ2分布 定义:设随机变量 X ...

  4. 概率论与数理统计(数理统计部分)

    数理统计部分 目录 数理统计部分 P60 总体和样本 1.总体 2.样本 3.简单随机抽样 P61 统计量 P62 卡方分布 1.卡方分布的定义,密度函数,函数图像,性质 2.上a分位数 P63 t分 ...

  5. 概率论第六章数理统计思维导图_【思维导图】第六章:气体灭火系统

    思维导图(点击可查看高清大图) [例题]某单位的汽车喷漆车间采用二氧化碳灭火系统保护.下列关于二氧化碳灭火系统灭火机 理的说法中,正确的是().(2015) A.窒息和隔离 B.窒息和吸热冷却 C.窒 ...

  6. 数理统计-6.1 点估计的概念与无偏性

    点估计以及无偏性 点估计定义:设x1,x2,-,xn是来自总体的一个样本,用于估计未知参数θ的统计量θ'=θ'(x1,x2,-,xn)称为θ的估计量,或称θ的点估计,简称估计**(利用特殊统计量的一些 ...

  7. 概率论与数理统计_数理统计部分

    目录 相关符号 相关概念与例题 背景 总体与样本 统计量 统计量 常用统计量[重点] 直方图 经验分布函数 正态总体的抽样分布 前言复习

  8. 【数理统计】数理统计的基本概念

    文章目录 选择题 填空题 选择题 设总体 X 的密度函数为 f ( x ) = 1 2 e − ∣ x ∣ , − ∞ < x

  9. 初等概率论期中复习(1)基本概念

    本文为小姚的初等概率论复习资料,内容节选自清华大学邓老师的初概授课内容,并穿插有自己的理解,希望能对大家有所帮助. 0.写在前面 参照去年的期中题目,我总结了一下.初概期中考试的考题形式主要有判断题. ...

  10. 概率论 方差公式_【考研数学】概率论与数理统计

    总论:概率论与数理统计这门课程,在考研真题中的难度是相对较小的:但由于它的概念繁杂,计算量较大,尤其是统计部分,很多同学在初学的时候都会被唬住,有的甚至放弃学概率.这种状态是要不得的,因为我总结这门课 ...

最新文章

  1. 10篇Nature专题报导人类微生物组计划2(iHMP)成果及展望
  2. 006_Ajax发送POST请求
  3. 【已解决】java.lang.NullPointerException at line 15, Solution.r
  4. Java中带有NetSuite数据实体的对象关系映射(ORM)
  5. C#反射读取和设置类的属性
  6. h3c trunk口改access_H3CNE配置VLAN的Access链路端口和Trunk链路端口
  7. SmallMQ实现发布
  8. keras 双向LSTM 简单示例
  9. java应用中如何连接dbproxy_GitHub - alchemystar/hero: 用c语言写的dbproxy
  10. vb.net 教程 目录
  11. CDLinux破解各种无线网络
  12. 机器学习丨如何理解正定矩阵和半正定矩阵
  13. Apk去掉签名以及重新签名的方法
  14. 工商银行发消息说5星级服务器,工商银行5星级客户多吗?会刷星你也可以..
  15. 计算摄影 | 摄像机成像原理及参数解析
  16. 推荐一款非常好看notepad++主题和字体
  17. 校园网同时连手机和电脑、用数据线给电脑连网
  18. matlab 数值计算课 二阶微分方程-龙格库塔方法 ODE45
  19. Docker技术PPT分享给大家
  20. namespace 命名空间

热门文章

  1. 有线网与无线网(WIFI)网速的限制因素与Wifi信道选择
  2. win11家庭中文版 安装docker 步骤
  3. 算法-动态规划-打家劫舍
  4. app android切图工具,小白自学APP切图:APP切图工具Cutterman的参数设置
  5. “用户请求取消当前的操作”的几种解决办法
  6. STM32——滴答定时器设置1us问题
  7. 永久关闭“WPS热点”的显示
  8. 与机器对话,阿里达摩院挑战新一代人机对话技术
  9. ESP8266编译提示:undefined reference to `app_main‘
  10. CentOS — 文本编辑器