UA MATH564 概率论VI 数理统计基础2

  • 多元正态分布
    • 矩母函数
    • 概率密度
  • 多元正态分布的矩
  • 条件分布
  • 独立性

抽样分布简单地说就是统计量服从的分布,正态分布时最常用的总体分布,因此研究正态总体的抽样分布是相当重要的。一般我们研究下面这三种分布:卡方分布、t分布、F分布。关于统计量的内容可以参考统计理论的第一篇。这一讲介绍多元正态分布,之后逐个介绍这三种分布。

多元正态分布

假设XXX是nnn个独立标准正态随机变量构成的列向量,则多元正态随机变量被定义为XXX的有限个线性函数:
Y=AX+μ,A∈Rm×n,μ∈Rm×1Y = AX + \mu,A \in \mathbb{R}^{m \times n},\mu \in \mathbb{R}^{m \times 1}Y=AX+μ,A∈Rm×n,μ∈Rm×1
记为Y∼Nm(μ,AA′)Y \sim N_m(\mu,AA')Y∼Nm​(μ,AA′),XXX的分布可以记为X∼Nn(0,In)X \sim N_n(0,I_n)X∼Nn​(0,In​)。不妨假设m<nm<nm<n。多元正态分布具有如下性质:

  1. Z=BY+d,B∈Rl×m,d∈Rl×1Z = BY+d,B \in \mathbb{R}^{l \times m},d \in \mathbb{R}^{l \times 1}Z=BY+d,B∈Rl×m,d∈Rl×1,则Z∼Nl(Bμ+d,BAA′B′)Z \sim N_l(B\mu+d,BAA'B')Z∼Nl​(Bμ+d,BAA′B′)
  2. Y=(Y1′,Y2′)′,μ=(μ1′,μ2′)′,Y1,μ1∈Rr×1,Y2,μ2∈R(m−r)×1Y = (Y_1',Y_2')',\mu = (\mu_1',\mu_2')',Y_1,\mu_1 \in \mathbb{R}^{r \times 1},Y_2,\mu_2 \in \mathbb{R}^{(m-r) \times 1}Y=(Y1′​,Y2′​)′,μ=(μ1′​,μ2′​)′,Y1​,μ1​∈Rr×1,Y2​,μ2​∈R(m−r)×1,AA′=[V11V12V21V22]AA' = \left[ \begin{matrix} V_{11} & V_{12} \\ V_{21} & V_{22} \end{matrix} \right]AA′=[V11​V21​​V12​V22​​],V11∈Rr×r,V22∈R(m−r)×(m−r),V12∈Rr×(m−r),V21∈R(m−r)×rV_{11} \in \mathbb{R}^{r \times r},V_{22} \in \mathbb{R}^{(m-r)\times (m-r)},V_{12} \in \mathbb{R}^{r \times (m-r)},V_{21} \in \mathbb{R}^{(m-r) \times r}V11​∈Rr×r,V22​∈R(m−r)×(m−r),V12​∈Rr×(m−r),V21​∈R(m−r)×r,则Y1∼Nr(μ1,V11),Y2∼Nm−r(μ1,V22)Y_1 \sim N_r(\mu_1,V_{11}),\ Y_2 \sim N_{m-r}(\mu_1,V_{22})Y1​∼Nr​(μ1​,V11​), Y2​∼Nm−r​(μ1​,V22​)

显然2就是1的特例,性质1根据定义可以直接看出来:
Z=BY+d=B(AX+μ)+d=BAX+(Bμ+d)∼Nl(Bμ+d,BAA′B′)Z = BY + d = B(AX+\mu) + d = BAX + (B\mu + d) \sim N_l(B\mu + d,BAA'B')Z=BY+d=B(AX+μ)+d=BAX+(Bμ+d)∼Nl​(Bμ+d,BAA′B′)
性质1说明多元正态随机变量的线性变换也是多元正态随机变量;性质2说明多元正态随机变量的部分元素也服从多元正态分布。

矩母函数

现在考虑记V=AA′V = AA'V=AA′,并假设det⁡(V)≠0\det(V) \ne 0det(V)​=0,则Y∼Nm(μ,V)Y \sim N_m(\mu,V)Y∼Nm​(μ,V),我们来尝试推导它的矩母函数。先考虑X∼Nn(0,In)X \sim N_n(0,I_n)X∼Nn​(0,In​)的矩母函数,
MX(t)=Eet′X=Ee∑i=1ntiXi=∏i=1nEetiXi=∏i=1ne−12ti2=exp⁡(−12t′t)M_X(t) = Ee^{t'X} = Ee^{\sum_{i=1}^n t_i X_i} = \prod_{i=1}^n Ee^{t_iX_i} = \prod_{i=1}^n e^{-\frac{1}{2}t_i^2} = \exp \left( -\frac{1}{2}t't \right)MX​(t)=Eet′X=Ee∑i=1n​ti​Xi​=i=1∏n​Eeti​Xi​=i=1∏n​e−21​ti2​=exp(−21​t′t)
因为Y=AX+μY = AX + \muY=AX+μ,MY(t)=Eet′Y=Eet′AX+t′μ=et′μEet′AXM_Y(t) = Ee^{t'Y} = Ee^{t'AX+t'\mu} = e^{t'\mu}Ee^{t'AX}MY​(t)=Eet′Y=Eet′AX+t′μ=et′μEet′AX,记t′A=s′t'A = s't′A=s′,则
Eet′AX=Ees′X=exp⁡(−12s′s)=exp⁡(−12t′AA′t)Ee^{t'AX} =Ee^{s'X} = \exp \left( -\frac{1}{2}s's \right) = \exp \left( -\frac{1}{2}t'AA't \right) Eet′AX=Ees′X=exp(−21​s′s)=exp(−21​t′AA′t)
所以多元正态随机变量的矩母函数为
MY(t)=exp⁡(t′μ−12t′AA′t)=exp⁡(t′μ−12t′Vt)M_Y(t) = \exp \left( t'\mu - \frac{1}{2}t'AA't \right) = \exp \left( t'\mu - \frac{1}{2}t'Vt \right)MY​(t)=exp(t′μ−21​t′AA′t)=exp(t′μ−21​t′Vt)

概率密度

接下来推导密度函数:
fY(y)=(2π)−m/2(det⁡(V))−1/2exp⁡(−12(y−μ)′V−1(y−μ))f_Y(y) = (2\pi)^{-m/2}(\det(V))^{-1/2}\exp \left( -\frac{1}{2}(y-\mu)'V^{-1}(y-\mu) \right)fY​(y)=(2π)−m/2(det(V))−1/2exp(−21​(y−μ)′V−1(y−μ))
首先,XXX就是nnn个标准正态简单随机样本,它的密度函数是
f(X)(x)=(2π)−n/2exp⁡(−12x′x)f_(X)(x) = (2\pi)^{-n/2}\exp \left( -\frac{1}{2} x'x\right)f(​X)(x)=(2π)−n/2exp(−21​x′x)
把YYY看成是基于XXX的变换,
P(Y≤a)=∫Ax+μ≤a(2π)−n/2exp⁡(−12x′x)dxP(Y \le a) = \int_{Ax+\mu \le a} (2\pi)^{-n/2}\exp \left( -\frac{1}{2} x'x\right) dxP(Y≤a)=∫Ax+μ≤a​(2π)−n/2exp(−21​x′x)dx
假设YYY的密度函数为fY(y)f_Y(y)fY​(y),则
P(Y≤a)=∫y≤afY(y)dyP(Y \le a) = \int_{y \le a} f_Y(y)dyP(Y≤a)=∫y≤a​fY​(y)dy
计算fY(y)f_Y(y)fY​(y)的思路是对xxx的积分做积分换元,使积分域与对yyy的积分的积分域相同。积分换元公式只能处理用满秩的C1C^1C1变换换元的情况,考虑到Y=AX+μY = AX + \muY=AX+μ不是一个满秩的变换,我们可以把它补成满秩的。定义T=[A′,B′]′∈Rn×nT = [A',B']' \in \mathbb{R}^{n \times n}T=[A′,B′]′∈Rn×n,其中B∈R(n−m)×nB \in \mathbb{R}^{(n-m)\times n}B∈R(n−m)×n满足AB′=0,BB′=In−mAB'=0,\ BB' = I_{n-m}AB′=0, BB′=In−m​,记u1=Ax,u2=Bx,u=Txu_1 = Ax,u_2 = Bx,u=Txu1​=Ax,u2​=Bx,u=Tx,因为TTT是满秩的,因此x=T−1ux=T^{-1}ux=T−1u,Ax+μ≤a⇒u1+μ≤aAx + \mu \le a \Rightarrow u_1 + \mu \le aAx+μ≤a⇒u1​+μ≤a,
TT′=(AB)(A′B′)=diag(V,In−m)(TT′)−1=diag(V−1,In−m),det⁡(TT′)−1=det⁡(V−1)x′x=u′(TT′)−1u=u1′V−1u1+u2′u2det⁡(T−1)=(det⁡(T))−1=(det⁡(TT′))−1/2=(det⁡(V))−1/2TT' = \left( \begin{matrix} A \\ B \end{matrix} \right)\left( \begin{matrix} A' & B' \end{matrix} \right) = diag(V,I_{n-m})\\ (TT')^{-1} = diag(V^{-1},I_{n-m}),\ \det(TT')^{-1} = \det(V^{-1}) \\ x'x = u'(TT')^{-1}u = u_1'V^{-1}u_1 + u_2'u_2 \\ \det(T^{-1}) = (\det(T))^{-1} = (\det(TT'))^{-1/2} = (\det(V))^{-1/2}TT′=(AB​)(A′​B′​)=diag(V,In−m​)(TT′)−1=diag(V−1,In−m​), det(TT′)−1=det(V−1)x′x=u′(TT′)−1u=u1′​V−1u1​+u2′​u2​det(T−1)=(det(T))−1=(det(TT′))−1/2=(det(V))−1/2
根据积分换元公式,
P(Y≤a)=∫Ax+μ≤a(2π)−n/2exp⁡(−12x′x)dx=∫u1+μ≤a(2π)−n/2(det⁡(V))−1/2exp⁡(−12(u1′V−1u1+u2′u2))du=∫μ1+μ≤a(2π)−m/2(det⁡(V))−1/2exp⁡(−12u1′V−1u1)du1P(Y \le a) = \int_{Ax+\mu \le a} (2\pi)^{-n/2}\exp \left( -\frac{1}{2} x'x\right) dx \\ = \int_{u_1 + \mu \le a} (2\pi)^{-n/2}(\det(V))^{-1/2}\exp \left( -\frac{1}{2} (u_1'V^{-1}u_1 + u_2'u_2)\right) du \\ = \int_{\mu_1 + \mu \le a} (2\pi)^{-m/2}(\det(V))^{-1/2}\exp \left( -\frac{1}{2} u_1'V^{-1}u_1\right) du_1P(Y≤a)=∫Ax+μ≤a​(2π)−n/2exp(−21​x′x)dx=∫u1​+μ≤a​(2π)−n/2(det(V))−1/2exp(−21​(u1′​V−1u1​+u2′​u2​))du=∫μ1​+μ≤a​(2π)−m/2(det(V))−1/2exp(−21​u1′​V−1u1​)du1​
再做变换w=u1+μw = u_1 + \muw=u1​+μ,则上式可进一步化简,
RHS=∫w≤a(2π)−m/2(det⁡(V))−1/2exp⁡(−12(w−μ)′V−1(w−μ))dwRHS = \int_{w \le a} (2\pi)^{-m/2}(\det(V))^{-1/2}\exp \left( -\frac{1}{2} (w-\mu)'V^{-1}(w-\mu)\right) dwRHS=∫w≤a​(2π)−m/2(det(V))−1/2exp(−21​(w−μ)′V−1(w−μ))dw
根据一阶微分的唯一性,
fY(y)=(2π)−m/2(det⁡(V))−1/2exp⁡(−12(y−μ)′V−1(y−μ))f_Y(y) = (2\pi)^{-m/2}(\det(V))^{-1/2}\exp \left( -\frac{1}{2}(y-\mu)'V^{-1}(y-\mu) \right)fY​(y)=(2π)−m/2(det(V))−1/2exp(−21​(y−μ)′V−1(y−μ))

多元正态分布的矩

对于Y∼Nm(μ,V)Y \sim N_m(\mu,V)Y∼Nm​(μ,V),称μ\muμ是YYY的期望,VVV是YYY的协方差矩阵:
μ=EY,V=Var(Y)=Cov(Y,Y)=E((Y−μ)(Y−μ)′)\mu = EY,\ V =Var(Y) =Cov(Y,Y)= E((Y-\mu)(Y-\mu)')μ=EY, V=Var(Y)=Cov(Y,Y)=E((Y−μ)(Y−μ)′)
他们有如下性质:

  1. E[AX]=AE[X]E[AX] = AE[X]E[AX]=AE[X]
  2. E[AXB]=AE[X]BE[AXB] = AE[X]BE[AXB]=AE[X]B
  3. Var(AX)=AVar(X)A′Var(AX) = AVar(X)A'Var(AX)=AVar(X)A′
  4. Cov(AX,BY)=ACov(X,Y)B′Cov(AX,BY) = ACov(X,Y)B'Cov(AX,BY)=ACov(X,Y)B′

前两条就是期望的线性性,第三条是第四条的特例,在第四条中取B=A,Y=XB=A,Y=XB=A,Y=X即可,下面说一下第四条:
Cov(AX,BY)=E[(AX−AE[X])(BY−BE[Y])′]=E[AXY′B′]−AE[X]E[Y′]B′=A{E[XY′]−E[X]E[Y′]}B′=ACov(X,Y)B′Cov(AX,BY) = E[(AX-AE[X])(BY-BE[Y])'] \\ = E[AXY'B']-AE[X]E[Y']B' = A\{E[XY']-E[X]E[Y']\}B' = ACov(X,Y)B'Cov(AX,BY)=E[(AX−AE[X])(BY−BE[Y])′]=E[AXY′B′]−AE[X]E[Y′]B′=A{E[XY′]−E[X]E[Y′]}B′=ACov(X,Y)B′

条件分布

现在考虑多元正态分布性质2中的分块:
Y=(Y1′,Y2′)′,μ=(μ1′,μ2′)′,Y1,μ1∈Rr×1,Y2,μ2∈R(m−r)×1Y = (Y_1',Y_2')',\mu = (\mu_1',\mu_2')',Y_1,\mu_1 \in \mathbb{R}^{r \times 1},Y_2,\mu_2 \in \mathbb{R}^{(m-r) \times 1}Y=(Y1′​,Y2′​)′,μ=(μ1′​,μ2′​)′,Y1​,μ1​∈Rr×1,Y2​,μ2​∈R(m−r)×1,AA′=[V11V12V21V22]AA' = \left[ \begin{matrix} V_{11} & V_{12} \\ V_{21} & V_{22} \end{matrix} \right]AA′=[V11​V21​​V12​V22​​],V11∈Rr×r,V22∈R(m−r)×(m−r),V12∈Rr×(m−r),V21∈R(m−r)×rV_{11} \in \mathbb{R}^{r \times r},V_{22} \in \mathbb{R}^{(m-r)\times (m-r)},V_{12} \in \mathbb{R}^{r \times (m-r)},V_{21} \in \mathbb{R}^{(m-r) \times r}V11​∈Rr×r,V22​∈R(m−r)×(m−r),V12​∈Rr×(m−r),V21​∈R(m−r)×r,则
E[Y1∣Y2]=μ1+V12V22−1(Y22−μ2)Var(Y1∣Y2)=V11,2=V11−V12V22−1V11E[Y_1|Y_2] = \mu_1 + V_{12}V_{22}^{-1}(Y_{22} - \mu_2) \\ Var(Y_1|Y_2) = V_{11,2} = V_{11} - V_{12}V_{22}^{-1}V_{11}E[Y1​∣Y2​]=μ1​+V12​V22−1​(Y22​−μ2​)Var(Y1​∣Y2​)=V11,2​=V11​−V12​V22−1​V11​
其中V12V22V_{12}V_{22}V12​V22​被称为Y1Y_1Y1​关于Y2Y_2Y2​的回归系数阵,V11,2V_{11,2}V11,2​被称为条件协方差矩阵。这两个公式的推导不需要额外的技巧,思路是计算条件分布Y1∣Y2Y_1|Y_2Y1​∣Y2​即可,因为边缘密度和联合密度都有,所以按定义仔细计算就好。

独立性

对于随机向量XXX与YYY,称X,YX,YX,Y独立,如果
P(X<a,Y<b)=P(X<a)P(Y<b),∀a,bP(X<a,Y<b) = P(X < a)P(Y<b),\forall a,bP(X<a,Y<b)=P(X<a)P(Y<b),∀a,b
关于多元正态分布的独立性有如下性质:

  1. X∼N(0,In)X \sim N(0,I_n)X∼N(0,In​),Y=AX+μ,Z=BX+ν,AA′>0,BB′>0Y = AX + \mu,Z = BX + \nu,AA'>0,BB'>0Y=AX+μ,Z=BX+ν,AA′>0,BB′>0,则YYY与ZZZ独立的充要条件是AB′=0AB'=0AB′=0
  2. Y1Y_1Y1​与Y2Y_2Y2​互相独立的条件是V12=0V_{12}=0V12​=0

因为V12=Cov(Y1,Y2)V_{12} = Cov(Y_1,Y_2)V12​=Cov(Y1​,Y2​),所以第二条性质也是说明多元的情况下,独立性也是协方差为0的充分条件。这个性质比较明显,因为协方差为0保证在计算概率的时候可以使用Fubini定理。接受了这一点后再看性质1就会比较显然了,
Cov(Y,Z)=Cov(AX+μ,BX+ν)=Cov(AX,BX)=AB′Cov(Y,Z) = Cov(AX + \mu,BX+\nu) = Cov(AX,BX) = AB'Cov(Y,Z)=Cov(AX+μ,BX+ν)=Cov(AX,BX)=AB′
当AB′=0AB'=0AB′=0的时候协方差会等于0,因此二者独立。

UA MATH564 概率论VI 数理统计基础2 多元正态分布相关推荐

  1. UA MATH564 概率论VI 数理统计基础3 卡方分布上

    UA MATH564 概率论VI 数理统计基础3 卡方分布上 卡方分布 卡方分布的分布函数 中心化卡方分布 一般的卡方分布 卡方分布 这里给出卡方分布的一般性定义.假设X1,⋯,XnX_1,\cdot ...

  2. UA MATH564 概率论VI 数理统计基础3 卡方分布下 Cochran定理

    UA MATH564 概率论VI 数理统计基础3 卡方分布下 Cochran定理 多元正态随机变量二次型的分布 Cochran定理 这一讲介绍多元正态随机变量的二次型的相关性质以及非常常用的Cochr ...

  3. UA MATH564 概率论VI 数理统计基础3 卡方分布的正态近似

    UA MATH564 概率论VI 数理统计基础3 卡方分布的正态近似 卡方分布的正态近似 Gamma分布的正态近似 基于卡方分布的近似 基于指数分布的近似 在做UA MATH566 统计理论 QE练习 ...

  4. UA MATH564 概率论VI 数理统计基础5 F分布

    UA MATH564 概率论VI 数理统计基础5 F分布 假设X∼χm,δ2,Y∼χn2X \sim \chi^2_{m,\delta},Y \sim \chi^2_{n}X∼χm,δ2​,Y∼χn2 ...

  5. UA MATH564 概率论VI 数理统计基础4 t分布

    UA MATH564 概率论VI 数理统计基础4 t分布 t分布的定义 t分布的概率密度 t分布的性质 t分布的定义 假设X,YX,YX,Y互相独立,X∼N(δ,1)X \sim N(\delta,1 ...

  6. UA MATH564 概率论VI 数理统计基础3 卡方分布中

    UA MATH564 概率论VI 数理统计基础3 卡方分布中 卡方分布的基本性质 上一讲介绍了卡方分布的定义:假设X1,⋯,XnX_1,\cdots,X_nX1​,⋯,Xn​互相独立,并且Xi∼N(a ...

  7. UA MATH564 概率论VI 数理统计基础1

    UA MATH564 概率论VI 数理统计基础1 样本均值与样本方差 正态样本的均值与方差的性质 样本均值与样本方差 样本均值和样本方差是经常用到的两个统计量,大部分正态假设的统计模型均值和方差的OL ...

  8. UA MATH564 概率论 QE练习题3

    UA MATH564 概率论 QE练习题3 第一题 第二题 第三题 这是2015年1月的1-3题. 第一题 Part a Obvioulsy, EU=EW=0EU = EW = 0EU=EW=0, V ...

  9. UA MATH564 概率论 多元随机变量的变换 理论与应用2

    UA MATH564 概率论 多元随机变量的变换 几个例题 例5 X1,X2,X3∼iidEXP(λ)X_1,X_2,X_3 \sim_{iid} EXP(\lambda)X1​,X2​,X3​∼ii ...

最新文章

  1. 从未在一起更让人遗憾_我们从未在一起和我们最终没在一起,哪一个更让人难过?...
  2. [译][Tkinter 教程10] Text 控件
  3. 浅析网站维护优化的必要性!
  4. Lind.DDD.DynamicModules动态模块化的设计
  5. Python成长笔记 - 基础篇 (六)python模块
  6. 《从零开始学Swift》学习笔记(Day 55)——使用try?和try!区别
  7. php 取utc时间,得到UTC时间在PHP
  8. CSS多行显示省略号
  9. c语言python零基础教学_编程零基础应当如何开始学习 Python?
  10. 基于JAVA+Swing+MYSQL的汽车租赁系统
  11. Adobe Dreamweaver 2021下载与安装教程
  12. coji 编程机器人_娃喜欢就行—“编程机器人”COJI
  13. bp神经网络训练样本个数,bp神经网络训练时间
  14. forrtl: error (200): program aborting due to control-C event
  15. 解决谷歌浏览器最新chrome9+ 版本CORS跨域问题
  16. WSDM2021推荐系统论文集锦
  17. 批量更新mysql数据(万条数据秒完成)
  18. windows10 飞秋不能发送文件 防火墙设置
  19. android thumbnail获取图片,系统获取视频缩略图的getThumbnail()真的那么快吗?
  20. 关于CH375芯片的简介以及其与51单片机的连接

热门文章

  1. 代理模式——静态代理,动态代理(JDK代理和CGLib代理)
  2. shiro的QuickStart
  3. 进程与线程||线程应用:异步调用||多线程与单线程
  4. 类型转换与采样 || SMOTE算法
  5. [Unity3D]Script 脚本所有编译器属性详解
  6. 达梦数据库、oracle数据库如何判断指定表有没有建立索引?对应的表有没有索引查询方法
  7. stm32 systick定时器
  8. MATLAB 图像函数(第三章) 图像基本处理
  9. 差分形式的牛顿插值公式(理论)
  10. 题解 guP2421 【[NOI2002]荒岛野人】