文章目录

  • 协方差矩阵
    • 协方差
    • 协方差矩阵
  • 多元正态分布
    • 协方差矩阵的特征值分解

协方差矩阵

协方差

在统计学中,方差用来度量单个随机变量的离散程度,而协方差用来刻画两个随机变量的相似程度,方差的计算公式
σx2=1n−1∑in(xi−xˉ)\sigma_x^2=\cfrac{1}{n-1}\sum\limits_i^n(x_i-\bar{x})σx2​=n−11​i∑n​(xi​−xˉ)
其中 nnn 表示样本数,xˉ\bar{x}xˉ 表示观测样本的均值。
协方差的计算公式定义为:
σ(x,y)=1n−1∑i=1n(xi−xˉ)(yi−yˉ)\sigma(x,y)=\cfrac{1}{n-1}\sum\limits_{i=1}^n(x_i-\bar{x})(y_i-\bar{y})σ(x,y)=n−11​i=1∑n​(xi​−xˉ)(yi​−yˉ​)
在公式中,xˉ,yˉ\bar{x},\bar{y}xˉ,yˉ​分别表示两个随机变量对应的观测样本均值。
可以发现:

方差 σx2\sigma_x^2σx2​ 可视作随机变量 xxx 关于自身的协方差。

协方差矩阵

给定一个ddd维随机向量x=(x1,x2,⋯,xd)x=(x_1,x_2,\cdots,x_d)x=(x1​,x2​,⋯,xd​),则
σ(xm,xk)=1n−1∑i=1n(xmi−xˉm)(xki−xˉk)\sigma(x_m,x_k)=\cfrac{1}{n-1}\sum\limits_{i=1}^n(x_{mi}-\bar{x}_m)(x_{ki}-\bar{x}_k)σ(xm​,xk​)=n−11​i=1∑n​(xmi​−xˉm​)(xki​−xˉk​)
协方差矩阵为:
Σ=[σ(x1,x1)⋯σ(x1,xd)⋮⋱⋮σ(xd,x1)⋯σ(xd,xd)]\Sigma= \begin{bmatrix} \sigma(x_1,x_1) & \cdots & \sigma(x_1,x_d) \\ \vdots & \ddots & \vdots\\ \sigma(x_d,x_1) & \cdots & \sigma(x_d,x_d) \end{bmatrix} Σ=⎣⎢⎡​σ(x1​,x1​)⋮σ(xd​,x1​)​⋯⋱⋯​σ(x1​,xd​)⋮σ(xd​,xd​)​⎦⎥⎤​
根据上述协方差矩阵的定义,矩阵Σ\SigmaΣ为对称矩阵(symmetric matrix),其大小为 d×dd\times dd×d。

多元正态分布

假设一个向量xxx服从均值向量为μ\muμ的均值向量、协方差矩阵为Σ\SigmaΣ的多元正态分布(multi-variable Gaussian distribution),则
p(x)=∣2πΣ∣−12exp⁡(−12(x−μ)TΣ−1(x−μ))p(x)=\vert{2\pi\Sigma}\rvert^{-\frac{1}{2}}\exp(-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu))p(x)=∣2πΣ∣−21​exp(−21​(x−μ)TΣ−1(x−μ))

令均值向量μ=0\mu=0μ=0,指数前的系数 ∣2πΣ∣−12\vert{2\pi\Sigma}\rvert^{-\frac{1}{2}}∣2πΣ∣−21​为常数项,所以有
p(x)∝exp⁡(−12xTΣ−1x)p(x)\propto \exp(-\frac{1}{2}x^T\Sigma^{-1}x)p(x)∝exp(−21​xTΣ−1x)

令xxx为二维随机向量x=(x1,x2)x=(x_1,x_2)x=(x1​,x2​),其协方差矩阵为单位矩阵 I2I_2I2​,则x1x_1x1​和x2x_2x2​的方差均为1,生成的散点图如下:

对于每个随机数,似然为:
L∝exp⁡(−12xTx)\mathcal{L}\propto\exp(-\cfrac{1}{2}x^Tx)L∝exp(−21​xTx)
对图1的点进行一个线性变换:t=Axt=Axt=Ax,得到图2:

在上述变换中,矩阵AAA称为变换矩阵(transformation matrix),将变换矩阵分解为两个矩阵。
尺度矩阵(scaling matrix):
S=[s100s2]=[10012]S=\begin{bmatrix}s_1 & 0 \\ 0 & s_2\end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & \frac{1}{2}\end{bmatrix}S=[s1​0​0s2​​]=[10​021​​]
旋转矩阵(rotation matrix):
R=[cos⁡θ−sin⁡θsin⁡θcos⁡θ]=[cos⁡π6−sin⁡π6sin⁡π6cos⁡π6]=[32−121232]R=\begin{bmatrix} \cos{\theta} & -\sin{\theta} \\ \sin{\theta} & \cos{\theta} \end{bmatrix}=\begin{bmatrix} \cos{\frac{\pi}{6}} & -\sin{\frac{\pi}{6}} \\ \sin{\frac{\pi}{6}} & \cos{\frac{\pi}{6}} \end{bmatrix}=\begin{bmatrix} \frac{\sqrt{3}}{2} & -\frac{1}{2} \\ \frac{1}{2} &\frac{\sqrt{3}}{2} \end{bmatrix}R=[cosθsinθ​−sinθcosθ​]=[cos6π​sin6π​​−sin6π​cos6π​​]=[23​​21​​−21​23​​​]

其中θ\thetaθ为逆时针旋转的度数。

变换矩阵、尺度矩阵和旋转矩阵的关系:A=RSA=RSA=RS

A=RS=[32−141234]A=RS=\begin{bmatrix} \frac{\sqrt{3}}{2} & -\frac{1}{4} \\ \frac{1}{2} &\frac{\sqrt{3}}{4} \end{bmatrix}A=RS=[23​​21​​−41​43​​​]

经过线性变换 t=Axt=Axt=Ax,ttt的分布:
将x=A−1tx=A^{-1}tx=A−1t 带入似然 L(x)\mathcal{L}(x)L(x)
L∝exp⁡(−12(A−1t)T(A−1t))=exp⁡(−12tT(ATA)−1t)\mathcal{L}\propto\exp(-\cfrac{1}{2}(A^{-1}t)^T(A^{-1}t))\\ =\exp(-\cfrac{1}{2}t^T(A^TA)^{-1}t)L∝exp(−21​(A−1t)T(A−1t))=exp(−21​tT(ATA)−1t)
可得,多元正态分布的协方差矩阵:
Σ=AAT=[131633163316716]\Sigma=AA^T=\begin{bmatrix} \frac{13}{16} & \frac{3\sqrt{3}}{16} \\ \frac{3\sqrt{3}}{16} &\frac{7}{16} \end{bmatrix}Σ=AAT=[1613​1633​​​1633​​167​​]

协方差矩阵的特征值分解

对于实对称矩阵Σ\SigmaΣ,必相似于对角矩阵,即存在可逆矩阵P,满足:
Σ=PΛPT\Sigma=P\Lambda P^TΣ=PΛPT
PPP的每一列为相互正交的特征向量,Λ\LambdaΛ为对角矩阵,特征值从大到小排列。

上述对称矩阵的分解可得:
Σ=(PΛ1/2)(PΛ1/2)T=AAT=(RS)(RS)T\Sigma=(P\Lambda^{1/2})(P\Lambda^{1/2})^T=AA^T=(RS)(RS)^TΣ=(PΛ1/2)(PΛ1/2)T=AAT=(RS)(RS)T
可得:
P=R=[cos⁡θ−sin⁡θsin⁡θcos⁡θ]=[32−121232]P=R=\begin{bmatrix} \cos{\theta} & -\sin{\theta} \\ \sin{\theta} & \cos{\theta} \end{bmatrix}=\begin{bmatrix} \frac{\sqrt{3}}{2} & -\frac{1}{2} \\ \frac{1}{2} &\frac{\sqrt{3}}{2} \end{bmatrix}P=R=[cosθsinθ​−sinθcosθ​]=[23​​21​​−21​23​​​]
Λ=SST=[s1200s22]=[10014]\Lambda=SS^T=\begin{bmatrix}s_1^2 & 0 \\ 0 & s_2^2 \end{bmatrix}=\begin{bmatrix}1 & 0 \\ 0 & \frac{1}{4}\end{bmatrix}Λ=SST=[s12​0​0s22​​]=[10​041​​]

所以,多元正态分布得概率密度由协方差矩阵的特征向量控制旋转(rotation),特征值控制尺度(scale),均值向量控制概率密度的均值。

关于矩阵在线性变换的理解,见下篇博客。

如何直观地理解「协方差矩阵」?

协方差矩阵与多元正态分布相关推荐

  1. UA MATH564 概率论VI 数理统计基础2 多元正态分布

    UA MATH564 概率论VI 数理统计基础2 多元正态分布 矩母函数 概率密度 多元正态分布的矩 条件分布 独立性 抽样分布简单地说就是统计量服从的分布,正态分布时最常用的总体分布,因此研究正态总 ...

  2. numpy笔记整理 multivariate_normal(多元正态分布采样)

    1 基本用法 np.random.multivariate_normal(mean, cov, size=None, check_valid=None, tol=None) 根据均值和协方差矩阵的情况 ...

  3. 两个多元正态分布的KL散度、巴氏距离和W距离

    ©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 追一科技 研究方向 | NLP.神经网络 正态分布是最常见的连续型概率分布之一.它是给定均值和协方差后的最大熵分布(参考<&quo ...

  4. 多元正态分布的极大似然估计

    多元正态分布的极大似然估计 1. 一元正态分布的密度函数 一元正态分布的密度函数表示为: f ( x ) = 1 ( 2 π ) σ e − ( x − μ ) 2 2 σ 2 f(x) = \fra ...

  5. 多元高斯分布是非参_多元高斯分布(多元正态分布)简介

    多元高斯分布(多元正态分布)简介 标签:#正态分布##统计基础##高斯分布# 时间:2017-01-28 23:02:43 作者:小木 高斯分布(Gaussian Distribution),也称作是 ...

  6. 【ML学习笔记】17:多元正态分布下极大似然估计最小错误率贝叶斯决策

    简述多元正态分布下的最小错误率贝叶斯 如果特征的值向量服从d元正态分布,即其概率密度函数为: 即其分布可以由均值向量和对称的协方差矩阵 唯一确定. 如果认为样本的特征向量在类内服从多元正态分布: 即对 ...

  7. 机器学习(十六)——多元正态分布(The multivariate normal distribution)

    原文:http://cs229.stanford.edu/notes/cs229-notes2.pdf n维的多元正态分布,也称为多元高斯分布,是用均值向量和协方差矩阵参数化的,其中Σ≥0是对称的和正 ...

  8. 多元正态分布(Multivariate normal distribution)

    多元正态分布(Multivariate normal distribution) 前言 我们通常讨论正态分布都是在一元(univariate)的情况下,相信下面的定义大家都很熟悉了:假设随机变量XXX ...

  9. 【应用多元统计分析】CH3 多元正态分布

    目录 一.多元正态分布的定义 1.定义 2.二元正态分布 二.多元正态分布的性质 [property1*] [property2] [property3] [property4] [property5 ...

最新文章

  1. Codeforces Round #550 (Div. 3)E. Median String
  2. Excel财务报表制作技巧与综合案例操作
  3. 获取有效工作日封装类(原创)
  4. svchost.exe介绍
  5. CentOS 7 使用Google-Authenticator进行多因素认证
  6. 绝望:对不完的数,加不完的班
  7. 大部分Intel hardware intrinsic 将在 .NET Core 2.1 中启用
  8. 银行业务队列简单模拟Java程序设计_PTA 数据结构 银行业务队列简单模拟
  9. JavaScript 验证 API中的setCustomValidity()方法
  10. matlab lu分解求线性方程组_线性代数10——矩阵的LU分解
  11. Jensen不等式/琴生不等式的证明 数学归纳法
  12. 万能地图下载器如何下载屏幕之外的谷歌卫星地图
  13. 常用web服务器:状态监控status页面
  14. 订阅号做了77天,没有挣钱,但是收获很多。
  15. PTA 7-2 不变初心数(15分)思路简单
  16. 操作系统13章(个人笔记)
  17. 如何把数据导入数据库
  18. 《绝地求生》玩家排名预--2.问题分析
  19. 主动降噪耳机哪个牌子性价比最高?千元内主动降噪耳机推荐
  20. 绘画教程:女生伤心眼泪、哭泣表情的画法技巧

热门文章

  1. 很细的项目部署上线流程(一)服务器搭建环境从0开始,Linux安装JDK安装nginx部署ssl证书安装git安装node安装pm2安装maven
  2. java调用C或者C++动态库dll
  3. 自由浏览播放不了html5,囤货备战剁手节!360安全浏览器“抢货快”三招玩爽双十一...
  4. SpringBoot系列教材 (十三)- 持久层支持 - springboot中如何运用JPA,简单例子
  5. 2022 年江西省职业院校技能大赛高职组信息安全管理与评估赛题 02
  6. SSM-下(拉勾教育后台管理系统-前端)
  7. CountDownTimer使用心得及总结
  8. 2023年CBD地产研究报告
  9. 【OJ - 基础数学】求1+2+3+...+n(不能使用乘除法、for、while、if、else、switch、case等关键字及条件判断语句)
  10. 【长句分析】2019.7.31