摘要

高斯分布被誉为"上帝的分布", 其强悍的建模能力和优美的数学性质使得高斯分布在现实中得到广泛的应用. 由中心极限定理

我们知道, 大量独立同分布的随机变量的均值在做适当标准化之后会依分布收敛于高斯分布, 这使得高斯分布具有普适性的建模能力. 数学上, 当使用高斯分布对贝叶斯推断的似然和先验进行建模时, 得到的后验同样为高斯分布, 即其具有共轭先验性质. 在随机过程理论中, 多元高斯分布则是高斯过程的理论基础. 这种种场景使得高斯分布颇受重视, 并发展出一套成熟完整的理论体系. 本文主要介绍多元高斯分布的由来与其背后的几何原理, 分为如下章节:

阐述多元标准高斯分布;

由多元标准高斯分布导出多元高斯分布;

阐述多元高斯分布的几何意义;

总结.

关键词: 多元高斯分布, 高斯过程, 概率论与数理统计, 机器学习

校对:@叶定南,@Towser,@Syous

编者按: 评论区中,@Towser 和@Syous 两位大神对多元高斯分布有非常深刻的见解和讨论.

多元标准高斯分布

熟悉一元高斯分布的同学都知道, 若随机变量

, 则有如下的概率密度函数

而如果我们对随机变量

进行标准化, 用

对(1)进行换元, 继而有

此时我们说随机变量

服从一元标准高斯分布, 其均值

, 方差

, 其概率密度函数为

需要注意的是, 为了保证概率密度函数在

上的积分为1, 换元时需要求

, 从而得到(3).

随机变量

标准化的过程, 实际上的消除量纲影响和分布差异的过程. 通过将随机变量的值减去其均值再除以标准差, 使得随机变量与其均值的差距可以用若干个标准差来衡量, 从而实现了不同随机变量与其对应均值的差距, 可以以一种相对的距离来进行比较.

一元标准高斯分布与我们讨论多元标准高斯分布有什么关系呢? 事实上, 多元标准高斯分布的概率密度函数正是从(4)导出的. 假设我们有随机向量

, 其中

彼此独立, 即随机向量中的每个随机变量

都服从标准高斯分布且两两彼此独立. 则由(4)与独立随机变量概率密度函数之间的关系, 我们可得随机向量

的联合概率密度函数为

我们称随机向量

, 即随机向量服从均值为零向量, 协方差矩阵为单位矩阵的高斯分布. 在这里, 随机向量

的协方差矩阵是

组成的矩阵, 即

由于随机向量

, 所以其协方差矩阵的对角线元素为1, 其余元素为0. 如果我们取常数

, 则可得函数

的等高线为

, 当随机向量

为二维向量时, 我们有

由(7)我们可知, 其等高线为以(0, 0)为圆心的同心圆.

二元标准高斯分布概率密度函数图多元高斯分布

由上一节我们知道, 当随机向量

时, 其每个随机变量

彼此独立, 我们可通过(4)与独立随机变量概率密度函数之间的关系得出其联合概率密度函数(5). 那对于普通的随机向量

, 即其每个随机变量

彼此不独立的情况下, 我们该如何求随机向量

的联合概率密度函数呢? 一个很自然的想法是, 如果我们能通过线性变换, 使得随机向量

中的每个随机变量彼此独立, 则我们也可以通过独立随机变量概率密度函数之间的关系求出其联合概率密度函数. 事实上, 我们有如下定理可完成这个工作

定理1: 若存在随机向量

, 其中

为均值向量,

半正定实对称矩阵为

的协方差矩阵, 则存在满秩矩阵

, 使得

, 而

.

有了定理1, 我们就可以对随机向量

做相应的线性变换, 使其随机变量在线性变换后彼此独立, 从而求出其联合概率密度函数, 具体地

由多元函数换元变换公式, 我们还需要求出雅可比行列式

, 由(8)可得

由(9)(10), 我们可进一步得

我们得到随机向量

的联合概率密度函数为

在(12)中, 随机向量

的协方差矩阵还未得到体现, 我们可通过线性变换(8)做进一步处理

我们发现, (12)中

就是线性变换前的随机向量

的协方差矩阵

, 所以由(12)(13), 我们可以得到联合概率密度函数的最终形式

原本由定理1, 我们还需要求线性变换矩阵

, 才能确定随机向量

的联合概率密度函数的表达式, 现在由(13)我们即可得最终形式(14), 随机向量

的联合概率密度函数由其均值向量

和其协方差矩阵

唯一确定, 但我们需要明白的是, 这是通过定理1的线性变换

得到的, 即此线性变换隐含其中.

如果我们取常数

, 则可得函数

的等高线为

, 当随机向量

为二维向量时, 我们对协方差矩阵

进行分解, 因为其为实对称矩阵, 可正交对角化

由于矩阵

是酉矩阵, 所以

可以理解为将随机向量

, 均值向量

在矩阵

的列向量所组成的单位正交基上进行投影并在该单位正交基上进行相减. 我们不妨记投影后的向量分别为

, 同时记矩阵

, 则(15)的二次型可表示为

由(16)我们可知, 此时函数

的等高线是在矩阵

的列向量所组成的单位正交基上的一个椭圆, 椭圆的中心是

, 长半轴为

, 短半轴为

.

如果协方差矩阵

不是对角矩阵, 则正交对角化得到的酉矩阵

不是标准正交基, 其代表一个旋转, 此时的椭圆应该是一个倾斜的椭圆, 随机向量

中的随机变量不是彼此独立的;

倾斜椭圆-二元高斯分布概率密度函数图

如果协方差矩阵

是对角矩阵, 则正交对角化得到的酉矩阵

就是标准正交基, 则前述的投影是在标准正交基上完成的, 此时的椭圆应该是一个水平的椭圆, 随机向量

中的随机变量就是彼此独立的.

水平椭圆-二元高斯分布概率密度函数图多元高斯分布的几何意义

现在我们知道, 随机向量

的联合概率密度函数是通过线性变换

的帮助, 将随机向量

的各个随机变量去相关性, 然后利用独立随机变量概率密度函数之间的关系得出的, 亦既是定理1所表述的内容. 那具体地, 线性变化

是怎么去相关性使随机向量

的各个随机变量彼此独立的呢? 我们不妨在二维平面上, 再次由定理1和(15)出发来看看这个去相关性的过程.

由定理1我们有

再由(15)(17)可得

由(18)我们已经可以非常明显地看出线性变换

的具体操作了

我们先对标准正交基进行拉伸, 横轴和纵轴分别拉伸

倍, 再使用酉矩阵

对拉伸后的正交基进行旋转, 最后将去均值的随机向量

在新的正交基上进行投影, 从而使完成线性变换

后的随机变量在新的正交基上彼此独立. 值得注意的是, 如果随机向量

本来就是独立随机变量组成的, 此时其协方差矩阵是一个对角矩阵, 则酉矩阵

是一个单位矩阵

, 此线性变换中只有拉伸而没有旋转.

多元高斯分布随机变量去相关性图

而如果我们只保留

这个投影后坐标轴长度较长的对应的坐标, 我们就可以达到将随机向量

进行降维的效果, 而这, 就是所谓的PCA(principal component analysis, 主成分分析).

总结

本文从多元标准高斯分布出发, 阐述了如何通过线性变换, 将任意的服从多元高斯分布的随机向量去相关性, 并求出其联合概率密度函数的过程, 最后给出了线性变换的具体过程阐述. 多元高斯分布是许多其他理论工具的基础, 掌握它是进行其他相关理论研究的关键.

引用

[1] Wikipedia contributors. "中心极限定理."维基百科, 自由的百科全书. 维基百科, 自由的百科全书, 9 May 2018. Web. 9 May 2018.‹https://zh.wikipedia.org/w/index.php?title=%E4%B8%AD%E5%BF%83%E6%9E%81%E9%99%90%E5%AE%9A%E7%90%86&oldid=49494817›.

[2] Do, C. (2008).The Multivariate Gaussian Distribution. [online] Cs229.stanford.edu. Available at:http://cs229.stanford.edu/section/gaussians.pdf [Accessed 13 Mar. 2019].

[3] 张, 伟. (2019). 多元正态分布. [online] Staff.ustc.edu.cn. Available at:http://staff.ustc.edu.cn/~zwp/teach/MVA/Lec4_slides.pdf [Accessed 13 Mar. 2019].

[4] Wikipedia contributors. "多元正态分布."维基百科, 自由的百科全书. 维基百科, 自由的百科全书, 16 Sep. 2018. Web. 16 Sep. 2018.‹https://zh.wikipedia.org/w/index.php?title=%E5%A4%9A%E5%85%83%E6%AD%A3%E6%80%81%E5%88%86%E5%B8%83&oldid=51304757›.

[5] Wikipedia contributors. "雅可比矩阵."维基百科, 自由的百科全书. 维基百科, 自由的百科全书, 7 Dec. 2018. Web. 7 Dec. 2018.‹https://zh.wikipedia.org/w/index.php?title=%E9%9B%85%E5%8F%AF%E6%AF%94%E7%9F%A9%E9%98%B5&oldid=52294204›.

php 高斯分布,多元高斯分布完全解析相关推荐

  1. 一元高斯分布多元高斯分布高斯过程混合高斯模型

    高斯分布,又称正态分布,应用于连续型随机变量分布的模型中,对于多元高斯分布存在和一元高斯相似的,对于多元实值向量,使熵取得最大值的是高斯分布.当多个随机变量之和相加时,根据拉普拉斯提出的中心极限定理( ...

  2. 第二课.多元高斯分布与其几何特征

    目录 多元高斯分布 一元高斯与多元高斯 多元高斯分布的参数 二元高斯分布 多元高斯分布的几何特征 几何特征 实例演示 多元高斯分布 一元高斯与多元高斯 在第一课的一元高斯分布中,处理的是一组样本X=( ...

  3. 多元函数的向量表示_多元高斯分布完全解析

    摘要 高斯分布被誉为"上帝的分布", 其强悍的建模能力和优美的数学性质使得高斯分布在现实中得到广泛的应用. 由中心极限定理 我们知道, 大量独立同分布的随机变量的均值在做适当标准化 ...

  4. 高斯分布、多维高斯分布、各向同性的高斯分布及多元高斯分布之间的KL散度

    转自:https://www.cnblogs.com/jiangkejie/p/12939776.html 高斯分布是一类非常重要的概率分布,在概率统计,机器学习中经常用到. 一维高斯分布 一维高斯分 ...

  5. 机器学习导论(张志华):多元高斯分布

    前言 这个笔记是北大那位老师课程的学习笔记,讲的概念浅显易懂,非常有利于我们掌握基本的概念,从而掌握相关的技术. 正文 这节课主要讲的是常用统计分布里的多元高斯分布. 高斯分布的相关定义延申后可以直接 ...

  6. 多元高斯分布(Multivariate Gaussian Distribution)

    from:https://www.jianshu.com/p/d6c8ca915f69 还是对计算机的监测,我们发现CPU负载和占用内存之间,存在正相关关系. CPU负负载增加的时候占用内存也会增加: ...

  7. 异常检测: 多元高斯分布

    异常检测: 多元高斯分布 参考文章: (1)异常检测: 多元高斯分布 (2)https://www.cnblogs.com/yan2015/p/7406904.html (3)https://www. ...

  8. 多元高斯分布的边缘概率和条件概率

    0. 多元高斯分布 假定一个 nn 维的随机变量 x=[x1x2]∼N(μ,Σ)\mathrm x=\begin{bmatrix}\mathrm x_1\\ \mathrm x_2\end{bmatr ...

  9. 多元高斯分布及多元条件高斯分布

    高斯那些公式 已知 DD 维向量 x\mathbf {x},其高斯概率分布为: N(x|μ,Σ)==1(2π)D/21|Σ|1/2exp(−12(x−μ)TΣ−1(x−μ))1|Σ|(2π)D−−−− ...

  10. 多元高斯分布是非参_(二)多元高斯分布与概率图条件独立性假设

    Author: Pan Date:    2020/7/15 首先,我们通过随机向量的介绍来引出多元高斯分布,通过多元高斯分布,我们将介绍概率图的条件独立性假设. 先快速过一遍随机向量: 1.随机向量 ...

最新文章

  1. java用for循环查询数据_使用for循环结果创建数据框
  2. Vue+Flask看这篇就够了
  3. 块状元素、内联元素和内联块状元素
  4. 常用的Linux命令合集,建议收藏保存!
  5. java 求数组最大子序列之和
  6. SAP Spartacus应用启用时导入的一些模块
  7. oracle11g系统初始化意义,Oracle11G 初始化脚本
  8. 【转】Android 基于Socket的聊天室
  9. OpenCV_(Using GrabCut extract the foreground object) 使用 GrabCut 算法提取前景物体
  10. xml存储数据 优缺点_Python大神都是这样处理xml文件的!
  11. ubuntu字符界面login_关于Ubuntu循环登陆界面
  12. root 红米note5_小米 红米NOTE5_刷机助手root-Android手机一键ROOT工具 - 线刷宝官网...
  13. 如何使用码云Gitee上传本地项目
  14. 本地通过secureCRT连接虚拟机中CentOS7
  15. matlab中gain是什么,PID调理中的GAIN是啥意思?
  16. 尚学堂JAVA高级学习笔记_2/2
  17. linux磁盘列阵和文件系统
  18. android als传感器,环境光传感器(ALS)背光控制解决方案
  19. 修改Android“长按”的反应时间
  20. [阅读体会] 学习OpenCV 3 (Learning OpenCV 3)

热门文章

  1. SEGGER调试软件
  2. html实现下载功能(两种方式)
  3. 数据库建模工具Pdman
  4. Ricequant米筐金工——因子分析
  5. Ricequant-估值因子的分析
  6. 图片验证码实现的几种方式
  7. 居然可以一键删除微博内容
  8. c语言实现滑动窗口类,C语言模拟滑动窗口协议
  9. 易接SDK ios9以上无法弹出充值界面的一种情况
  10. matlab利用经纬度计算距离_【MATLAB】经纬度换算距离