高斯分布

高斯,也称为正态分布,在连续变量分布中是被广泛使用的模型。在单一变量x的情况下,高斯分布可以写成如下形式

其中μ是均值,σ2是方差。对一个D维向量x,多元高斯分布的形式为

其中μ是一个D维均值向量,Σ是DxD的协方差矩阵,并且|Σ|表示Σ的行列式。
高斯分布出现在许多不同的环境中和可以从各种不同的角度激发出来。例如,我们已经看到对于单一实变量,最大化熵的分布是高斯分布。这个属性也适用于多元高斯。
高斯分布出现的另一种情况是考虑多个随机变量之和。中心极限定理(由于拉普拉斯)告诉我们,在一定的条件下,一组随机变量的和(当然他们本身就是一个随机变量)具有这样的分布,随着项数的增加分布越来越接近高斯分布(Walker,1969)。我们考虑N个变量x1,, ,xn,每个都是区间[0,1]上的均匀分布,然后考虑平均值(x1 +···+ xn)/ N的分布。对于较大的N,这种分布趋于高斯分布,如图2.6。在实践中,随着N的增加收敛到高斯是非常迅速的。这一结果的后果是,二项式分(2.9),当N→∞(见图2.1N = 10)时趋向于高斯分布。

高斯分布有很多重要的分析属性,我们将考虑其中的几个细节。该部分是比之前的部分设计更多的技术,并且要求熟悉附录C中各种矩阵恒等式。但是,我们强烈鼓励读者熟练地使用这里的方法来处理高斯分布,因为这对于理解后面更复杂的模型是非常有帮助的。
我们首先考虑高斯分布的几何形式。x上高斯分布的函数依赖是二次形的:

Δ是从μ到x的马氏距离,并且当Σ是单位矩阵时它就降为欧氏距离。高斯分布在x空间的表面是常数,其中这个二次形是常数。
首先,因为任何反对称成分将从指数中消失,所以不失一般性,矩阵Σ是对称的。现在考虑协方差矩阵的特征向量方程

其中i=1,,,D。因为Σ是实数,对称矩阵,它的特征值将是实数,并且它的特征向量可以形成一个标准正交集,以便

其中,Iij是单位矩阵的i,j元素,且满足

协方差矩阵Σ可以表示为其特征向量形式的扩展

类似的逆协方差矩阵Σ-1可以表示为

将(2.49)代入到(2.44),二次形变为

我们已经定义了

我们可以将{yi}解释为相对于原始xi坐标平移旋转得到的正交矢量ui定义的新坐标系。形成了向量y=(y1,…,yD)T,我们有

其中U的行是uTi。从(2.46)可以得出U是正交矩阵,即它满足UUT= I,因此也UTU= I,其中I是单位矩阵。
二次形和高斯密度在表面上是常数,其中(2.51)是常数。如果所有特征值λi都是正的,那么这些表面表示椭球,他们的中心在μ,他们的轴沿着ui方向,并且轴方向的比例因子是,如图2.7。

对于很好的定义高斯分布,有必要对协方差矩阵的所有特征值λI要求为正,否则分布不能正确地归一化。特征值严格为正的矩阵叫做正定的。在第12章中,我们还会遇到高斯分布中特征值中一个或多个为零的情况,在这种情况下分布奇异的并被限制在较低维数的子空间。如果所有的特征值非负,则协方差矩阵被认为是半正定。
现在考虑由yi定义的新坐标系中的高斯分布形式。从x到y坐标系,我们有一个雅可比矩阵J且给定元素

其中,Uji是矩阵UT的元素。使用矩阵U的正交性,我们看到雅可比矩阵行列式的平方是

因此|J|=1。另外,协方差矩阵的行列式|Σ|可写作其特征值的乘积,因此

因此,在yj坐标系中,高斯分布的形式为

这是D个独立单变量高斯分布的乘积。特征向量定义了平移和旋转坐标的新集。 y坐标系统中的分布积分是

在这里,我们使用结果(1.48)用于单变量高斯的归一化。这证实了多元高斯(2.43)确实被归一化了。
我们现在看一下高斯分布,提供参数μ和Σ的解释。 高斯分布中x的期望由下式给出

其中用z=x-μ来改变变量。我们现在注意到,指数是z分量的偶函数,因为积分区间是(-∞,∞),(z+μ)项因为对称将消失。从而

因此我们用μ作为高斯分布的均值。
我们现在考虑高斯的二阶矩。在单变量的情况下,我们认为E[x2]给出二阶矩。对于多元高斯,E[xixj]给出D2个二阶矩,我们可以将他们组在一起形成矩阵E[xxT]。此矩阵可以写成

其中,我们再次使用z=x- μ来改变变量。注意,涉及的交叉项将再次因为对称性消失。μμT是常数并且可以被移到积分外,因为高斯分布归一化它本身是一个整体。考虑涉及zzT的项,我们可以使用(2.45)给出的协方差矩阵的特征向量扩展,以及特征向量的完整性得出


这里我们用特征向量式(2.45),加上中间行右手侧上的积分通过对称消失(除非i= j)。最后一行,我们利用结果(1.50)和(2.55),连同(2.48)。因此,我们有

对于单随机变量,我们取二阶矩之前减去均值以便定义方差。同样地,在多变量情况下,减去均值也是方便的,它产生一个随机向量x的协方差,该随机变量x定义为

对于高斯分布的特定情况,我们可以利用E[x]=μ,及结果(2.62)得到

由于参数矩阵Σ控制x的协方差,所以它被称为协方差矩阵。
虽然高斯分布(2.43)被广泛地用作密度模型,但它存在一些显著的局限性。考虑分布中自由参数的数目,一般对称协方差矩阵Σ将有D(D + 1)/ 2个独立参数,在μ中有D个独立参数,一共给出D(D + 3)/ 2个参数。对于较大的D,参数的总数是以D平方的方式增长,操作和求逆大型矩阵的计算任务令人望而却步。解决这个问题的一个方法是使用协方差矩阵的限制形式。如果我们考虑的协方差矩阵是对角的,使得,然后我们有2D个独立参数。常数密度对应的轮廓由轴对齐的椭圆给出。我们可以进一步限制协方差矩阵与单位矩阵成比例,Σ=σ2I称为各向同性协方差,给出D + 1个独立参数。一般情况,对角和各向同性协方差的三种可能矩阵示于图2.8。不幸的是,这样的方法限制分布中自由度的数目和使协方差矩阵的求逆更快,他们也极大地限制了概率密度形式并限制其捕捉数据中相互关系的能力。

高斯分布的另一个限制是,它本质上是单峰(即有一个最大值),因此不能对多峰分布提供良好的近似。因此,高斯分布既可以是灵活的(具有许多参数的情况),同时对分布的范围有太多限制。后面我们会看到,引进潜变量,也称为隐变量或不可观测变量,两个问题都可以解决。特别地,多峰分布族是通过引入离散潜变量(导致了高斯混合)得到的,如第2.3.9讨论的。同样,不断引进潜变量,如第12章,导致模型中自由参数的数目由数据空间的维数D独立控制,同时允许该模型捕捉数据集中主要的关系。实际上,这两种方法可以结合起来,并进一步延伸导出一套分层模型,从而能适应广泛的实际应用。例如,马尔可夫随机场的高斯版本(它被广泛地用作图像的概率模型)是像素强度联合空间上的高斯分布,但通过考虑反应像素空间组织的结构该问题变得容易处理。同样,线性动态系统用于建模时间序列数据(一些应用例如跟踪),也是潜在的大量观察数据和潜在变量的联合高斯分布,并且由于该结构也变得非常容易处理。表达复杂分布形式和性质的一个强有力框架是概率图模型,这将是
第8章的主题。

PRML-系列二之2.3相关推荐

  1. 搜索引擎ElasticSearchV5.4.2系列二之ElasticSearchV5.4.2+kibanaV5.4.2+x-packV5.4.2安装

    相关博文: 搜索引擎ElasticSearchV5.4.2系列一之ES介绍 搜索引擎ElasticSearchV5.4.2系列二之ElasticSearchV5.4.2+klanaV5.4.2+x-p ...

  2. 【C++自我精讲】基础系列二 const

    [C++自我精讲]基础系列二 const 0 前言 分三部分:const用法.const和#define比较.const作用. 1 const用法 const常量:const可以用来定义常量,不可改变 ...

  3. 人工智能算法通俗讲解系列(二):逻辑回归

    2019独角兽企业重金招聘Python工程师标准>>> 今天,我们介绍的机器学习算法叫逻辑回归.它英语名称是Logistic Regression,简称LR. 跟之前一样,介绍这个算 ...

  4. 【算法系列 二】Stack

    为什么80%的码农都做不了架构师?>>>    栈应用的场景: 1.括号问题 2.后缀表达式 3.深度优先遍历 4.保存现场 1. 给定字符串,仅由"()[]{}" ...

  5. 《CDN 之我见》系列二:原理篇(缓存、安全)

    2019独角兽企业重金招聘Python工程师标准>>> <CDN之我见>共由三个篇章组成,分为原理篇.详解篇和陨坑篇.本篇章适合那些从未接触过.或仅了解一些 CDN 专业 ...

  6. SEO系列二:何为用户体验?如何做好用户体验?

    昨天写了一篇<SEO系列一:SEO是什么?SEO有什么意义?>的文章,受到了汇道童鞋们的支持和鼓舞,周珍在这里和大家说声谢谢.甚至还有童鞋说期待我写到SEO系列2000,是否能写到2000 ...

  7. 一步步构建多层架构系列二之设计模式运用篇

    上节我们讲到数据对象创建的管理,那么如何管理数据访问类的对象创建呢?先从为什么需要设计模式的原理说起吧 为了更好的理解设计思想,我尽可能的用实例来演示推进.但随着需求的增加,程序将越来越复杂.此时就有 ...

  8. 机器学习入门系列二(关键词:多变量(非)线性回归,批处理,特征缩放,正规方程

    机器学习入门系列二(关键词:多变量(非)线性回归,批处理,特征缩放,正规方程) 目录(?)[+] 一多变量的线性回归 二批处理 三特征缩放 四正规方程 五多变量非线性回归 一.多变量的线性回归 在#机 ...

  9. 图层几何学 -- iOS Core Animation 系列二

    <图层树和寄宿图 -- iOS Core Animation 系列一>介绍了图层的基础知识和一些属性方法.这篇主要内容是学习下图层在父图层上怎么控制位置和尺寸的. 1.布局 首先看一张例图 ...

  10. 数学之美 系列二 -- 谈谈中文分词

    数学之美 系列二 -- 谈谈中文分词 2006年4月10日 上午 08:10:00 发表者: 吴军, Google 研究员 谈谈中文分词 ----- 统计语言模型在中文处理中的一个应用 上回我们谈到利 ...

最新文章

  1. 自动编码(Autoencoder)器异常检测(outlier detection)实战
  2. c# 线程,同步,锁
  3. wireshark合并多个文件_TEQC合并多个时段GPS RINEX文件
  4. 机房配电柜、配电箱在安装时应该注意哪些“禁忌”?
  5. LeetCode 45跳跃游戏46全排列
  6. deb和rpm文件安装
  7. 公司6:JrVue重用布局
  8. C/C assert()函数用法总结与注意事项
  9. ubuntu14.04安装git
  10. golang chan 探究
  11. java 百度地图 经纬度_Java百度地图经纬度纠偏
  12. 阶段5 3.微服务项目【学成在线】_day04 页面静态化_17-页面静态化-模板管理-GridFS研究-存文件...
  13. UltraEdit配置代码格式化工具astyle
  14. html 屏蔽广告显示,JS判断网页广告被屏蔽解,广告终结者、AdGuard插件判断并提示...
  15. STM32CubeMX配置DCMI+DMA之OV2640
  16. Java中静态方法的调用格式
  17. ClickHouse 数据插入、更新与删除操作 SQL
  18. 国内固定电话和传真的正则表达式
  19. 红米机器人倒地_红米出现一个小人维修android机器人
  20. 大学计算机学院操行表个人小结,大学生操行鉴定表个人总结

热门文章

  1. connect.js源码解析
  2. python执行shell命令
  3. Custom Looks using Qt Style Sheets
  4. 重新想象 Windows 8.1 Store Apps (85) - 警报通知(闹钟), Tile 的新特性
  5. Serverless 实战 —— 前端也可以快速开发一个 Puppeteer 网页截图服务
  6. 十分钟教会你原生JS压缩图片,极其精简版
  7. Linux设置 cockpit 自动开机启动
  8. 解决ERROR 1396 (HY000): Operation ALTER USER failed for root@localhost
  9. MySQL故障检测_mysql主从故障检测处理脚本
  10. java拷贝文件夹和删除文件夹