1.高斯混合模型是由若干的基于高斯概率密度函数形成的模型

2.从几何角度,GMM是多个高斯分布叠加而成的加权平均的结果

3.从混合模型角度,每个样本是从某个高斯分布抽样得到的

4.直接利用MLE无法求解高斯混合模型,得利用EM算法求解GMM

5.假设K个高斯分布组成的GMM,求解参数有3K个:每个高斯分布的抽样概率,每个高斯分布的均值协方差矩阵

高斯混合模型,英文是Gaussian Mixture Model,简称GMM。它是一个将事物分解为若干的基于高斯概率密度函数形成的模型,属于生成模型。

两个角度看GMM

我们可以从两个角度来理解GMM,第一个角度是几何角度,从这个角度看,GMM是多个高斯分布叠加而成的加权平均的结果。

假设由k个高斯分布叠加而成,某个样本x的概率分布为:

举一个例子

假设x是一维的数据,XX属于样本,红色曲线是真实的概率密度函数,对这些样本建模,可以生成两个高斯分布,对应两条概率密度蓝色曲线.

第二个角度是混合模型角度,它假设样本是从不同k个高斯分布生成的,每个样本是从某个高斯分布抽样得到的,抽中这K个高斯分布的概率不一样,我们用一个隐变量定义这种抽样概率大小,其是服从某种概率分布的离散随机变量

Z Z1 Z2 ...... Zk
P p1 p2 ...... pk

显然,

生成过程分四步:选定某个状态隐变量Z;从该隐变量对应的高斯分布随机生成一个样本;重复上述过程m次;得到一共m个样本,这m个样本来自这K个高斯分布。

用概率图模型表示为:

我们求解一个样本的概率分布

可见,与几何角度是一致的,权值就是隐变量的取值概率。

这里需要提出一点的是,任意一个样本x都可以属于K个高斯分布。我们把x归类为概率更高的那个隐变量对应的高斯分布。

比如下面是一个二维的高斯混合模型:

该模型由两个高斯分布混合而成,对于蓝色样本,它既可以从C1高斯分布抽样得到,又可以属于C2高斯分布抽样得到,显然,属于C1的概率更好,我们就认为该样本是从C1抽样的。

MLE求解GMM

如果有一堆样本x,我们希望求解GMM的参数。上一小节我们用p(x)表示一个样本的概率分布,这节我们用来表示m个样本的联合概率分布,构造似然函数:

应用MLE,最后要求解的参数是:

这种形式MLE无能为力,无法求得其参数解。需要用到EM算法

EM算法求解GMM

这节我们看看EM算法是如何求解GMM模型的。

注:传送门——EM算法

Em算法迭代公式:

  • E-step

高斯混合模型中,z是离散变量,于是我们有:

又因为

因此,Q可以化简为:

又因为

最终我们得到Q的表达式:

  • M-step

前面我们求出了期望,也就是求得隐变量的后验,我们要基于此,求解下一组参数:

说明:后验的参数均为第t次迭代结果,已知(红色框)

我们改写一下,可得:

求解pk,转为最优化问题:

构造拉格朗日乘子:

对pk求导并置为0:

从而

我们得到pk的迭代公式。

同样我们对均值和协方差构造拉格朗日函数求解,最终解得:

至此,GMM模型求解完成。

混合高斯模型_高斯混合模型(GMM)相关推荐

  1. 混合高斯模型_大数据小白入门高斯混合模型(GMM)聚类算法

    导读 高斯混合模型(Gaussian Mixture Model)通常简称GMM,是一种业界广泛使用的聚类算法,属于生成式模型,它假设所有的数据样本都是由某一个给定参数的 多元高斯分布 所生成的.从中 ...

  2. 详解EM算法与混合高斯模型(Gaussian mixture model, GMM)

    最近在看晓川老(shi)师(shu)的博士论文,接触了混合高斯模型(Gaussian mixture model, GMM)和EM(Expectation Maximization)算法,不禁被论文中 ...

  3. 语音识别学习日志 2019-7-14 语音识别基础知识准备2 {EM算法与混合高斯模型(Gaussian mixture model, GMM)}

    https://blog.csdn.net/lin_limin/article/details/81048411会对GMM和EM做详细介绍 本文参考: http://www.ituring.com.c ...

  4. 朴素贝叶斯高斯模型_从零开始实现高斯朴素贝叶斯独立贝叶斯模型

    朴素贝叶斯高斯模型 "Why is Google censuring me?!" Claire asked (true story). Sure, she's always bee ...

  5. eview面板数据之混合回归模型_【视频教程】Eviews系列25|面板数据回归分析之Hausman检验及本章常见问题解答...

    点击上方关注我们! 本期我们学习Eviews统计建模最后一部分--面板数据回归分析Hausman检验及本章常见问题解答.实操:Hausman检验判断是固定效应模型还是随机效应模型上期我们讲到模型判断若 ...

  6. python连接高斯数据库_高斯数据库安装

    GaussDB 100单机安装 For 手工建库 一.安装环境准备 1.部署架构规划 GaussDB 100单机部署的总体架构如上图,DM.CM.ETCD在单机部署中是非必要组件,因此本次不部署,DN ...

  7. EM算法及高斯混合模型GMM详述

    1.最大似然估计 最大似然估计(Maximum Likelihood Estimation,MLE)就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值的计算过程.直白来讲,就是给定了 ...

  8. opencv背景建模(混合高斯模型)

    背景建模 帧差法 由于场景中的目标在运动,目标的影像在不同图像帧中的位置不同.该类算法对时间上连续的两帧图像进行差分运算,不同帧对应的像素点相减,判断灰度差的绝对值,当绝对值超过一定阈值时,即可判断为 ...

  9. OPENCV混合高斯模型原理

    (本文转自转自:http://blog.sina.com.cn/s/blog_62bce98c0100shkq.html) 混合高斯模型跟高斯变量之和看起来有一点像, 注意不要把它们弄混淆了. 混合高 ...

最新文章

  1. Apache 基金会宣布 Apache Pulsar 毕业成为顶级项目
  2. 基于Sentinel的Redis3.2高可用方案
  3. CES线下展回归在即:飞行汽车外骨骼智能戒指吸足眼球
  4. 智能合约从入门到精通:调用数据的布局和ABI
  5. 皮一皮:童话里都是骗人的...
  6. 深入Java虚拟机:Class文件实例解析
  7. js循环解析html标签,riot.js教程【六】循环、HTML元素标签
  8. C++用libcurl通过HTTP以表单的方式Post数据到服务器
  9. python程序员工作时间_黑马程序员:Python编程之时间和日期模块
  10. 配置网站之后500.19错误
  11. vs安装msdn安装文档
  12. 新路由3 高恪魔改固件+底包
  13. 21_08_17王道计算机考研 数据结构(二)
  14. @C/C++ 运行后的dos窗口的暂停
  15. arcgis重心迁移分析,ArcGIS支持下三峡库区适度人口重心迁移研究
  16. 0基础学RS(十三)思科交换机上的Access模式和trunk模式以及配置
  17. linux mv文件个数,关于linux:mv一个文件,其中包含Shell脚本中的空格
  18. Linux vmwaver下安装cenos联网时出现 network is unreachable问题
  19. git官网 中文教程 使用手册 说明书
  20. linux IO_FILE 利用

热门文章

  1. Numeric tile and other files loaded in Smart Template tile render launch
  2. CRM Fiori Application opptListRefreshed
  3. 修改Hybris Administration console管理员默认登录密码
  4. header response in Genil
  5. create a new JSON model with url will trigger SAP UI5 AJAX
  6. SAP UI5 mock mode more discussion
  7. where and when navigation target url is retrieved by SAP UI5 Framework
  8. Extension project - Component.js of standard application could not be loaded
  9. CDS view里inner join, left outer join和association的区别
  10. 什么是CRM中间件的1250事件