原文:http://blog.sina.com.cn/s/blog_54d460e40101ec00.html
  高斯混合模型--GMMGaussian Mixture Model

    统计学习的模型有两种,一种是概率模型,一种是非概率模型。

    所谓概率模型,是指训练模型的形式是P(Y|X)。输入是X,输出是Y,训练后模型得到的输出不是一个具体的值,而是一系列的概率值(对应于分类问题来说,就是输入X对应于各个不同Y(类)的概率),然后我们选取概率最大的那个类作为判决对象(软分类--soft assignment)。所谓非概率模型,是指训练模型是一个决策函数Y=f(X),输入数据X是多少就可以投影得到唯一的Y,即判决结果(硬分类--hard assignment)。

    所谓混合高斯模型(GMM)就是指对样本的概率密度分布进行估计,而估计采用的模型(训练模型)是几个高斯模型的加权和(具体是几个要在模型训练前建立好)。每个高斯模型就代表了一个类(一个Cluster)。对样本中的数据分别在几个高斯模型上投影,就会分别得到在各个类上的概率。然后我们可以选取概率最大的类所为判决结果。

从中心极限定理的角度上看,把混合模型假设为高斯的是比较合理的,当然,也可以根据实际数据定义成任何分布的Mixture Model,不过定义为高斯的在计算上有一些方便之处,另外,理论上可以通过增加Model的个数,用GMM近似任何概率分布。

    混合高斯模型的定义为:

   

其中K 为模型的个数;πk为第k个高斯的权重;px / k) 则为第k个高斯概率密度,其均值为μk,方差为σk。对此概率密度的估计就是要求出πk、μk 和σk 各个变量。当求出p)的表达式后,求和式的各项的结果就分别代表样本x 属于各个类的概率。

    在做参数估计的时候,常采用的是最大似然方法。最大似然法就是使样本点在估计的概率密度函数上的概率值最大。由于概率值一般都很小,N 很大的时候, 连乘的结果非常小,容易造成浮点数下溢。所以我们通常取log,将目标改写成:

  

    也就是最大化对数似然函数,完整形式为:

    一般用来做参数估计的时候,我们都是通过对待求变量进行求导来求极值,在上式中,log函数中又有求和,你想用求导的方法算的话方程组将会非常复杂,没有闭合解。可以采用的求解方法是EM算法——将求解分为两步:第一步,假设知道各个高斯模型的参数(可以初始化一个,或者基于上一步迭代结果),去估计每个高斯模型的权值;第二步,基于估计的权值,回过头再去确定高斯模型的参数。重复这两个步骤,直到波动很小,近似达到极值(注意这里是极值不是最值,EM算法会陷入局部最优)。具体表达如下:

     1、(E step)

    对于第i个样本xi 来说,它由第k 个model 生成的概率为:

   

    在这一步,假设高斯模型的参数和是已知的(由上一步迭代而来或由初始值决定)。

    2、(M step)

 

    3、重复上述两步骤直到算法收敛。

高斯混合模型--GMM相关推荐

  1. 高斯混合模型GMM、核心参数、高斯混合模型GMM的数学形式

    高斯混合模型GMM.核心参数.高斯混合模型GMM的数学形式 高斯混合模型GMM 混合模型是一个可以用来表示在总体分布(distribution)中含有 K 个子分布的概率模型,换句话说,混合模型表示了 ...

  2. 高斯混合模型--GMM(Gaussian Mixture Model)

    参考:http://blog.sina.com.cn/s/blog_54d460e40101ec00.html 概率指事件随机发生的机率,对于均匀分布函数,概率密度等于一段区间(事件的取值范围)的概率 ...

  3. 单高斯分布模型GSM,高斯混合模型GMM

    本文就高斯混合模型(GMM,Gaussian Mixture Model)参数如何确立这个问题,详细讲解期望最大化(EM,Expectation Maximization)算法的实施过程. 单高斯分布 ...

  4. EM算法应用:k均值聚类(k-means)和高斯混合模型(GMM)

    文章目录 k-means聚类 EM角度的理解 算法流程 特点 k值选择 局限性 高斯混合模型 GMM的问题描述 1,明确隐变量 2.EM算法的E步:确定Q函数 3. EM算法的E步 4. 停止条件 上 ...

  5. 高斯混合模型GMM的理解

    高斯混合模型(Gaussian Mixture Model,简称GMM)是用高斯概率密度函数(正态分布曲线)精确地量化事物,将一个事物分解为若干的基于高斯概率密度函数(正态分布曲线)形成的模型.通俗点 ...

  6. 混合高斯模型_大数据小白入门高斯混合模型(GMM)聚类算法

    导读 高斯混合模型(Gaussian Mixture Model)通常简称GMM,是一种业界广泛使用的聚类算法,属于生成式模型,它假设所有的数据样本都是由某一个给定参数的 多元高斯分布 所生成的.从中 ...

  7. 使用高斯混合模型(GMM)近似未知分布:EM算法的应用

    该篇博客是对邱锡鹏老师<神经网络与深度学习>的学习笔记.在阅读本博文之前,建议读者先阅读上一篇博客EM算法. 高斯混合模型(Gaussian Mixture Model) 如果一个连续随机 ...

  8. EM算法及高斯混合模型GMM详述

    1.最大似然估计 最大似然估计(Maximum Likelihood Estimation,MLE)就是利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值的计算过程.直白来讲,就是给定了 ...

  9. 高斯混合模型 GMM 的详细解释

    高斯混合模型(后面本文中将使用他的缩写 GMM)听起来很复杂,其实他的工作原理和 KMeans 非常相似,你甚至可以认为它是 KMeans 的概率版本. 这种概率特征使 GMM 可以应用于 KMean ...

最新文章

  1. Javascript及Jquery获取元素节点以及添加和删除操作
  2. 第四节:python if语句用法
  3. C++ TypeId简介与使用
  4. 使用标定板对相机位姿进行估计
  5. 排序:快速排序与归并排序
  6. 抓住训练集中真正有用的样本,提升模型整体性能!
  7. python对象回收_python 对象引用,可变性,垃圾回收
  8. [C++再学习系列] 虚函数的4条规则
  9. python476集免费教材_476. 数字的补数 | python|python爬虫|python入门|python教程
  10. UNet以ResNet34为backbone in keras
  11. RAW数码照片处理器:SILKYPIX Developer 的功能介绍
  12. 《数据库原理MySQL》第三次上机实验
  13. Vue 使用 PinyinMatch实现拼音匹配搜索
  14. 搜狗输入法的桌面图标消失,无法打开设置怎么办
  15. 新浪短网址生成java_T.CN短网址 新浪T.CN短网址批量生成工具推荐
  16. 养兔子c语言sdut,SDUT 养兔子
  17. C# .net 集合-并发处理之文件读写处理
  18. 3D目标检测之数据集
  19. 汇编指令学习(ADD,SUB,MUL,DIV,XADD,INC,DEC,NEG)
  20. 密码学归约证明——DH密钥交换协议在窃听者存在的情况下的安全性

热门文章

  1. eclipse编辑java_15个小type:教你高效使用Eclipse Java IDE
  2. mysql批量导入 导出数据_MySQL批量导入导出数据
  3. 关于kthreadd
  4. java mina多线程_Java多线程基础总结九:Mina窥探(1)
  5. linux下eclipse的使用教程,linux下Eclipse的使用方法总结.doc
  6. android富文本图片自适应,Android Span富文本图文混排 - ImageSpan(图文垂直居中)...
  7. spring_在基于Spring的Web应用程序中使用Http Session
  8. MoreUnit与MoreUnit
  9. 了解OutOfMemoryError
  10. linux 有线网卡,linux下有线网卡出现ADDRCONF(NETDEV_UP): eth0: link is not ready的解决方法...