机器学习训练营——机器学习爱好者的自由交流空间(入群联系qq:2279055353)

一个高斯混合模型(Gaussian Mixture Models, GMM)是一个概率模型,它假设数据来自由若干个未知的高斯(正态)分布组成的混合分布。
sklearn.mixture包能够学习高斯混合模型(Gaussian Mixture Models, GMM), 从GMM抽样,确定适合的成分数。Scikit-learn执行不同的类估计GMM, 对应不同的估计策略。

高斯混合

GaussianMixture对象执行EM(expectation-maximization)算法拟合GMM. GaussianMixture.fit方法从数据学习一个GMM. 给定检验数据,使用GaussianMixture.predict方法给每个样本分派它最可能属于的高斯分布。

GaussianMixture提供不同的选项约束不同估计类的协方差结构:spherical, diagonal, tied or full covariance.

GaussianMixture类的利弊

GaussianMixture类的利:

  • 速度:它是学习混合模型最快的算法。

  • 中立:因为它仅仅最大化似然函数,所以不会使均值偏向0,也不会使成分数偏向形成特定的结构。

GaussianMixture类的弊:

  • 奇性:当对每个混合没有足够多的数据点时,很难估计它的协方差结构。

  • 成分数:该算法总是使用估计到的所有成分,当缺乏外部提示的情况下,需要留存一部分数据或信息论准则确定成分的数量。

成分数的选择

在一个GMM里,BIC(Bayesian Information Criteria)准则是一种有效的成分数确定方法。注意,如果使用一个Variational Bayesian Gaussian mixture, 可以避免指定GMM的成分数。

EM估计算法

从无标签数据学习高斯混合模型的主要困难在于,通常不知道哪个点来自哪个成分。EM算法通过一个迭代过程很好地解决了这个问题。首先,假设随机成分,计算每个数据点来自模型的每个成分的概率。然后,调整参数,使数据的似然函数最大化。重复以上过程,直到收敛到一个局部最优。

精彩内容,请关注微信公众号:统计学习与大数据

【sklearn第十九讲】高斯混合模型相关推荐

  1. 以下关于java的GUI菜单描述_第十九讲 菜单和JavaGUI综合设计

    第十九讲菜单和JavaGUI综合设计 主要内容 菜单(JMenuBar.JMenu.JmenuItem) 菜单项的事件侦听处理 颜色选择器JColorChooser 文件选择器JFileChooser ...

  2. 趣谈网络协议笔记-二(第十九讲)

    趣谈网络协议笔记-二(第十九讲) HttpDNS:网络世界的地址簿也会指错路 自勉 勿谓言之不预也 -- 向为祖国牺牲的先烈致敬! 引用 dns缓存刷新时间是多久?dns本地缓存时间介绍 - 东大网管 ...

  3. 【genius_platform软件平台开发】第七十九讲:Linux系统中可执行程序后台运行的几种方式

    [genius_platform软件平台开发]第七十九讲:Linux系统中可执行程序后台运行的几种方式 1. 问题描述 2. & 符号 3. nohup指令 4. ctrl + z.jobs. ...

  4. 名词解释第二十九讲:搬砖

    这里是王团长区块链学院,与最优秀的区块链人一起成长!今天给大家讲讲搬砖. 点击观看视频教程:名词解释第二十九讲:搬砖 2017年,有一个非常热门的词叫"搬砖",当然,这个" ...

  5. C++面向对象高级编程十九讲

    文章目录 0 背景 1 内容 0 背景 因为本人的C++基础不是很扎实,很多面向对象的基本语法掌握的不是很熟练,导致写程序出错时,经常会犯错,于是就去网上找到了侯捷老师的C++课进行观摩学习. 本文是 ...

  6. 陈力:传智播客古代 珍宝币 泡泡龙游戏开发第十九讲:apache+php+mysql开发环境搭建(wamp)

    陈力:传智播客古代 珍宝币 泡泡龙游戏开发第十九讲:apache+php+mysql开发环境搭建(wamp) window环境下进行网站建设时,必须要进行wamp环境的搭建.本文介绍了如果配置apac ...

  7. r library car_第三十九讲 R语言-线性回归:自变量中存在分类变量时

    当我们提到"线性"回归时,特指的是因变量(结果变量)为连续性变量,与自变量(预测变量)有线性关系,而对自变量(预测变量)并没有要求一定要是连续性变量.前面我们已经提到,当自变量是连 ...

  8. halcon第十九讲:基于高斯混合模型的水果分类

    高斯混合模型是将多个服从高斯分布的模型进行线性组合,几乎能拟合成任何一条曲线.比如在生活中男生身高普遍在175左右,女生身高普遍在165左右,并且都服从高斯分布,就可通过中间交叉点进行分类. 上面只用 ...

  9. 第十九讲:爱情:如何让爱情天长地久 第二十讲:幽默 第二十一讲:爱情自尊

    (注:此为课程第十九课,更新于2017年7月16日) 大家好! 今天我们继续谈论爱情,讲之前先说一下,一位叫Nadia的同学,你的钥匙链落在这教室了,就在我这里,课后请来我这里取. 那我们来讲讲爱情吧 ...

  10. Scratch第四十九讲:完美的下落和反弹

    做了很多小游戏,都会遇到碰撞和反弹的情况,CC哥大多时候也都是简单处理一下,包括之前的讲座也有提过,但是没有认真的讲解过.今天就专门为这个主题做一讲,把这部分内容彻底讲透,大家可以一起探讨一下. 是不 ...

最新文章

  1. Operations Manager 2012 SP1配置部署系列之(二) SCOM监控SCVMM
  2. LeetCode实战:字符串转换整数 (atoi)
  3. 【django】路由命名和路由反向解析
  4. Android开发7:简单的数据存储(使用SharedPreferences)和文件操作
  5. pyspark连接mysql
  6. [dp]leetcode 1025. Divisor Game
  7. 可以获取python整数类型帮助的语句_Python入门第二课--数据类型、条件语句
  8. cas如何实现多系统间的相互认证_统一身份认证和单点登录的区别
  9. git连接通过ssh连接github
  10. 蓝桥杯枚举+判断结果填空:猜年龄/奇妙数字
  11. 数据库开发基础-教案-2
  12. SQL数据库快速入门基础
  13. 安装SQL Server 2012过程中出现“启用windows功能NetFx3时出错”
  14. Unity3D 制作绿草地,草坪,模型表面生成草地,草地效果Shader实现 草着色器 Brute Force - Grass Shader
  15. Shell 教程 - 菜鸟教程
  16. Linux epoll 实现封装
  17. 申请德国农工大学计算机案例,德州农工大学世界排名怎么样?
  18. 51单片机99秒倒计时C语言程序,单片机 60秒倒计时
  19. Swift之深入解析如何处理非可选的可选项类型
  20. 手把手教你快速入门知识图谱 - Neo4J教程

热门文章

  1. HDU 1285 拓普排序 基本模板例题 确定比赛名次
  2. Jmeter多机联合产生负载 (转)
  3. C++网络编程实例之多个客户端交互(多线程)
  4. zabbix详解(十四)——zabbix钉钉报警实战
  5. 输入网址的时候,浏览器是如何判断你是http协议还是https协议的
  6. 11gR2 集群(CRS/GRID)新功能—— SCAN(Single Client Access Name)
  7. python+django(解决对象编码显示Test Object问题)
  8. JAVA IO - 高效读取大文件的后几行
  9. 【杭电ACM】1.2.6 decimal system
  10. java cxf webservice 对象 c#客户端_使用CXF开发WebService客户端