kmeans是基于距离的聚类算法,本身对异常和噪音点比较敏感,一般不用来做异常检测。还有,

i) kmeans聚类结果受对初始簇中心和k值的选取影响较大。初始点选取的改进可以使用kmeans++或先使用canopy算法先进行预聚类,以得到的k个簇中心作为kmeans的初始点;k值的选取可以使用轮廓系数或结合聚类误差平方和的肘部法进行聚类效果的评估选取最优k值。

ii)kmeans只适合数值型数据。适合离散属性的聚类有kmodes,适合具有混合变量数据的聚类有k prototype。

另外,kmeans可以看成是gmm在各混合成分均方差、且聚类是“硬分配”的特例。

聚类里做异常检测有基于密度的DBSCAN,不过DBSCAN有两个需要设置的参数(邻域、最小样本量),参数设定则要根据你数据和需求来选。

然后异常检测的话,

i)如果是单个维度上的异常检测,有正态分布假设下的3倍标准差准则、箱线图、Grubb's test等

ii)样本的异常检测就有相对于局部近邻密度来判断是否异常的LOF(局部异常检测)和基于树模型的IsolationForest(孤立森林),sklearn里面都有。

一切方法的选择都要基于对你数据的理解。

有哪里理解错误的地方麻烦各位指正,谢谢!

gmm聚类python_聚类算法GMM和KMeans?相关推荐

  1. 利用进化算法进行仿k-means聚类(可称之为EA-KMeans算法)

    该案例展示了如何利用进化算法进行仿k-means聚类(可称之为EA-KMeans算法). 本案例采用与k-means类似的聚类方法,采用展开的聚类中心点坐标作为染色体的编码,基本流程大致如下: 1) ...

  2. 【机器学习基础】数学推导+纯Python实现机器学习算法23:kmeans聚类

    Python机器学习算法实现 Author:louwill Machine Learning Lab 聚类分析(Cluster Analysis)是一类经典的无监督学习算法.在给定样本的情况下,聚类分 ...

  3. 聚类算法当中的K-means算法如何去做天猫淘宝的推广任务

    5 人赞同了该回答 figure data-size="normal">data-size="normal"> 这个入口是全网人气新品池,我们今天所 ...

  4. 道路匹配MapMatching:GPS轨迹点常用聚类算法介绍(K-Means聚类、蚁群算法等)

    道路匹配MapMatching:GPS轨迹点常用聚类算法介绍(K-Means聚类.蚁群算法等) 前言 一.聚类算法是什么? 二.道路匹配中常见聚类算法介绍 1.K-Means算法 2.基于时间和距离的 ...

  5. 【机器学习】聚类算法DBSCAN、K-means、Mean Shift对比分析及具体代码实现

    [机器学习]聚类算法DBSCAN.K-means.Mean Shift对比分析及具体代码实现 一.DBSCAN算法(具有噪声的基于密度的聚类方法) 1.算法原理 基于数据分布密度不同对数据进行聚类,把 ...

  6. 模式识别:C-means(K-means)聚类算法与分级聚类(层次聚类)算法

    C均值聚类算法与分级聚类算法的聚类分析 一.实验目的 理解聚类的整体思想,了解聚类的一般方法: 掌握 C-means与分级聚类算法算法思想及原理,并能够熟练运用这些算法进行聚类分析: 能够分析二者的优 ...

  7. 化学分子 降维算法umap、聚类算法hdbscan和kmeans

    参考: https://github.com/iwatobipen/chemo_info/blob/master/chemicalspace2/HDBSCAN_Chemoinfo.ipynb http ...

  8. k-means聚类的传统算法和优化

    参考文章:https://www.cnblogs.com/yixuan-xu/p/6272208.html   一.概述 在本篇文章中将对四种聚类算法(K-means,K-means++,ISODAT ...

  9. java 最大最小聚类,最大最小距离算法(K-MEANS K-medoids )聚类算法的结合运用

    聚类算法通常会得到一种分类,将n个点聚合成k类,同一聚类(即插槽簇)中的对象相似度较高:而不同类中的对象相似度较小. 聚类算法的基本流程如下: (1)从n个节点中选择 k 个节点作为初始聚类中心.(2 ...

  10. 【机器学习】聚类算法中的 K-means 算法及其原理

    系列文章目录 第十四章 Python 机器学习入门之聚类算法 目录 系列文章目录 前言 一.什么是聚类 二.K-means 聚类算法的直观理解 三.K-means 聚类算法公式 四.K-means 聚 ...

最新文章

  1. Linux的一些基本命令与MySQL索引
  2. Caffe---Pycaffe 绘制loss和accuracy曲线
  3. ACM 会场安排问题
  4. python在末尾加关闭程序_廖雪峰的Python教程教程-02
  5. 知乎热榜:如何看待华为天才少年年薪201万?
  6. android 滑动翻转动画,Android编程实现3D滑动旋转效果的方法
  7. java21天打卡-day14 日期时间
  8. Vmware Workstation虚拟机规划
  9. 6,EWF写保护功能介绍与使用
  10. VLAN划分(华为)
  11. 嵌入式linux系统蜂鸣器实验,嵌入式系统原理实验四蜂鸣器.docx
  12. WEB网站设计用户登录的安全机制
  13. C#中的NewLine到底是什么字符?
  14. [ahk]右键菜单打开文件所在文件夹(快捷方式也适用)
  15. 浅谈这半年的实习感想
  16. 步进电机五根线怎么接_第一讲:老冯三分钟教会你步进电机接线
  17. 【JS】1067- 一个神奇的交叉观察 API Intersection Observer
  18. Openssl下载网址
  19. 文末有福利 | 停不下来!程序员在GitHub上开源了一个自制表情包项目
  20. Android --- 5G网络,jetpack库

热门文章

  1. CF991E Bus Number
  2. 黑马vue实战项目-(六)商品列表组件的开发
  3. matlab如何获得一个二值掩码,1.3矩阵的掩码操作 - osc_uarhdl2n的个人空间 - OSCHINA - 中文开源技术交流社区...
  4. 后端如何收取多个文件_一次上传多个文件机制的两种解决方案
  5. python 虚拟环境 mac_Mac下安装Python虚拟环境Virtualenv
  6. combox控件触发事件_dom事件
  7. 服务器账号永不过期,linux下如何设置用户密码永不过期_网站服务器运行维护
  8. CMU 15-213 Introduction to Computer Systems学习笔记(15)System-Level I/O
  9. vue展示日历 考勤展示_vue实现简单的日历效果
  10. 如何用maven创建java项目_Maven创建Java项目