分类与聚类的区别

对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的。根据给定的数据集,训练出一个模式或者规则,对新来的数据进行类别判断。我们可以将分类看作是有监督的学习。
对于聚类来说,在对数据集操作时,我们是不知道该数据集包含多少类,我们要做的,是将数据集中相似的数据归纳在一起。比如对社交媒体中的人进行聚类,在聚类之前我们并不知道有多少个类别,我们可以通过他们之间的某一标准来度量他们之间的相似性,从而将相似的人群划分到一个组或者一个类中。我们可以把聚类看作是无监督的学习,因为数据的聚类类别是不知道的。

按照李春葆老师的话说,聚类是将数据对象的集合分成相似的对象类的过程。使得同一个簇(或类)中的对象之间具有较高的相似性,而不同簇中的对象具有较高的相异性。

对于度量对象之间的相似性与相异性,有很多方法,比如距离相似度,密度相似度,连通相似度,概念相似性度量(从语义上来判断相似性)等等。
另外,聚类算法又可以分为划分算法,层次算法,基于密度的算法,模型方法以及一些新型算法。聚类分类可参考下图:

参考博客:https://blog.csdn.net/xzfreewind/article/details/73770327;
参考文论:数据挖掘中的聚类算法研究,马飞,2008-06;

分类与聚类的区别以及聚类的方法分类相关推荐

  1. 除了独热编码,你需要了解将分类特征转换为数字特征的17种方法--较详细说明各方法的优点

    除了独热编码,你需要了解将分类特征转换为数字特征的17种方法 - 51CTO.COM 除了独热编码,你需要了解将分类特征转换为数字特征的17种方法 分类编码是将分类列转换为一个(或多个)数字列的过程. ...

  2. 算法中分类与聚类的区别?

    算法中分类与聚类的区别? (1) 聚类分析研究如何在没有训练的条件下把样本划分为若干类: (2) 在分类中对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪       一类标记出来 ...

  3. 分类聚类区别及聚类概述

    在初学分类聚类时,对这两个概念不是很了解.随着深入的了解,现有了一些基本的认识.现对聚类进行个人理解上的总结,欢迎大家批评指正. 一.分类和聚类的区别 分类和聚类的概念是比较容易混淆的. 对于分类来说 ...

  4. 分类和聚类的区别以及各自的常见算法

    1.分类和聚类的区别: Classification (分类),对于一个classifier,通常需要你告诉它"这个东西被分为某某类"这样一些例子,理想情况下,一个 classif ...

  5. 文本检测学习笔记——边界聚类,笔画分割,语句段落分类

    搬以前写的博客[2014-02-28 10:24] 2.21 ~2.27  这一周在阅读一篇比较长的文献 Localizing Text in Scene Images by Boundary Clu ...

  6. Interview:算法岗位面试—10.29下午上海某电子(偏传统ML算法,外企)数据结构算法+晚上国内某保险公司(偏AI算法,世界500强)技术面试之分类算法、回归算法、聚类算法等细节考察

    ML岗位面试:10.29下午上海某电子(偏传统ML算法,外企)数据结构算法+晚上国内某保险公司(偏AI算法,世界500强)技术面试之分类算法.回归算法.聚类算法等细节考察 Interview:算法岗位 ...

  7. 基于最大最小距离的分类数目上限K确定的聚类方法

    聚类是数据挖掘很重要的组成部分.而大多数聚类算法都需要事先确定分类数目K.而本文是在实际 情况下确定分类数目K的上限.进而对数据样本进行自动分类. 首先介绍下最大最小距离算法: 设样本集为X{x(1) ...

  8. 聚类分简单来讲:有监督 -gt; 分类(…

    简单来讲: 有监督 -> 分类(回归) -> 识别: 无监督 -> 聚类 -> 分割: ' -> ' 表示对应关系 (ps:这个说法来自于<学习Opencv> ...

  9. python音频聚类_用K-means聚类算法实现音调的分类与可视化

    本文由 伯乐在线 - ggspeed 翻译,耶鲁怕冷 校稿.未经许可,禁止转载! 英文出处:jared polivka.欢迎加入翻译组. 利用 K-means 聚类算法来聚类和可视化音调 Galvan ...

  10. c均值聚类matlab程序_聚类算法之kmeans算法

    一.k-means算法介绍 k-means最早是由James MacQueen在1967年提出的,这一观点能够追溯到1957年Hugo Steinhaus所提出的想法.1957年,斯图亚特最先提出这一 ...

最新文章

  1. 高文院士:人工智能发展机遇
  2. Python学习入门基础教程(learning Python)--6.3 Python的list切片高级
  3. linux 子进程exit6,Linux内核之do_exit
  4. java 方法返回的值,java方法返回值问题
  5. ASP实现记住密码的功能
  6. VTK:vtkAffineWidget用法实战
  7. Knockout.Js案例一Introduction
  8. exls导入数据库 php_PHP读取excel文件并导入数据库
  9. 栈的顺序存储结构框架搭建
  10. 我整理的一份来自于线上的Nginx配置(Nginx.conf),希望对学习Nginx的有帮助
  11. 深入分析windows和Linux动态链接库的应用异同[转]
  12. 蓝牙音乐之AVRCP常用指令介绍
  13. 利用445 端口渗透
  14. win8计算机修改mac,快捷MAC地址修改器
  15. 蓝凌工作ekp开发使用一些js编写开发记录
  16. 组合数学 多重集的排列和组合
  17. Linux 压缩软件的使用
  18. sqlserver 根据旧表创建新表
  19. cancase lin管脚_Vector CANCASE XL+CABLE 模块
  20. 华为机试python打印机_华为校园招聘上机笔试题 扑克牌大小(python)

热门文章

  1. linux系统可以安装企业微信,Linux 上安装微信客户端
  2. 给神经网络加入先验知识!
  3. android EditText的美化
  4. 新白娘子传奇中掩藏的秘密!!白素贞的身世之谜!
  5. Kalman Fuzzy Actor-Critic Learning Automaton Algorithm for the Pursuit-Evasion Differential Game
  6. python的计算_python计算smoothed PSSM(二)
  7. POI导出Excel时 设置单元格类型为 数值类型 或者文本类型
  8. 为你的整轨APE音乐制作CUE文件(图文)
  9. excel合并计算机操作,Excel如何快速合并多个单元格的内容?
  10. c语言 愚人节题目,愚人节整人题目大全