分类与聚类的区别以及聚类的方法分类
分类与聚类的区别
对于分类来说,在对数据集分类时,我们是知道这个数据集是有多少种类的。根据给定的数据集,训练出一个模式或者规则,对新来的数据进行类别判断。我们可以将分类看作是有监督的学习。
对于聚类来说,在对数据集操作时,我们是不知道该数据集包含多少类,我们要做的,是将数据集中相似的数据归纳在一起。比如对社交媒体中的人进行聚类,在聚类之前我们并不知道有多少个类别,我们可以通过他们之间的某一标准来度量他们之间的相似性,从而将相似的人群划分到一个组或者一个类中。我们可以把聚类看作是无监督的学习,因为数据的聚类类别是不知道的。
按照李春葆老师的话说,聚类是将数据对象的集合分成相似的对象类的过程。使得同一个簇(或类)中的对象之间具有较高的相似性,而不同簇中的对象具有较高的相异性。
对于度量对象之间的相似性与相异性,有很多方法,比如距离相似度,密度相似度,连通相似度,概念相似性度量(从语义上来判断相似性)等等。
另外,聚类算法又可以分为划分算法,层次算法,基于密度的算法,模型方法以及一些新型算法。聚类分类可参考下图:
参考博客:https://blog.csdn.net/xzfreewind/article/details/73770327;
参考文论:数据挖掘中的聚类算法研究,马飞,2008-06;
分类与聚类的区别以及聚类的方法分类相关推荐
- 除了独热编码,你需要了解将分类特征转换为数字特征的17种方法--较详细说明各方法的优点
除了独热编码,你需要了解将分类特征转换为数字特征的17种方法 - 51CTO.COM 除了独热编码,你需要了解将分类特征转换为数字特征的17种方法 分类编码是将分类列转换为一个(或多个)数字列的过程. ...
- 算法中分类与聚类的区别?
算法中分类与聚类的区别? (1) 聚类分析研究如何在没有训练的条件下把样本划分为若干类: (2) 在分类中对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪 一类标记出来 ...
- 分类聚类区别及聚类概述
在初学分类聚类时,对这两个概念不是很了解.随着深入的了解,现有了一些基本的认识.现对聚类进行个人理解上的总结,欢迎大家批评指正. 一.分类和聚类的区别 分类和聚类的概念是比较容易混淆的. 对于分类来说 ...
- 分类和聚类的区别以及各自的常见算法
1.分类和聚类的区别: Classification (分类),对于一个classifier,通常需要你告诉它"这个东西被分为某某类"这样一些例子,理想情况下,一个 classif ...
- 文本检测学习笔记——边界聚类,笔画分割,语句段落分类
搬以前写的博客[2014-02-28 10:24] 2.21 ~2.27 这一周在阅读一篇比较长的文献 Localizing Text in Scene Images by Boundary Clu ...
- Interview:算法岗位面试—10.29下午上海某电子(偏传统ML算法,外企)数据结构算法+晚上国内某保险公司(偏AI算法,世界500强)技术面试之分类算法、回归算法、聚类算法等细节考察
ML岗位面试:10.29下午上海某电子(偏传统ML算法,外企)数据结构算法+晚上国内某保险公司(偏AI算法,世界500强)技术面试之分类算法.回归算法.聚类算法等细节考察 Interview:算法岗位 ...
- 基于最大最小距离的分类数目上限K确定的聚类方法
聚类是数据挖掘很重要的组成部分.而大多数聚类算法都需要事先确定分类数目K.而本文是在实际 情况下确定分类数目K的上限.进而对数据样本进行自动分类. 首先介绍下最大最小距离算法: 设样本集为X{x(1) ...
- 聚类分简单来讲:有监督 -gt; 分类(…
简单来讲: 有监督 -> 分类(回归) -> 识别: 无监督 -> 聚类 -> 分割: ' -> ' 表示对应关系 (ps:这个说法来自于<学习Opencv> ...
- python音频聚类_用K-means聚类算法实现音调的分类与可视化
本文由 伯乐在线 - ggspeed 翻译,耶鲁怕冷 校稿.未经许可,禁止转载! 英文出处:jared polivka.欢迎加入翻译组. 利用 K-means 聚类算法来聚类和可视化音调 Galvan ...
- c均值聚类matlab程序_聚类算法之kmeans算法
一.k-means算法介绍 k-means最早是由James MacQueen在1967年提出的,这一观点能够追溯到1957年Hugo Steinhaus所提出的想法.1957年,斯图亚特最先提出这一 ...
最新文章
- 高文院士:人工智能发展机遇
- Python学习入门基础教程(learning Python)--6.3 Python的list切片高级
- linux 子进程exit6,Linux内核之do_exit
- java 方法返回的值,java方法返回值问题
- ASP实现记住密码的功能
- VTK:vtkAffineWidget用法实战
- Knockout.Js案例一Introduction
- exls导入数据库 php_PHP读取excel文件并导入数据库
- 栈的顺序存储结构框架搭建
- 我整理的一份来自于线上的Nginx配置(Nginx.conf),希望对学习Nginx的有帮助
- 深入分析windows和Linux动态链接库的应用异同[转]
- 蓝牙音乐之AVRCP常用指令介绍
- 利用445 端口渗透
- win8计算机修改mac,快捷MAC地址修改器
- 蓝凌工作ekp开发使用一些js编写开发记录
- 组合数学 多重集的排列和组合
- Linux 压缩软件的使用
- sqlserver 根据旧表创建新表
- cancase lin管脚_Vector CANCASE XL+CABLE 模块
- 华为机试python打印机_华为校园招聘上机笔试题 扑克牌大小(python)
热门文章
- linux系统可以安装企业微信,Linux 上安装微信客户端
- 给神经网络加入先验知识!
- android EditText的美化
- 新白娘子传奇中掩藏的秘密!!白素贞的身世之谜!
- Kalman Fuzzy Actor-Critic Learning Automaton Algorithm for the Pursuit-Evasion Differential Game
- python的计算_python计算smoothed PSSM(二)
- POI导出Excel时 设置单元格类型为 数值类型 或者文本类型
- 为你的整轨APE音乐制作CUE文件(图文)
- excel合并计算机操作,Excel如何快速合并多个单元格的内容?
- c语言 愚人节题目,愚人节整人题目大全