数据挖掘中分类和聚类的区别
- 分类是根绝以往的数据和结果对一部分数据进行结果的预测。有监督学习。
分类预测的基本过程:历史数据是训练数据,要预测的数据称为测试数据,而结果称为类标签。分类预测主要有学习和分类两个阶段:利用数据进行模型参数的调节过程称为训练和学习,训练的结果是产生一个分类器或者分类模型,进而可以根据这个模型对测试数据进行预测,得到相应的类标签结果。类标签的数据种类分为二分类或多酚类。 - 训练数据是有已知的类标签,而且训练数据除类标签外,其余部分的结构和测试数据需要完全一致,即特征数量要对应。
- 分类算法有:决策树、朴素贝叶斯,神经网络,SVM,逻辑回归。
聚类:将本身没有类别的样本聚集称不同的组,这样的一组数据对象的集合称为簇,并且对每一个这样的簇都进行描述的过程。聚类的目的是使属于同一个簇的样本之间彼此相似,而不同簇的样本之间足够不相似。
与分类不同的是:进行聚类前并不知道将要划分的组的个数和类型,没有定义标签或者目标值,聚类归于无监督学习任务。
聚类方法:K-means, k-中心点法。
尤其是在处理海量数据的时候,如果通过预处理使得数据满足分类算法的要求,则代价非常大,这时候可以考虑使用聚类算法
数据挖掘中分类和聚类的区别相关推荐
- 算法中分类与聚类的区别?
算法中分类与聚类的区别? (1) 聚类分析研究如何在没有训练的条件下把样本划分为若干类: (2) 在分类中对于目标数据库中存在哪些类是知道的,要做的就是将每一条记录分别属于哪 一类标记出来 ...
- 机器学习中分类与聚类的本质区别
机器学习中分类与聚类的本质区别 机器学习中有两类的大问题,一个是分类,一个是聚类. 在我们的生活中,我们常常没有过多的去区分这两个概念,觉得聚类就是分类,分类也差不多就是聚类,下面,我们就具体来研究下 ...
- 分类和聚类的区别以及各自的常见算法
1.分类和聚类的区别: Classification (分类),对于一个classifier,通常需要你告诉它"这个东西被分为某某类"这样一些例子,理想情况下,一个 classif ...
- 数据挖掘中分类算法小结
数据挖掘中分类算法小结 数据仓库,数据库或者其它信息库中隐藏着许多可以为商业.科研等活动的决策提供所需要的知识.分类与预测是两种数据分析形式,它们可以用来抽取能够描述重要数据集合或预测未来数据趋势 ...
- 分类与聚类算法基础了解
分类与聚类,监督学习与无监督学习 在讲具体的分类和聚类算法之前,有必要讲一下什么是分类,什么是聚类,以及都包含哪些具体算法或问题. Classification (分类),对于一个 classifie ...
- 数据挖掘中聚类算法概述
1 聚类方法概述 聚类方法是将物理或抽象对象的集合组成为由类似的对象组成的多个类的过程被成为聚类.由聚类所组成的簇是一组数据对象的集合,这些对象与同一簇中的对象彼此类似,与其他簇中的对象相异.在许多应 ...
- AI中分类算法与聚类算法
学习数据挖掘的朋友,对分类算法和聚类算法都很熟悉.无论是分类算法还是聚类算法,都有许多具体的算法来实现具体的数据分析需求.很多时候,我们难以判断选择分类或者聚类的场合是什么.我们最直观的概念是,分类和 ...
- Py之scikit-learn:机器学习sklearn库的简介、六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类)、安装、使用方法(实际问题中如何选择最合适的机器学习算法)之详细攻略
Py之scikit-learn:机器学习sklearn库的简介(组件/版本迭代).六大基本功能介绍(数据预处理/数据降维/模型选择/分类/回归/聚类).安装.使用方法(实际问题中如何选择最合适的机器学 ...
- 文本分类和聚类有什么区别
简单点说:分类是将一篇文章或文本自动识别出来,按照已经定义好的类别进行匹配,确定.聚类就是将一组的文章或文本信息进行相似性的比较,将比较相似的文章或文本信息归为同一组的技术.分类和聚类都是将相似对象归 ...
- iOS中分类(category)和类扩展(Extension)的区别
iOS中分类(category)和类扩展(Extension)的区别 一.分类的定义: 分类是OC中的特有语法,它是表示一个指向分类结构体的指针,它是为了扩展系统类的方法而产生的一种方式. 二.分类的 ...
最新文章
- css menu builder,AutoPlay Menu Builder使用教程【图文教程】
- c语言const与*位置关系,C语言程序的存储区域与const关键字的使用方法
- java 超时中断_怎么在超时后中断任务的ExecutorService
- 铁大Facebook——电梯演讲
- 【SpringCloud】配置中心简介及其搭建
- Huber loss--转
- OpenCV之core 模块. 核心功能(2)基本绘图 随机数发生器绘制文字 离散傅立叶变换 输入输出XML和YAML文件 与 OpenCV 1 同时使用
- 卷文件系统根目录仅剩余0字节_Linux Ext4文件系统的老祖宗长什么样
- java 中的chartdata_获取Helm Charts中的文件夹列表
- uva 1025——A Spy in the Metro
- [hackerrank]Manasa and Stones
- centos7.4下安装配置PHP服务(源码安装)并配置nginx支持php
- 华为路由器与CISCO路由器在配置上的差别
- “投机取巧”快速恢复坏扇区多的数据
- 笨办法学 Python · 续 练习 43:SQL 管理
- 我的学习之路_第十四章_反射
- UI基本设计素材模板|完整的线框图
- 重启nginx后丢失nginx.pid的解决方法
- sleep、wait、yield、join区别
- Android 4.0 ICS SystemUI浅析——SystemUI启动流程