R语言数据挖掘实践——系谱聚类
我们将在iris数据集上使用hclust()进行系谱聚类。
我们首先从iris数据集中抽取含有40条记录的一个样本呢,避免绘制聚类图像时太过拥挤,我们先从数据集中中剔除Species属性,然后在该样本上进行层次聚类。代码如下:
> idx <- sample(1:dim(iris)[1],40)
> irisSample <- iris[idx,]
> irisSample$Species <- NULL
> hc <- hclust(dist(irisSample),method="complete")
> plot(hc, hang=-1, labels=iris$Species[idx])
> rect.hclust(hc,k=3)
>groups <- cutree(hc, k=3)
在hclust()函数中,method参数用于选择聚类的具体算法,可供选择的有ward、single及complete等7种,默认选择complete方法。从绘制的树状图中可以看出,"setaosa"与其他两个簇的划分比较明确,而"versicolor"和"virginica"存在小范围的重叠。
R语言数据挖掘实践——系谱聚类相关推荐
- [转发]R语言数据挖掘实践——使用party包构建决策树
https://baijiahao.baidu.com/s?id=1574287135539036&wfr=spider&for=pc 转载于:https://www.cnblogs. ...
- R语言数据挖掘(关联规则、聚类算法等)——美国黑色星期五
R语言数据挖掘(关联规则.聚类算法等) 实验内容和步骤: 数据概览 产品分析 性别统计 畅销品 年龄统计 城市居住时间分析 查找顶级消费者 关联规则分析 聚类 实验内容和步骤: 一. 实验内容: 对原 ...
- R语言数据挖掘实战系列(4)
R语言数据挖掘实战系列(4)--数据预处理 数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具.数据预处理的主要内容包括数据清洗.数据集成.数据变换和数据规约. 一. ...
- 【R语言】常用的R语言数据挖掘包
常用的R语言数据挖掘包 与Python相比,R语言的很多算法分别会有不同的作者实现,而每个人有不同的实现方式,所以会产生大量的package.因此,学习R语言需要广泛了解与所研究问题相关的包,这样就比 ...
- R语言ggplot2可视化可视化聚类图、使用geom_encircle函数绘制多边形标定属于同一聚类簇的数据点、并自定义每个聚类簇数据点的颜色、多边形框的颜色(Cluster Plot)、主副标题题注
R语言ggplot2可视化可视化聚类图.使用geom_encircle函数绘制多边形标定属于同一聚类簇的数据点.并自定义每个聚类簇数据点的颜色.多边形框的颜色(Cluster Plot).主副标题题注 ...
- R语言Affinity Propagation+AP聚类实战
R语言Affinity Propagation+AP聚类实战 目录
- R语言聚类分析之层次聚类(hierarchical clustering)实战
R语言聚类分析之层次聚类(hierarchical clustering)实战 目录 R语言聚类分析之层次聚类(hierarchical clustering)实战 #距离计算
- 《R语言数据挖掘》----1.12 数据集成
本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.12节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云 ...
- 《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法
本节书摘来自华章出版社<R语言数据挖掘:实用项目解析>一书中的第2章,第2.9节无参数方法,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区 ...
最新文章
- 加速数据中心变革,Xilinx推出软件定义、硬件加速型 Alveo SmartNIC
- tornado异步请求非阻塞
- libsvm学习(二)——第一次体验libsvm(转)
- android spp传输速度,Android蓝牙SPP连接似乎在几秒后就已经死了
- Mysql复习(基础概念+基础操作)
- 苹果手机验真假_简单三步教你辨别苹果二手机,识别率高达99%,特别适合新手
- PageOffice国产版的授权及离线注册
- 数字逻辑·逻辑代数【常用公式、化简】
- html显示doc内容,doc文件怎么打开?doc是什么文件?
- 解决在win2003 enterprise上搭建IIS遇到的“需要Service Pack 2 CD-Rom 上的文件“问题
- 如何制作GIF表情包,GIF怎么做
- 【python数据结构】多维数组
- 【活动时间调整】博客搬家,有礼相送
- 5.1.2全景声音箱摆位_客厅影院选择7.1还是5.1.2全景声合适,天空音箱点位怎么定...
- 面试干货!21个必知数据科学面试题和答案
- 布法罗博士计算机专业回国人员,2020年纽约州立大学布法罗分校博士专业设置...
- (翻译)测试替身— Fakes, Mocks 和 Stubs
- github-一个视频图片下载工具-lux(annie)
- 网络安全:渗透流程之信息收集
- linux 下 批量添加后缀名,Linux 下批量修改后缀名
热门文章
- 10个可以快速用Python进行数据分析的小技巧
- 包邮送 36 本书,已全部打包好!
- linux stdin shell,关于shell:如何在Alpine Linux中修复“因为stdin不是终端而不会分配伪终端”?...
- [PHP] 项目实践中的自动加载实现
- python基础之---03基本语法
- Go-Web框架-Beego架构(二)
- BZOJ5467 PKUWC2018Slay the Spire(动态规划)
- 100+经典Java面试题及答案解析
- PLSQL_day01
- 20150309+Linux+LAMP安装-02