我们将在iris数据集上使用hclust()进行系谱聚类。

  我们首先从iris数据集中抽取含有40条记录的一个样本呢,避免绘制聚类图像时太过拥挤,我们先从数据集中中剔除Species属性,然后在该样本上进行层次聚类。代码如下:

  > idx <- sample(1:dim(iris)[1],40)

  > irisSample <- iris[idx,]

  > irisSample$Species <- NULL

  > hc <- hclust(dist(irisSample),method="complete")

  > plot(hc, hang=-1, labels=iris$Species[idx])

  > rect.hclust(hc,k=3)

  >groups <- cutree(hc, k=3)

  

  在hclust()函数中,method参数用于选择聚类的具体算法,可供选择的有ward、single及complete等7种,默认选择complete方法。从绘制的树状图中可以看出,"setaosa"与其他两个簇的划分比较明确,而"versicolor"和"virginica"存在小范围的重叠。

R语言数据挖掘实践——系谱聚类相关推荐

  1. [转发]R语言数据挖掘实践——使用party包构建决策树

    https://baijiahao.baidu.com/s?id=1574287135539036&wfr=spider&for=pc 转载于:https://www.cnblogs. ...

  2. R语言数据挖掘(关联规则、聚类算法等)——美国黑色星期五

    R语言数据挖掘(关联规则.聚类算法等) 实验内容和步骤: 数据概览 产品分析 性别统计 畅销品 年龄统计 城市居住时间分析 查找顶级消费者 关联规则分析 聚类 实验内容和步骤: 一. 实验内容: 对原 ...

  3. R语言数据挖掘实战系列(4)

    R语言数据挖掘实战系列(4)--数据预处理 数据预处理一方面是要提高数据的质量,另一方面是要让数据更好地适应特定的挖掘技术或工具.数据预处理的主要内容包括数据清洗.数据集成.数据变换和数据规约. 一. ...

  4. 【R语言】常用的R语言数据挖掘包

    常用的R语言数据挖掘包 与Python相比,R语言的很多算法分别会有不同的作者实现,而每个人有不同的实现方式,所以会产生大量的package.因此,学习R语言需要广泛了解与所研究问题相关的包,这样就比 ...

  5. R语言ggplot2可视化可视化聚类图、使用geom_encircle函数绘制多边形标定属于同一聚类簇的数据点、并自定义每个聚类簇数据点的颜色、多边形框的颜色(Cluster Plot)、主副标题题注

    R语言ggplot2可视化可视化聚类图.使用geom_encircle函数绘制多边形标定属于同一聚类簇的数据点.并自定义每个聚类簇数据点的颜色.多边形框的颜色(Cluster Plot).主副标题题注 ...

  6. R语言Affinity Propagation+AP聚类实战

    R语言Affinity Propagation+AP聚类实战 目录

  7. R语言聚类分析之层次聚类(hierarchical clustering)实战

    R语言聚类分析之层次聚类(hierarchical clustering)实战 目录 R语言聚类分析之层次聚类(hierarchical clustering)实战 #距离计算

  8. 《R语言数据挖掘》----1.12 数据集成

    本节书摘来自华章出版社<R语言数据挖掘>一书中的第1章,第1.12节,作者[哈萨克斯坦]贝特·麦克哈贝尔(Bater Makhabel),李洪成 许金炜 段力辉 译,更多章节内容可以访问云 ...

  9. 《R语言数据挖掘:实用项目解析》——第2章,第2.9节无参数方法

    本节书摘来自华章出版社<R语言数据挖掘:实用项目解析>一书中的第2章,第2.9节无参数方法,作者[印度]普拉迪帕塔·米什拉(Pradeepta Mishra),更多章节内容可以访问云栖社区 ...

最新文章

  1. 加速数据中心变革,Xilinx推出软件定义、硬件加速型 Alveo SmartNIC
  2. tornado异步请求非阻塞
  3. libsvm学习(二)——第一次体验libsvm(转)
  4. android spp传输速度,Android蓝牙SPP连接似乎在几秒后就已经死了
  5. Mysql复习(基础概念+基础操作)
  6. 苹果手机验真假_简单三步教你辨别苹果二手机,识别率高达99%,特别适合新手
  7. PageOffice国产版的授权及离线注册
  8. 数字逻辑·逻辑代数【常用公式、化简】
  9. html显示doc内容,doc文件怎么打开?doc是什么文件?
  10. 解决在win2003 enterprise上搭建IIS遇到的“需要Service Pack 2 CD-Rom 上的文件“问题
  11. 如何制作GIF表情包,GIF怎么做
  12. 【python数据结构】多维数组
  13. 【活动时间调整】博客搬家,有礼相送
  14. 5.1.2全景声音箱摆位_客厅影院选择7.1还是5.1.2全景声合适,天空音箱点位怎么定...
  15. 面试干货!21个必知数据科学面试题和答案
  16. 布法罗博士计算机专业回国人员,2020年纽约州立大学布法罗分校博士专业设置...
  17. (翻译)测试替身— Fakes, Mocks 和 Stubs
  18. github-一个视频图片下载工具-lux(annie)
  19. 网络安全:渗透流程之信息收集
  20. linux 下 批量添加后缀名,Linux 下批量修改后缀名

热门文章

  1. 10个可以快速用Python进行数据分析的小技巧
  2. 包邮送 36 本书,已全部打包好!
  3. linux stdin shell,关于shell:如何在Alpine Linux中修复“因为stdin不是终端而不会分配伪终端”?...
  4. [PHP] 项目实践中的自动加载实现
  5. python基础之---03基本语法
  6. Go-Web框架-Beego架构(二)
  7. BZOJ5467 PKUWC2018Slay the Spire(动态规划)
  8. 100+经典Java面试题及答案解析
  9. PLSQL_day01
  10. 20150309+Linux+LAMP安装-02