这里的聚类主要用到K-Means和K-Medoide聚类。在进行聚类之前,为了避免不同参数之间量纲不同所造成的影响,先将数据进行(0-1)标准化

# 如参数weight
data$weight <- (data$weight-min(data$weight))/(max(data$weight)-min(data$weight))

K-Means算法

1.读取数据

data <- read.csv("data/km/data.csv",header = T)

2.调用kmeans算法

# 设置聚类数
cluster_num <- 5
# 调用kmeans算法
km <- kmeans(data,cluster_num)

3.查看分类情况和总体汇总

# 查看具体分类情况
fitted(km)
# 查看分类概括
table(data$weight, km$cluster)  

4.将结果保存

# 构建新数据框映射
df <- data.frame(km[[1]],data$weight)
# 参数重新命名
names(df) <- (c("classification_number","weight"))
# 保存写入
write.csv(df,file="data/km.csv")

K-Medoide算法

这里用到K-Medoide中对大样本数据处理的算法------CLARA算法

1.下载cluster包

install.packages("cluster")

2.引入cluster包

# 引入cluster包
library(cluster)

3.读取数据

data <- read.csv("data/km/data.csv",header = T)

4.调用CLARA算法

# 设置聚类数
cluster_num <- 5
# 调用CLARA算法
cl <- clara(data,cluster_num)

5.将结果保存

# 构建新数据框映射
df <- data.frame(cl$clustering,data$weight)
#参数重新命名names(df) <- (c("classification_number","weight")) # 写入 write.csv(df,file="data/clara.csv")

转载于:https://www.cnblogs.com/xiaomingzaixian/p/9269167.html

R语言中的聚类的使用相关推荐

  1. R语言绘制带聚类树的堆叠柱形图

    R语言绘制带聚类树的堆叠柱形图 聚类树与柱形图结合,即可反映样本或分组间的相似性,又能展示样本内的元素组成信息. 例如下图是一个在扩增子测序微生物群落分析中常见的统计图类型,在测序公司给的报告中通常都 ...

  2. R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型

    全文下载链接:http://tecdat.cn/?p=20531 当线性假设无法满足时,可以考虑使用其他方法(点击文末"阅读原文"获取完整代码数据). 相关视频 多项式回归 扩展可 ...

  3. R语言中如何进行PCA分析?利用ggplot和prcomp绘制基因表达量分析图

    学习笔记的主要内容是在R语言中利用ggplot2进行PCA分析和绘图,包括简单分析与操作流程,对比不同方式得到的结果差异,提供脚本代码供练习. PCA分析的原理 在处理基因差异表达数据时,有时候需要分 ...

  4. 如何在R语言中建立六边形矩阵热图heatmap可视化

    原文链接:http://tecdat.cn/?p=18879 这是一个六边形热图可视化程序,主要用到的知识RColorBrewer,fields,也就是R中的可视化绘图库(点击文末"阅读原文 ...

  5. R语言中使用pkgbuild::find_rtools查看是否有Rtools、使用Sys.which函数查看make是否存在、如果没有则安装、使用writeLines函数绑定R和Rtools

    R语言中使用pkgbuild::find_rtools(debug = TRUE)查看是否有Rtools.使用Sys.which函数查看make是否存在.如果没有则安装Rtools.使用writeLi ...

  6. R语言中如何计算C-Statistics?几种计算方法详解

    R语言中如何计算C-Statistics?几种计算方法详解 目录 R语言中如何计算C-Statistics? #包导入 #数据加载编码

  7. r语言 rgl 强制过程中_一个R语言中操纵矢量空间数据的标准化工具—sf

    ​注: 本文是R语言sf包的核心开发者和维护者--来自德国明斯特大学的地理信息学教授:Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位.功能. ...

  8. R语言中的特殊值 NA NULL NaN Inf

    这几个都是R语言中的特殊值,都是R的保留字, NA:Not available  表示缺失值   用 is.na() 来判断是否为缺失值 NULL:表示空值,即没有内容  用 is.null() 来判 ...

  9. R开发(part8)--应用R语言中的函数环境空间

    学习笔记,仅供参考,有错必纠 文章目录 R开发 应用R语言中的函数环境空间 R语言的函数环境空间 封闭环境 绑定环境 运行环境 调用环境 函数环境空间图示 R开发 应用R语言中的函数环境空间 R语言的 ...

最新文章

  1. 设备履历管理系统php开源,航空机载设备履历本管理制作系统诞生记
  2. Docker Machine-Windows
  3. “阿里爸爸”最新出品SpringBoot高级笔记(全彩版)--网盘链接自取
  4. sequence跳号问题及解决办法
  5. sql server服务器位置,SQL语句实现查询SQL Server服务器名称和IP地址
  6. 条款12:复制对象时勿忘其每一个部分
  7. 中路径查找器的功能_还在用路径查找器?试试它吧!
  8. Android-消息机制总结
  9. CCF202104-3 DHCP服务器(100分)【模拟】
  10. C/C++心得-从内存开始
  11. [转]Android 超高仿微信图片选择器 图片该这么加载
  12. Java集合Collection之遍历方法总结(List、Map、Set)
  13. 【Android病毒分析报告】- 手机支付毒王“银行悍匪”的前世今生
  14. HTML中使用a标签实现文本内链接—零基础自学网页制作
  15. oracle的单引号和双引号的深入举例分析
  16. 【手写源码-设计模式9】-装饰器模式-基于王者荣耀英雄-甄姬皮肤场景
  17. 阿浪与佩奇在Java遇到的muddy puddles
  18. python中运用django_【Django】在项目中使用python
  19. Android 4高级编程(第3版)
  20. 6D模型:超越PDCA

热门文章

  1. 走在浪潮尖端——为什么选择云计算
  2. 为什么工作10年你的工资还不如新来的实习生
  3. Linux下实现多网卡绑定
  4. ie中placeholder字体颜色兼容问题
  5. 机器学习:选对时机直线超车
  6. 代理 block 通知传值
  7. C 语言 *** glibc detected *** free(): invalid next size (fast): 0x0000000000be1010 ***
  8. 从oracle9i/92数据库中导出数据至 oracle 8.1.7 数据库中
  9. Linux Kernel TCP/IP Stack — L7 Layer — 高性能网络 I/O 服务器模型
  10. 计算机组成原理 — ARM 体系结构