R语言中的聚类的使用
这里的聚类主要用到K-Means和K-Medoide聚类。在进行聚类之前,为了避免不同参数之间量纲不同所造成的影响,先将数据进行(0-1)标准化
# 如参数weight data$weight <- (data$weight-min(data$weight))/(max(data$weight)-min(data$weight))
K-Means算法
1.读取数据
data <- read.csv("data/km/data.csv",header = T)
2.调用kmeans算法
# 设置聚类数 cluster_num <- 5 # 调用kmeans算法 km <- kmeans(data,cluster_num)
3.查看分类情况和总体汇总
# 查看具体分类情况 fitted(km) # 查看分类概括 table(data$weight, km$cluster)
4.将结果保存
# 构建新数据框映射 df <- data.frame(km[[1]],data$weight) # 参数重新命名 names(df) <- (c("classification_number","weight")) # 保存写入 write.csv(df,file="data/km.csv")
K-Medoide算法
这里用到K-Medoide中对大样本数据处理的算法------CLARA算法
1.下载cluster包
install.packages("cluster")
2.引入cluster包
# 引入cluster包 library(cluster)
3.读取数据
data <- read.csv("data/km/data.csv",header = T)
4.调用CLARA算法
# 设置聚类数 cluster_num <- 5 # 调用CLARA算法 cl <- clara(data,cluster_num)
5.将结果保存
# 构建新数据框映射 df <- data.frame(cl$clustering,data$weight) #参数重新命名names(df) <- (c("classification_number","weight")) # 写入 write.csv(df,file="data/clara.csv")
转载于:https://www.cnblogs.com/xiaomingzaixian/p/9269167.html
R语言中的聚类的使用相关推荐
- R语言绘制带聚类树的堆叠柱形图
R语言绘制带聚类树的堆叠柱形图 聚类树与柱形图结合,即可反映样本或分组间的相似性,又能展示样本内的元素组成信息. 例如下图是一个在扩增子测序微生物群落分析中常见的统计图类型,在测序公司给的报告中通常都 ...
- R语言中的多项式回归、局部回归、核平滑和平滑样条回归模型
全文下载链接:http://tecdat.cn/?p=20531 当线性假设无法满足时,可以考虑使用其他方法(点击文末"阅读原文"获取完整代码数据). 相关视频 多项式回归 扩展可 ...
- R语言中如何进行PCA分析?利用ggplot和prcomp绘制基因表达量分析图
学习笔记的主要内容是在R语言中利用ggplot2进行PCA分析和绘图,包括简单分析与操作流程,对比不同方式得到的结果差异,提供脚本代码供练习. PCA分析的原理 在处理基因差异表达数据时,有时候需要分 ...
- 如何在R语言中建立六边形矩阵热图heatmap可视化
原文链接:http://tecdat.cn/?p=18879 这是一个六边形热图可视化程序,主要用到的知识RColorBrewer,fields,也就是R中的可视化绘图库(点击文末"阅读原文 ...
- R语言中使用pkgbuild::find_rtools查看是否有Rtools、使用Sys.which函数查看make是否存在、如果没有则安装、使用writeLines函数绑定R和Rtools
R语言中使用pkgbuild::find_rtools(debug = TRUE)查看是否有Rtools.使用Sys.which函数查看make是否存在.如果没有则安装Rtools.使用writeLi ...
- R语言中如何计算C-Statistics?几种计算方法详解
R语言中如何计算C-Statistics?几种计算方法详解 目录 R语言中如何计算C-Statistics? #包导入 #数据加载编码
- r语言 rgl 强制过程中_一个R语言中操纵矢量空间数据的标准化工具—sf
注: 本文是R语言sf包的核心开发者和维护者--来自德国明斯特大学的地理信息学教授:Edzer Pebesma 的一篇关于sf包的简介,发表于2018年7月的R语言期刊,主要讲述了sf的定位.功能. ...
- R语言中的特殊值 NA NULL NaN Inf
这几个都是R语言中的特殊值,都是R的保留字, NA:Not available 表示缺失值 用 is.na() 来判断是否为缺失值 NULL:表示空值,即没有内容 用 is.null() 来判 ...
- R开发(part8)--应用R语言中的函数环境空间
学习笔记,仅供参考,有错必纠 文章目录 R开发 应用R语言中的函数环境空间 R语言的函数环境空间 封闭环境 绑定环境 运行环境 调用环境 函数环境空间图示 R开发 应用R语言中的函数环境空间 R语言的 ...
最新文章
- 设备履历管理系统php开源,航空机载设备履历本管理制作系统诞生记
- Docker Machine-Windows
- “阿里爸爸”最新出品SpringBoot高级笔记(全彩版)--网盘链接自取
- sequence跳号问题及解决办法
- sql server服务器位置,SQL语句实现查询SQL Server服务器名称和IP地址
- 条款12:复制对象时勿忘其每一个部分
- 中路径查找器的功能_还在用路径查找器?试试它吧!
- Android-消息机制总结
- CCF202104-3 DHCP服务器(100分)【模拟】
- C/C++心得-从内存开始
- [转]Android 超高仿微信图片选择器 图片该这么加载
- Java集合Collection之遍历方法总结(List、Map、Set)
- 【Android病毒分析报告】- 手机支付毒王“银行悍匪”的前世今生
- HTML中使用a标签实现文本内链接—零基础自学网页制作
- oracle的单引号和双引号的深入举例分析
- 【手写源码-设计模式9】-装饰器模式-基于王者荣耀英雄-甄姬皮肤场景
- 阿浪与佩奇在Java遇到的muddy puddles
- python中运用django_【Django】在项目中使用python
- Android 4高级编程(第3版)
- 6D模型:超越PDCA
热门文章
- 走在浪潮尖端——为什么选择云计算
- 为什么工作10年你的工资还不如新来的实习生
- Linux下实现多网卡绑定
- ie中placeholder字体颜色兼容问题
- 机器学习:选对时机直线超车
- 代理 block 通知传值
- C 语言 *** glibc detected *** free(): invalid next size (fast): 0x0000000000be1010 ***
- 从oracle9i/92数据库中导出数据至 oracle 8.1.7 数据库中
- Linux Kernel TCP/IP Stack — L7 Layer — 高性能网络 I/O 服务器模型
- 计算机组成原理 — ARM 体系结构