数据挖掘的R包和函数的集合
数据挖掘的R包和函数的集合
1、聚类
常用的包: fpc,cluster,pvclust,mclust
基于划分的方法: kmeans, pam, pamk, clara
基于层次的方法: hclust, pvclust, agnes, diana
基于模型的方法: mclust
基于密度的方法: dbscan
基于画图的方法: plotcluster, plot.hclust
基于验证的方法: cluster.stats
2、分类
常用的包:
rpart,party,randomForest,rpartOrdinal,tree,marginTree,
maptree,survival
决策树: rpart, ctree
随机森林: cforest, randomForest
回归, Logistic回归, Poisson回归: glm, predict, residuals
生存分析: survfit, survdiff, coxph
3、关联规则与频繁项集
常用的包:
arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则
DRM:回归和分类数据的重复关联模型
APRIORI算法,广度RST算法:apriori, drm
ECLAT算法: 采用等价类,RST深度搜索和集合的交集: eclat
4、序列模式
常用的包: arulesSequences
SPADE算法: cSPADE
5、时间序列
常用的包: timsac
时间序列构建函数: ts
成分分解: decomp, decompose, stl, tsr
6、统计
常用的包: Base R, nlme
方差分析: aov, anova
密度分析: density
假设检验: t.test, prop.test, anova, aov
线性混合模型:lme
主成分分析和因子分析:princomp
7、图表
条形图: barplot
饼图: pie
散点图: dotchart
直方图: hist
密度图: densityplot
蜡烛图, 箱形图 boxplot
QQ (quantile-quantile) 图: qqnorm, qqplot, qqline
Bi-variate plot: coplot
树: rpart
Parallel coordinates: parallel, paracoor, parcoord
热图, contour: contour, filled.contour
其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,
assocplot, mosaicplot保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png
8、数据操作
缺失值:na.omit
变量标准化:scale
变量转置:t
抽样:sample
堆栈:stack, unstack
其他:aggregate, merge, reshape
9、与数据挖掘软件Weka做接口
RWeka: 通过这个接口,可以在R中使用Weka的所有算法。
数据挖掘的R包和函数的集合相关推荐
- FEMS:微生物群落生态学数据挖掘的R包microeco
英文原名:microeco: An R package for data mining in microbial community ecology 中文译名:微生物群落生态学数据挖掘的R包micro ...
- R语言与数据分析(7)-R包的使用
R包介绍 R包是函数.数据与编译代码以一种定义完善的格式组成的集合, 计算机上存储包的目录称为库library,==函数.libPaths()==可以显示库所在的位置 library() 可以显示库中 ...
- r语言 tunerf函数_R语言︱常用统计方法包 机器学习包(名称、简介)
一.一些函数包大汇总 转载于:http://www.dataguru.cn/thread-116761-1-1.html 时间上有点过期,下面的资料供大家参考 基本的R包已经实现了传统多元统计的很多功 ...
- 把函数包起来就是一个R包 - 完整开发指南
生物信息学习的正确姿势 NGS系列文章包括NGS基础.高颜值在线绘图和分析.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流 ...
- R语言stringr包str_dup函数字符串多次复制实战
R语言stringr包str_dup函数字符串多次复制实战 目录 R语言stringr包str_dup函数字符串多次复制实战 #导入stringr包 #仿真数据
- R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(添加箱图、带缺口的小提琴图、小提琴图)实战
R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(添加箱图.带缺口的小提琴图.小提琴图)实战 目录 R语言使用ggplot2包geom_jit ...
- R语言stringr包str_count函数计算字符串匹配个数实战
R语言stringr包str_count函数计算字符串匹配个数实战 目录 R语言stringr包str_count函数计算字符串匹配个数实战 #导入stringr包 #仿真数据
- R语言ggpubr包ggsummarystats函数可视化分组条形图(自定义分组颜色、添加抖动数据点jitter、误差条)并在X轴标签下方添加分组对应的统计值(样本数N、中位数、四分位数的间距iqr)
R语言ggpubr包ggsummarystats函数可视化分组条形图(自定义分组颜色.添加抖动数据点jitter.误差条error bar)并在X轴标签下方添加分组对应的统计值(样本数N.中位数med ...
- R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(颜色配置:连续色彩、离散色彩、色彩梯度)实战
R语言使用ggplot2包geom_jitter()函数绘制分组(strip plot,一维散点图)带状图(颜色配置:连续色彩.离散色彩.色彩梯度)实战 目录 R语言使用ggplot2包geom_ji ...
最新文章
- 力扣(LeetCode)刷题,简单题(第27期)
- POJ 2418 Hardwood Species(trie 树)
- DOCKER上运行DOTNET CORE
- 运用SQLAlchemy
- 【2017级面向对象程序设计】第2次成绩排行
- pytorch学习笔记(5):vgg实现以及一些tricks
- 第三次实验及动手动脑
- PCB Genesis脚本 C#调用Javascript
- htc tracker avatar
- 高等代数——大学高等代数课程创新教材(丘维声)——3.8笔记+习题
- 《规划力:如何清晰预见成功轨迹》PDF文字版电子书下载
- 《精通Javascript+jQuery》视频教程
- 魔窗mLink发布2019收费标准,20W年费是物有所值?还是重度收费?
- 异常:java.lang.IllegalArgumentException: Result Maps collection already contains
- 焦虑症和抑郁症有什么区别吗?
- Round12—Huffman 树
- 问题解决:The connection to the server xxxxx:6443 was refused - did you specify the right host or port?
- 解析steam教育中的技术赋能
- Ubuntu 20.04 Desktop 设置桌面图标大小、间距
- hexo支持mathjax
热门文章
- 服务器宕机记录16.12.14
- 对搜狗搜索引擎的评价
- 细数人工智能这几年的悲与喜
- 友盟+总裁罗金鹏:增长寒冬下,数据运营还能有哪些机会?
- 计算机毕业设计 SpringBoot+Vue线上素菜超市平台蔬菜商城管理系统 蔬菜超市平台系统
- 《东周列国志》第九十九回 武安君含冤死杜邮 吕不韦巧计归异人
- 国际码可以直接应用于计算机,2001年4月份全国高等教育自学考试计算机应用基础试题...
- c语言程序设计科研训练报告,科研训练总结精选 .doc
- IE6及IE8默认SSL设置
- java 阿拉伯语_用Java排序阿拉伯语单词