转载自:http://www.52analysis.com/R/

下面列出了可用于数据挖掘的R包和函数的集合。其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来。

1、聚类

常用的包: fpc,cluster,pvclust,mclust

基于划分的方法: kmeans, pam, pamk, clara

基于层次的方法: hclust, pvclust, agnes, diana

基于模型的方法: mclust

基于密度的方法: dbscan

基于画图的方法: plotcluster, plot.hclust

基于验证的方法: cluster.stats

2、分类

常用的包:

rpart,party,randomForest,rpartOrdinal,tree,marginTree,

maptree,survival

决策树: rpart, ctree

随机森林: cforest, randomForest

回归, Logistic回归, Poisson回归: glm, predict, residuals

生存分析: survfit, survdiff, coxph

3、关联规则与频繁项集

常用的包:

arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则

DRM:回归和分类数据的重复关联模型

APRIORI算法,广度RST算法:apriori, drm

ECLAT算法: 采用等价类,RST深度搜索和集合的交集: eclat

4、序列模式

常用的包: arulesSequences

SPADE算法: cSPADE

5、时间序列

常用的包: timsac

时间序列构建函数: ts

成分分解: decomp, decompose, stl, tsr

6、统计

常用的包: Base R, nlme

方差分析: aov, anova

密度分析: density

假设检验: t.test, prop.test, anova, aov

线性混合模型:lme

主成分分析和因子分析:princomp

7、图表

条形图: barplot

饼图: pie

散点图: dotchart

直方图: hist

密度图: densityplot

蜡烛图, 箱形图 boxplot

QQ (quantile-quantile) 图: qqnorm, qqplot, qqline

Bi-variate plot: coplot

树: rpart

Parallel coordinates: parallel, paracoor, parcoord

热图, contour: contour, filled.contour

其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,

assocplot, mosaicplot

保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png

8、数据操作

缺失值:na.omit

变量标准化:scale

变量转置:t

抽样:sample

堆栈:stack, unstack

其他:aggregate, merge, reshape

9、与数据挖掘软件Weka做接口

RWeka: 通过这个接口,可以在R中使用Weka的所有算法。

R语言与数据挖掘学习笔记(常用的包)相关推荐

  1. 【转载】R语言与数据挖掘学习笔记

    (1):数据挖掘相关包的介绍 今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整 ...

  2. R语言与机器学习学习笔记(分类算法)

    转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...

  3. 语言 提取列名_学习健明老师发布的R语言练习题的学习笔记(二)

    学习者:骆栢维 题目来源:生信基石之R语言 中级10 个题目:http://www.bio-info-trainee.com/3750.html 备注:本文为笔者学习健明老师GitHub答案代码的学习 ...

  4. 《Go语言圣经》学习笔记 第十章 包和工具

    <Go语言圣经>学习笔记 第十章 包和工具 目录 包简介 导入路径 包声明 导入声明 包的匿名导入 包和命名 工具 注:学习<Go语言圣经>笔记,PDF点击下载,建议看书. G ...

  5. R语言与点估计学习笔记(矩估计与MLE)

    众所周知,R语言是个不错的统计软件.今天分享一下利用R语言做点估计的内容.主要有:矩估计.极大似然估计.EM算法.最小二乘估计.刀切法(Jackknife).自助法(Bootstrap)的相关内容. ...

  6. R plot图片背景设置为透明_学习健明老师发布的R语言练习题的学习笔记(一)...

    学习者:骆栢维 题目来源:生信基石之R语言 初级10 个题目:http://www.bio-info-trainee.com/3793.html 备注:本文为笔者学习健明老师GitHub答案代码的学习 ...

  7. R语言基础知识-学习笔记汇总

    B站课程:生信必备技巧之R语言基础教程全集的代码笔记 1.R语言包安装 rm(list = ls()) # 设置镜像: options()$repos options()$BioC_mirror #o ...

  8. R语言入门(学习笔记)

    文章目录 软件安装及更新 安装R语言 安装Rstudio(集成开发环境,在安装R语言后再安装) R版本更新 软件操作 窗口简介 界面设置 编码转换 快捷键 基础语法 注释 赋值 清除 帮助文档 R包 ...

  9. R语言与点估计学习笔记(刀切法与最小二乘估计)

    一.       刀切法(jackknife) 刀切法的提出,是基于点估计准则无偏性.刀切法的作用就是不断地压缩偏差.但需要指出的是缩小偏差并不是一个好的办法,因为偏差趋于0时,均方误差会变得十分大. ...

最新文章

  1. 【虚拟机】苹果虚拟机mac10.11.6+Xcode8.1
  2. python循环语句-python语句中Python循环语句(附代码)
  3. 计算机软件ds,[计算机软件及应用]dsjs.ppt
  4. VS2008生成DLL文件的方法、引用dll文件以及意义
  5. c语言用户输入编程,C语言入门教程-Printf:读取用户输入
  6. 【电信增值业务学习笔记】10基于业务节点的增值业务提供技术
  7. Android 系统(218)---Android的事件分发机制以及滑动冲突的解决
  8. tiktok跨境出海?
  9. redis 所有模糊key 查询_写完这篇Redis由浅入深剖析快自闭了!
  10. 解决安装并配置好 hb后,hb -h检测不对
  11. Maven搭建webService (一) 创建服务端---使用main函数发布服务
  12. c# 条件编译 Conditional (DEBUG)
  13. 如何服务器备份到移动硬盘,数据安全第一!威联通如何外接硬盘备份和同步
  14. pdf英文转换成html网页,Pdf转HTML转换工具
  15. printf二进制数据
  16. 设置表格列宽 —— 在富文本编辑器中的实现
  17. Java 版spark Streaming 维护kafka 的偏移量
  18. 对100层楼两个玻璃球测试问题的理解
  19. 比亚迪芯片BF7615BMxx芯片怎么烧录
  20. 计算机标准差的按键是什么,在计算器上用标准差键直接求离均差平方和的方法...

热门文章

  1. Android之Camera预览
  2. 毕业5年决定人的一生-- 大家千万不要错过这篇文章
  3. 深度学习自学(三十九):SRN骨架检测 Side-output Residual Network for Object Symmetry Detection in the Wild
  4. ubuntu 20.04 安装可编辑截图工具 flameshot
  5. python创建树结构、求深度_Python实现二叉树的最小深度的两种方法
  6. 右手螺旋判断磁感应强度方向_弹簧左旋or右旋在功能和应用上有什么区别,如何判断左旋还是右旋...
  7. c语言创建一个文本文件datadat,c语言文件选择题.docx
  8. php 修改json数组的值,php – 无法通过str_replace更改JSON数组中的值
  9. 前端从入门到精通(记录自己的前端学习之路)都是一些自己做的笔记
  10. HTML的定义和特点,【HTML】复习笔记(一)初识HTML