R语言与数据挖掘学习笔记(常用的包)
转载自:http://www.52analysis.com/R/
下面列出了可用于数据挖掘的R包和函数的集合。其中一些不是专门为了数据挖掘而开发,但数据挖掘过程中这些包能帮我们不少忙,所以也包含进来。
1、聚类
常用的包: fpc,cluster,pvclust,mclust
基于划分的方法: kmeans, pam, pamk, clara
基于层次的方法: hclust, pvclust, agnes, diana
基于模型的方法: mclust
基于密度的方法: dbscan
基于画图的方法: plotcluster, plot.hclust
基于验证的方法: cluster.stats
2、分类
常用的包:
rpart,party,randomForest,rpartOrdinal,tree,marginTree,
maptree,survival
决策树: rpart, ctree
随机森林: cforest, randomForest
回归, Logistic回归, Poisson回归: glm, predict, residuals
生存分析: survfit, survdiff, coxph
3、关联规则与频繁项集
常用的包:
arules:支持挖掘频繁项集,最大频繁项集,频繁闭项目集和关联规则
DRM:回归和分类数据的重复关联模型
APRIORI算法,广度RST算法:apriori, drm
ECLAT算法: 采用等价类,RST深度搜索和集合的交集: eclat
4、序列模式
常用的包: arulesSequences
SPADE算法: cSPADE
5、时间序列
常用的包: timsac
时间序列构建函数: ts
成分分解: decomp, decompose, stl, tsr
6、统计
常用的包: Base R, nlme
方差分析: aov, anova
密度分析: density
假设检验: t.test, prop.test, anova, aov
线性混合模型:lme
主成分分析和因子分析:princomp
7、图表
条形图: barplot
饼图: pie
散点图: dotchart
直方图: hist
密度图: densityplot
蜡烛图, 箱形图 boxplot
QQ (quantile-quantile) 图: qqnorm, qqplot, qqline
Bi-variate plot: coplot
树: rpart
Parallel coordinates: parallel, paracoor, parcoord
热图, contour: contour, filled.contour
其他图: stripplot, sunflowerplot, interaction.plot, matplot, fourfoldplot,
assocplot, mosaicplot
保存的图表格式: pdf, postscript, win.metafile, jpeg, bmp, png
8、数据操作
缺失值:na.omit
变量标准化:scale
变量转置:t
抽样:sample
堆栈:stack, unstack
其他:aggregate, merge, reshape
9、与数据挖掘软件Weka做接口
RWeka: 通过这个接口,可以在R中使用Weka的所有算法。
R语言与数据挖掘学习笔记(常用的包)相关推荐
- 【转载】R语言与数据挖掘学习笔记
(1):数据挖掘相关包的介绍 今天发现一个很不错的博客(http://www.RDataMining.com),博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整 ...
- R语言与机器学习学习笔记(分类算法)
转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...
- 语言 提取列名_学习健明老师发布的R语言练习题的学习笔记(二)
学习者:骆栢维 题目来源:生信基石之R语言 中级10 个题目:http://www.bio-info-trainee.com/3750.html 备注:本文为笔者学习健明老师GitHub答案代码的学习 ...
- 《Go语言圣经》学习笔记 第十章 包和工具
<Go语言圣经>学习笔记 第十章 包和工具 目录 包简介 导入路径 包声明 导入声明 包的匿名导入 包和命名 工具 注:学习<Go语言圣经>笔记,PDF点击下载,建议看书. G ...
- R语言与点估计学习笔记(矩估计与MLE)
众所周知,R语言是个不错的统计软件.今天分享一下利用R语言做点估计的内容.主要有:矩估计.极大似然估计.EM算法.最小二乘估计.刀切法(Jackknife).自助法(Bootstrap)的相关内容. ...
- R plot图片背景设置为透明_学习健明老师发布的R语言练习题的学习笔记(一)...
学习者:骆栢维 题目来源:生信基石之R语言 初级10 个题目:http://www.bio-info-trainee.com/3793.html 备注:本文为笔者学习健明老师GitHub答案代码的学习 ...
- R语言基础知识-学习笔记汇总
B站课程:生信必备技巧之R语言基础教程全集的代码笔记 1.R语言包安装 rm(list = ls()) # 设置镜像: options()$repos options()$BioC_mirror #o ...
- R语言入门(学习笔记)
文章目录 软件安装及更新 安装R语言 安装Rstudio(集成开发环境,在安装R语言后再安装) R版本更新 软件操作 窗口简介 界面设置 编码转换 快捷键 基础语法 注释 赋值 清除 帮助文档 R包 ...
- R语言与点估计学习笔记(刀切法与最小二乘估计)
一. 刀切法(jackknife) 刀切法的提出,是基于点估计准则无偏性.刀切法的作用就是不断地压缩偏差.但需要指出的是缩小偏差并不是一个好的办法,因为偏差趋于0时,均方误差会变得十分大. ...
最新文章
- 【虚拟机】苹果虚拟机mac10.11.6+Xcode8.1
- python循环语句-python语句中Python循环语句(附代码)
- 计算机软件ds,[计算机软件及应用]dsjs.ppt
- VS2008生成DLL文件的方法、引用dll文件以及意义
- c语言用户输入编程,C语言入门教程-Printf:读取用户输入
- 【电信增值业务学习笔记】10基于业务节点的增值业务提供技术
- Android 系统(218)---Android的事件分发机制以及滑动冲突的解决
- tiktok跨境出海?
- redis 所有模糊key 查询_写完这篇Redis由浅入深剖析快自闭了!
- 解决安装并配置好 hb后,hb -h检测不对
- Maven搭建webService (一) 创建服务端---使用main函数发布服务
- c# 条件编译 Conditional (DEBUG)
- 如何服务器备份到移动硬盘,数据安全第一!威联通如何外接硬盘备份和同步
- pdf英文转换成html网页,Pdf转HTML转换工具
- printf二进制数据
- 设置表格列宽 —— 在富文本编辑器中的实现
- Java 版spark Streaming 维护kafka 的偏移量
- 对100层楼两个玻璃球测试问题的理解
- 比亚迪芯片BF7615BMxx芯片怎么烧录
- 计算机标准差的按键是什么,在计算器上用标准差键直接求离均差平方和的方法...
热门文章
- Android之Camera预览
- 毕业5年决定人的一生-- 大家千万不要错过这篇文章
- 深度学习自学(三十九):SRN骨架检测 Side-output Residual Network for Object Symmetry Detection in the Wild
- ubuntu 20.04 安装可编辑截图工具 flameshot
- python创建树结构、求深度_Python实现二叉树的最小深度的两种方法
- 右手螺旋判断磁感应强度方向_弹簧左旋or右旋在功能和应用上有什么区别,如何判断左旋还是右旋...
- c语言创建一个文本文件datadat,c语言文件选择题.docx
- php 修改json数组的值,php – 无法通过str_replace更改JSON数组中的值
- 前端从入门到精通(记录自己的前端学习之路)都是一些自己做的笔记
- HTML的定义和特点,【HTML】复习笔记(一)初识HTML