R语言有很多包可以做机器学习(Machine Learning)的任务。机器学习的任务主要有有监督的学习方式和无监督的学习方式。

有监督学习:在正确结果指导下的学习方式,若是正确结果是定性的,属于分类问题;若正确结果是定量的,属于回归问题。

无监督学习:在没有正确结果指导下的学习方式,例如:聚类分析、降维处理等

有很多R包可以做机器学习,本文介绍RForML之核心包:e1071

一、 e1071包简介

e1071包实现了机器学习里面的SVM(支持向量机)算法,NB(朴素贝叶斯)算法、模糊聚类算法、装袋聚类算法等。

二、e1071包安装和加载

e1071包是R的扩展包,需要先安装,再加载,才能使用这个包里面函数做机器学习任务。

安装和加载e1071包的代码

if(!suppressWarnings(require(e1071)))

{

install.packages('e1071')

require(e1071)

}

三、e1071包做机器学习

e1071包做预测,即分类和回归。

1、分类问题

利用SVM算法对UCI的glass数据进行分类

SVM算法

R代码

##第一步:载入mlbench的Glass数据集

if(!suppressWarnings(require(mlbench)))

{

install.packages('mlbench')

require(mlbench)

}

data(Glass, package="mlbench")

##第二步:数据集划分:训练集和测试集

index

testindex

testset

trainset

##第三步:构建SVM模型

svm.model

##第四步:SVM模型应用到测试数据集

svm.pred

##第五步:模型结果评估

##1混淆矩阵

table(pred = svm.pred, true = testset[,10])

##2计算Accuracy和Kappa值

classAgreement(table(pred = svm.pred, true = testset[,10]))

2、回归问题

回归算法

R代码

##第一步:载入mlbench的Ozone数据集

if(!suppressWarnings(require(mlbench)))

{

install.packages('mlbench')

require(mlbench)

}

data(Ozone, package="mlbench")

View(Ozone)

##第二步:数据集划分,训练集和测试集7:3

index

testindex

trainset

dim(trainset)

testset

dim(testset)

##第三步:创建SVM模型

svm.model

##第四步:利用SVM 模型预测目标变量的值

svm.pred

##第五步:计算MSE(Mean Squared Error)

crossprod(svm.pred - testset[,3]) / length(testindex)

参考资料

作者:JackWang

个人介绍:专注于从数据中学习,努力发掘数据之洞见,积极利用数据之价值。

1071svm函数 r语言_R语言机器学习之核心包e1071 - 数据分析相关推荐

  1. r spgm 语言_R语言 splm包 spml()函数中文帮助文档(中英文对照)

    spml(splm) spml()所属R语言包:splm Spatial Panel Model by Maximum Likelihood 空间面板模型的最大似然法(Maximum Likeliho ...

  2. consplan r语言_R语言 函数与模型(16):超效率DEA

    原标题:R语言 函数与模型(16):超效率DEA All is Study, All is Research 超效率DEA与R语言运用 卢倩倩 中国人民大学 全文约700字 预计需3分钟阅读全文 SD ...

  3. biodist r语言_R语言 Biostrings包 pairwiseAlignment()函数中文帮助文档(中英文对照)

    pairwiseAlignment(Biostrings) pairwiseAlignment()所属R语言包:Biostrings Optimal Pairwise Alignment 最佳成对排列 ...

  4. 1071svm函数 r语言_如何利用R语言中的rpart函数建立决策树模型

    决策树是根据若干输入变量的值构造出一个适合的模型,以此来预测输出变量的值,并用树形结构展示出来.决策树主要有两个类别:分类树和回归树.分类树主要针对离散的目标变量,回归树则针对连续的目标变量.R语言中 ...

  5. 1071svm函数 r语言,科学网—R中的svm - 吴锐的博文

    svm理解: LSSVM: 最小二乘支持向量机(Least squares support vector Maehine,LSSVM)是SVM的一种变体,把问题转化成对一个 线性方程求解,所需计算资源 ...

  6. 包r语言_R语言代码共享:制作R包

    作者:黄天元,复旦大学博士在读,热爱数据科学与开源工具(R),致力于利用数据科学迅速积累行业经验优势和科学知识发现,涉猎内容包括但不限于信息计量.机器学习.数据可视化.应用统计建模.知识图谱等,著有& ...

  7. CSDN ARIMA R语言_R语言实现Fleiss#39; Kappa系数处理多个观察者一致性检验

    Fleiss' kappa系数.该检验适用于分析重复测量3次及以上且测量结果是无序分类变量的重测一致性或观察者一致性检验.SPSS没有内置操作模块,但可以通过拓展包输出结果.Fleiss' kappa ...

  8. dataframe第二列 r语言_R语言-数据框

    1. 数据框的建立 数据框是R语言中一种重要的数据结构.数据框类似于矩阵,有行和列两个维度.数据框和矩阵不同的是,数据框的每一列可以是不同的模式.例如,有些列是数字组成,有些列是字符串组成.数据框通过 ...

  9. 格兰杰因果关系检验r语言_R语言系列第四期:R语言单样本双样本差异性检验

    之前详细介绍了利用R语言进行统计描述,详情点击:R语言系列第三期:①R语言单组汇总及图形展示.R语言系列第三期:②R语言多组汇总及图形展示.R语言系列第三期:③R语言表格及其图形展示 从这个部分我们就 ...

最新文章

  1. 「思想钢印」成真!33位中美科学家最新成果:用光成功改变大脑认知
  2. MYSQL事务隔离级别详解附加实验
  3. python自动化测试平台github_GitHub - DangKaio/FXTest: 接口自动化测试平台——python+flask版,支持http协议...
  4. 读书笔记_代码大全2第十章_变量初始化
  5. linux 如何查看应用程序进程号、端口
  6. S/4HANA for Customer Management里的搜索分页处理 1
  7. 张洁的新书「流浪的老狗」
  8. 判断系统是大端还是小段
  9. 小程序分享到朋友圈_如何给小程序添加分享朋友圈
  10. 【ICCV2019】点云相关论文解析
  11. 单片机多大的ram才可以带动tft lcd_【单片机自学】7.液晶实验
  12. Suse Enterprise Server 11的安装
  13. 在几何画板中如何制作圆柱的侧面展开动画_几何画板制作圆柱体的形成动画演示方法...
  14. java计算机毕业设计大数据在线考试系统在线阅卷系统及大数据统计分析(附源码、数据库)
  15. JConsole详解
  16. 免费的上网行为管理系统和软路由系统推荐。
  17. 以太网未识别的网络问题
  18. Kafka_producer
  19. js图片切换 幻灯片效果
  20. eclpse配置tomact

热门文章

  1. POJ3274Gold Balanced Lineup(哈希)
  2. ORACLE HANDBOOK系列之十一:分区(Partition)
  3. green ethernet
  4. POS机C井例子代码(2)
  5. flush privileges
  6. php控制器教程,laravel基础教程 -- 控制器
  7. Logstash入门简介
  8. libSVM分类小例C++
  9. uboot源码——内核启动分析
  10. Hbase Rowkey设计原则