R语言之LDA算法应用
在R语言中我们用LDA算法的做预测的时候包,主要的MASS包。在这里我就不对于LDA算法进行详细的描述,只是根据问题的需求用R语言解决问题。我们使用的数据是KKNN包中的自带数据miete数据。主要对于该数据进行划分:1/3为测试数据,2/3为训练数据,通过对于数据的观察,预测测试数据中的nmkat对应的值。
观察数据:
library(kknn)
data("miete")
head(miete)
dim(miete)
summary(miete)
划分数据:1/3测试数据,2 /3训练数据
####等样抽取
library(sampling)
n=round(2/3*nrow(miete)/5)
n
sub_train=strata(miete,stratanames="nmkat",size=rep(n,5),method="srswor")
head(sub_train)
#剔除1、3、12 属性
data_train=getdata(miete[,c(-1,-3,-12)],sub_train$ID_unit)
data_test=getdata(miete[,c(-1,-3,-12)],-sub_train$ID_unit)
dim(data_test);dim(data_train)
LDA算法进行预测
##1.LDA算法
library(MASS)
ff1=lda(nmkat~.,data_train)
head(ff1)
ff1$prior
ff1$counts
ff1$means
ff1
ff2=predict(ff1,data_test)
ff2$class
ff2$posterior
table(data_test$nmkat,ff2$class)
准确率的计算:
#错误率的计算
error_data=sum(as.numeric(as.numeric(ff2$class)!=as.numeric(data_test$nmkat)))/nrow(data_test)
error_data
1-error_data
对于LDA算法预测的准确率:
1 2 3 4 51 56 16 1 1 12 22 40 21 3 03 2 16 35 12 14 0 0 15 43 65 0 0 0 20 51
error_data
[1] 0.378453
> 1-error_data
[1] 0.621547
R语言之LDA算法应用相关推荐
- R语言实现LDA算法(鸢尾花)
R代码 链接: link. 亲测有效 下面展示一些 内联代码片. install.packages("MASS") library(MASS) nx = 150 irisdata ...
- R语言基于Bagging算法(融合多个决策树)构建集成学习Bagging分类模型、并评估模型在测试集和训练集上的分类效果(accuray、F1、偏差Deviance):Bagging算法与随机森林对比
R语言基于Bagging算法(融合多个决策树)构建集成学习Bagging分类模型.并评估模型在测试集和训练集上的分类效果(accuray.F1.偏差Deviance):Bagging算法与随机森林对比 ...
- R语言使用apriori算法进行关联规则挖掘实战:关联规则概念、频繁项集、支持度(support)、置信度(confidence)、提升度(lift)、apriori算法
R语言使用apriori算法进行关联规则挖掘实战:关联规则概念.频繁项集.支持度(support).置信度(confidence).提升度(lift).apriori算法 目录
- R语言基于机器学习算法进行特征筛选(Feature Selection)
R语言基于机器学习算法进行特征筛选(Feature Selection) 对一个学习任务来说,给定属性集,有些属性很有用,另一些则可能没什么用.这里的属性即称为"特征"(featu ...
- Logit Beta分布及其R语言随机模拟算法
Logit Beta分布及其R语言随机模拟算法 Logit Beta分布 Logit Beta分布的采样算法 Logit Beta分布是一个在广义线性模型中时常遇到的分布,通常是作为模型算法的一个中间 ...
- R语言:预测算法常用包总结
R语言用于预测的算法常见包总结如下:
- consplan r语言_模拟退火算法实现:求解中国31个城市TSP问题
最近在学习玻尔兹曼机,里面用到了模拟退火算法,经过一天的实验,总算顺利完成,本文打算记录这一过程,以作备忘. 本文内容如下: 1.实验环境 2.算法原理简介 3.TSP案例代码实现 4.运行结果解析 ...
- R语言笔记⑧——数据挖掘算法
目录 数据挖掘算法 聚类算法 Kmeans算法 协同过滤算法 决策树算法 关联规则 支持度 置信度 增益 Apriori算法 R语言中的关联规则 神经网络算法 人工神经元 转移函数 BP神经网络 算法 ...
- R语言-kNN算法进行乳腺癌诊断
完整代码如下: wbdc<-read.csv("/Users/wenfeng/Desktop/R&ML/机器学习和R语言/机器学习实验6 KNN/wisc_bc_data.cs ...
最新文章
- Rsync命令参数详解
- flink state ttl
- Python开发-- Lesson 2--Python数据类型(2016/07/30)
- mysql 开启事务_MySQL可重读隔离级别的底层实现原理
- centos mysql mongodb_MySQL与MongoDB
- android.support.v7.app.AlertDialog.Builder使用说明
- Django模板语言及视图
- 二分法01:查找一个数
- wallys/IPQ4019/IPQ4029/Access Point Wireless Module Dual band 11AC Wave2 Module
- php影院影城源码,99影院源码 影视网站程序源码/附教程
- spring boot 请求转发和重定向
- 互联网电商大数据架构图
- 做电子相册思路 c语言,C/C++编程笔记:C语言制作情侣必备《爱情电子相册》,源码解析!...
- JVM 垃圾收集器(Garbage Collection)
- iPhone苹果手机的safari打开网页上显示不安全改如何解决
- PS:“内容识别填充”去水印
- 一、万维网的发展(W3C组织的建立)
- 为程序添加windows注册表
- wp7开发实例:Baby Sign Language
- 排序---小白鼠排队
热门文章
- 什么?还在用delete删除数据《死磕MySQL系列 九》
- 二维码登录原理+Web端即时通讯技术
- Linux如何永久以命令行界面形式登录
- 【物联网中间件平台-02】YFIOs技术白皮书(V1.1)
- 大小限制_微信传文件有大小限制怎么办?教你3秒把100MPPT压缩成10M
- Java——LocalDateTime
- BeatMark X for mac(fcpx音乐卡点神器)
- python的plt绘制子图_Matplotlib 多子图绘制
- tensorflow出现报错: Could not locate zlibwapi.dll或者Could not load library cudnn_cnn_infer64_8.dll.
- 诊断和响应故障_验证数据库文件和备份