R语言与概率统计(四) 判别分析(分类)
Fisher就是找一个线L使得组内方差小,组间距离大。即找一个直线使得d最大。
####################################1、判别分析,线性判别:2、分层抽样#install.packages('MASS') library(MASS) #install.packages('sampling') library(sampling)#抽样时使用 ?iris#了解该数据集 #把iris重新赋值,并加入分类标记和行号标记 i<-iris#为了书写方便 i$lv<-as.numeric(i$Species)#把最后一列变成数值型变量 i$lv<-as.factor(i$lv) #转成因子 i$id<-c(1:150)#添加变量id #进行分层抽样,每个类别随机抽出10个作为预测集,剩下的作为训练集 i.s<-strata(data=i,stratanames="lv",size=c(10,10,10),method="srswor",description=F) i.train<-i[!(i$id %in% i.s$ID_unit),]#%in%在此处表示i与i.s中标号相同的点。1 %in% 1 i.predict<-i[(i$id %in% i.s$ID_unit),] #拟合线性判别lda fit<-lda(lv~.-id-Species,data=i.train) #预测训练集和预测集 Y<-predict(fit,i.train) YN<-predict(fit,i.predict) #查看拟合情况 table(Y$class,i.train$lv) table(YN$class,i.predict$lv) #非线性规划 fit2<-qda(lv~.-id-Species,data=i.train)
转载于:https://www.cnblogs.com/caiyishuai/p/11167910.html
R语言与概率统计(四) 判别分析(分类)相关推荐
- R语言与概率统计(六) 主成分分析 因子分析
超高维度分析,N*P的矩阵,N为样本个数,P为指标,N<<P PCA:抓住对y对重要的影响因素 主要有三种:PCA,因子分析,回归方程+惩罚函数(如LASSO) 为了降维,用更少的变量解决 ...
- R语言与概率统计(三) 多元统计分析(中)
模型修正 #但是,回归分析通常很难一步到位,需要不断修正模型 ###############################6.9通过牙膏销量模型学习模型修正 toothpaste<-data. ...
- R语言与机器学习学习笔记(分类算法)
转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...
- R语言的各种统计分布函数
转载自品略图书馆 http://www.pinlue.com/article/2018/09/1613/487222559948.html R语言的各种统计分布函数 1.二项分布Binomial di ...
- R语言基础之第六部分 分类(史上最全含ddply、aggregate、split、by)
R语言基础之第六部分 分类(史上最全含ddply.aggregate.split.by) 数据: 某市2014年-2018年空气质量指数日数据,需要按年分类计算每年 warm值为1和 0的均值. 数据 ...
- 基于R语言逆概率加权(IPTW)并行生存曲线分析
逆概率加权法最早由 Horvitz和Thompson提出,即对每个可观测的yi的概率取倒数,作为被观测的 yi 的权重,修正由缺失数据或有偏抽样带来的估计偏差.IPTW 是减少多组观察性数据间混杂偏倚 ...
- R语言使用coin包应用于分类变量独立性问题的置换检验(permutation tests)、使用普通卡方检验chisq.test函数和置换近似卡方检验chisq.test函数、检验分类变量的独立性
R语言使用coin包应用于分类变量独立性问题的置换检验(permutation tests).使用普通卡方检验chisq.test函数和置换近似卡方检验chisq.test函数.检验分类变量的独立性( ...
- R语言使用table函数计算单分类变量的频率表(frequency table)、使用prop.table函数将table函数计算获得的频率表转化为比率表、返回单分类变量每一个类别的比率、或者百分比
R语言使用table函数计算单分类变量的频率表(frequency table).使用prop.table函数将table函数计算获得的频率表转化为比率表.返回单分类变量每一个类别的比率.或者百分比. ...
- R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray、F1、偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机)
R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray.F1.偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机) ...
最新文章
- SQL SERVER中求上月、本月和下月的第一天和最后一天[转]
- php header 重定向 url不变_PHP实现页面跳转功能
- springboot打包时加入本地jar打包
- 获取分辨率函数是什么_深度学习应用“Zero Shot”超分辨率重构图像
- 百度的索引真的比雅虎多么?
- 初始化HashMap的默认值——阿里巴巴编码规范系列
- 【离散数学中的数据结构与算法】二 欧几里得算法与裴蜀等式
- IT技术图书之《敏捷无敌》当小说看 你信吗?
- Python基础笔记(手写版)
- matlab瑞利衰落信道仿真
- LoadRunner录制app脚本详解
- 蜂巢APP启动优化实践
- 拖欠银行贷款的后果有哪些
- 小白新人Python哪些基础知识必学?
- 手机PDF如何转图片格式
- 网易2016笔试(3)
- 如何卸载360安全卫士
- 浊音/清音/爆破音的时域及频域特性
- mysql 26个随机字母_mysql生成随机密码(大写字母)
- platEMO:一款强大的多目标优化工具(MATLAB)
热门文章
- java hprof_java 性能之 hprof
- mysql表结构设计_表结构设计
- python安装第三方库win10_音频处理 windows10下python三方库librosa安装教程
- php 获取对象中的元素个数组长度,获取php类中的数组长度
- python拷贝是什么知识点_地址对象python 列表拷贝知识点 地址对象
- from flask.ext.cache import make_template_fragment_key
- 华为错误报告在哪个文件夹_华为手机隐藏的这7个秘密小技能,现在开启,手机还能再用3年...
- python dict遍历文件_python 字典(dict)遍历的四种方法性能测试报告
- 由浅入深剖析go channel
- 最全的http头部信息分析(转载)