Fisher就是找一个线L使得组内方差小,组间距离大。即找一个直线使得d最大。

####################################1、判别分析,线性判别:2、分层抽样#install.packages('MASS')
library(MASS)
#install.packages('sampling')
library(sampling)#抽样时使用
?iris#了解该数据集
#把iris重新赋值,并加入分类标记和行号标记
i<-iris#为了书写方便
i$lv<-as.numeric(i$Species)#把最后一列变成数值型变量
i$lv<-as.factor(i$lv) #转成因子
i$id<-c(1:150)#添加变量id
#进行分层抽样,每个类别随机抽出10个作为预测集,剩下的作为训练集
i.s<-strata(data=i,stratanames="lv",size=c(10,10,10),method="srswor",description=F)
i.train<-i[!(i$id %in% i.s$ID_unit),]#%in%在此处表示i与i.s中标号相同的点。1 %in% 1
i.predict<-i[(i$id %in% i.s$ID_unit),]
#拟合线性判别lda
fit<-lda(lv~.-id-Species,data=i.train)
#预测训练集和预测集
Y<-predict(fit,i.train)
YN<-predict(fit,i.predict)
#查看拟合情况
table(Y$class,i.train$lv)
table(YN$class,i.predict$lv)
#非线性规划
fit2<-qda(lv~.-id-Species,data=i.train)

转载于:https://www.cnblogs.com/caiyishuai/p/11167910.html

R语言与概率统计(四) 判别分析(分类)相关推荐

  1. R语言与概率统计(六) 主成分分析 因子分析

    超高维度分析,N*P的矩阵,N为样本个数,P为指标,N<<P PCA:抓住对y对重要的影响因素 主要有三种:PCA,因子分析,回归方程+惩罚函数(如LASSO) 为了降维,用更少的变量解决 ...

  2. R语言与概率统计(三) 多元统计分析(中)

    模型修正 #但是,回归分析通常很难一步到位,需要不断修正模型 ###############################6.9通过牙膏销量模型学习模型修正 toothpaste<-data. ...

  3. R语言与机器学习学习笔记(分类算法)

    转载自:http://www.itongji.cn/article/0P534092014.html 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型.神经 ...

  4. R语言的各种统计分布函数

    转载自品略图书馆 http://www.pinlue.com/article/2018/09/1613/487222559948.html R语言的各种统计分布函数 1.二项分布Binomial di ...

  5. R语言基础之第六部分 分类(史上最全含ddply、aggregate、split、by)

    R语言基础之第六部分 分类(史上最全含ddply.aggregate.split.by) 数据: 某市2014年-2018年空气质量指数日数据,需要按年分类计算每年 warm值为1和 0的均值. 数据 ...

  6. 基于R语言逆概率加权(IPTW)并行生存曲线分析

    逆概率加权法最早由 Horvitz和Thompson提出,即对每个可观测的yi的概率取倒数,作为被观测的 yi 的权重,修正由缺失数据或有偏抽样带来的估计偏差.IPTW 是减少多组观察性数据间混杂偏倚 ...

  7. R语言使用coin包应用于分类变量独立性问题的置换检验(permutation tests)、使用普通卡方检验chisq.test函数和置换近似卡方检验chisq.test函数、检验分类变量的独立性

    R语言使用coin包应用于分类变量独立性问题的置换检验(permutation tests).使用普通卡方检验chisq.test函数和置换近似卡方检验chisq.test函数.检验分类变量的独立性( ...

  8. R语言使用table函数计算单分类变量的频率表(frequency table)、使用prop.table函数将table函数计算获得的频率表转化为比率表、返回单分类变量每一个类别的比率、或者百分比

    R语言使用table函数计算单分类变量的频率表(frequency table).使用prop.table函数将table函数计算获得的频率表转化为比率表.返回单分类变量每一个类别的比率.或者百分比. ...

  9. R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray、F1、偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机)

    R语言构建随机森林模型randomForest分类模型并评估模型在测试集和训练集上的效果(accuray.F1.偏差Deviance):随机森林在Bagging算法的基础上加入了列采样(分枝特征随机) ...

最新文章

  1. SQL SERVER中求上月、本月和下月的第一天和最后一天[转]
  2. php header 重定向 url不变_PHP实现页面跳转功能
  3. springboot打包时加入本地jar打包
  4. 获取分辨率函数是什么_深度学习应用“Zero Shot”超分辨率重构图像
  5. 百度的索引真的比雅虎多么?
  6. 初始化HashMap的默认值——阿里巴巴编码规范系列
  7. 【离散数学中的数据结构与算法】二 欧几里得算法与裴蜀等式
  8. IT技术图书之《敏捷无敌》当小说看 你信吗?
  9. Python基础笔记(手写版)
  10. matlab瑞利衰落信道仿真
  11. LoadRunner录制app脚本详解
  12. 蜂巢APP启动优化实践
  13. 拖欠银行贷款的后果有哪些
  14. 小白新人Python哪些基础知识必学?
  15. 手机PDF如何转图片格式
  16. 网易2016笔试(3)
  17. 如何卸载360安全卫士
  18. 浊音/清音/爆破音的时域及频域特性
  19. mysql 26个随机字母_mysql生成随机密码(大写字母)
  20. platEMO:一款强大的多目标优化工具(MATLAB)

热门文章

  1. java hprof_java 性能之 hprof
  2. mysql表结构设计_表结构设计
  3. python安装第三方库win10_音频处理 windows10下python三方库librosa安装教程
  4. php 获取对象中的元素个数组长度,获取php类中的数组长度
  5. python拷贝是什么知识点_地址对象python 列表拷贝知识点 地址对象
  6. from flask.ext.cache import make_template_fragment_key
  7. 华为错误报告在哪个文件夹_华为手机隐藏的这7个秘密小技能,现在开启,手机还能再用3年...
  8. python dict遍历文件_python 字典(dict)遍历的四种方法性能测试报告
  9. 由浅入深剖析go channel
  10. 最全的http头部信息分析(转载)