判别分析是用一种统计的方法根据已有的数据集去分析新的数据属于那一类的方法

适用于数据集较小的情况,因为数据量够大的话神经网络的准确率会比传统的判别分析高得多

距离判别法:

  欧氏距离

    简单的计算数据集中每一类的样本均值

    对于新数据,计算新数据与各类样本均值的欧氏距离

    取离此新数据距离最近的类别为此数据的类别

  马氏距离

    马氏距离的优点是考虑了各特征之间的相互关系与尺度

    马氏距离的公式 

    当协方差阵为单位阵时,各特征间无关,此时马氏距离等于欧氏距离

    对马氏距离的具体分析在https://www.cnblogs.com/likai198981/p/3167928.html

    

    具体做法

      算出样本对每一类的距离,(在马氏距离中使用哪一类的均值和方差)

      取距离最小的那一类即可

fisher判别法

  fisher判别法是去找一个过原点的直线这个直线要达到的效果是

  

  具体做法:

  

  w即为这条直线的方向

  直线为Y = wX

  临界点y0 = (n0 * u0 +  n1 * u1) / (n0 + n1)

  判别时计算数据在线上的投影,将此投影与聚类的中心投影相比较得出此数据应属于那一类

贝叶斯判别法

  书上的贝叶斯做法如下

  对于两个多元总体

  第一类有n1个样本,第二类有n2个样本

  q1 = n1 / (n1 + n2)

  q2 = n2 / (n1 + n2)

  

  第一类的均值为u1,第二类的均值为u2

  根据总体计算出协方差矩阵Σ

  第i类样本的判别函数为

  fi(x) = ln(qi) - 1/2 ui.T * Σ-1 * ui + x.T *  Σ-1 * ui

  然后对于所有点fi(x)做一个softmax然后其中的最大值就是后验概率

  对于样本来说

  首先我要知道密度函数和先验概率

  对于k种分类先验概率为qk, 密度函数为fk

  那么P(g|x)表示样本为x的情况下,种类为g的概率

  P(g|x) = qg * fg(x)   /   ∑ qi * fi(x)

  找出那个最大的P(g|x)即可

  一般来说 qg使用样品频率来代替

  计算出g的均值和方差,fg(x)使用正太分布来代替

  工业上贝叶斯判别法用的也比较多

  但一般来说不是这么用的

  贝叶斯公式如下:

  

  将其移项即可得到

  P(gk|x) = P(x|gk) *  ∑P(xi|gi) / P(x)

  对于多元变量x,我们假设x的各个特征相互独立 设X = (u1,u2, ,,,,,um)

  那么P(x|gk)  = P(u1|gk) * P(u2|gk) **** P(um|gk)

  P(x) = P(u1)*P(u2)*.....*P(um)

  

  概率就用样本中的频率表示即可

一些理解

  距离判别法

    欧式距离只考虑了样本中心点的位置

    马氏距离不仅考虑了样本中心点的位置,还考虑了样本各个特征间的相互关系以及样本的度量

  

  fisher判别法

    利用一条过原点的判别函数,使得不同类别在判别函数上投影的距离尽可能大

    使得同一类的距离尽可能小

  

  贝叶斯判别法

    利用样本的先验概率计算密度函数

    再使用密度函数,计算特定点的后验概率

多元统计分析-判别分析相关推荐

  1. 多元统计分析及R语言建模(第五版)——第6章 判别分析课后习题

    第6章 判别分析 文章会用到的数据请在这个网址下下载多元统计分析及R语言建模(第五版)数据 练习题 1)考虑两个数据集x1 = [3 7 2 4 4 7],x2 = [6 9 5 7 4 8] (1) ...

  2. 多元统计分析何晓群_多元统计分析第四章作业

    关注公众号,更多资源分享 回复关键词:多元统计分析 即可获取更多详细其他章节答案 <多元统计分析>课后答案||何晓群版(第二章) <多元统计分析>第一章课后答案(何晓群编第五版 ...

  3. 多元统计分析最短距离法_多元统计分析重点

    多元统计分析重点宿舍版 第一讲:多元统计方法及应用:多元统计 方法分类(按变量.模型.因变量等) 多元统计分析应用 选择题:①数据或结构性简化运用的方法有:多元回归分析,聚类分析,主成分分 析, 因子 ...

  4. 生物群落数据分析最常用的统计方法:回归和混合效应模型、多元统计分析技术及结构方程等数量分析方法

    原文>>>R语言生物群落数据统计分析应用 R 语言作的开源.自由.免费等特点使其广泛应用于生物群落数据统计分析.生物群落数据多样而复杂,涉及众多统计分析方法.本内容以生物群落数据分析 ...

  5. 【多元统计分析】一、多元统计分析概述

    〇.前情提要 b站看[厦门大学MOOC]多元统计分析,因为老师很好看. 参考: [厦门大学MOOC]多元统计分析 https://www.bilibili.com/video/BV1v7411E7PB ...

  6. python 多元线性回归_多元统计分析之多元线性回归的R语言实现

    多元统计分析之多元线性回归的R语言实现 多元统计分析--multivariate statistical analysis 研究客观事物中多个变量之间相互依赖的统计规律性.或从数学上说, 如果个体的观 ...

  7. 多元统计分析最短距离法_(完整word版)多元统计分析模拟试题

    多元统计分析模拟试题(两套:每套含填空.判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法.贝叶斯判别法.费歇判别法.逐步 判别法. 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的 ...

  8. 多元统计分析R语言建模| 1 概述

    1.多元统计分析的历史: 受多种指标共同作用和影响的现象大量存在 多元统计分析方法就是利用数理统计方法来研究解决多指标问题的理论和方法 2.用途 变量之间相依性分析 构造预测模型,进行预报控制 进行数 ...

  9. 【多元统计分析】13.直接判别法

    文章目录 十三.直接判别法 1.马氏距离 2.直接判别法的使用 回顾总结 十三.直接判别法 1.马氏距离 判别分析指的是将某个对象归类,即判别某个对象属于哪一类,在实际生活中,判别分析的适用范围十分宽 ...

最新文章

  1. mysql ef 随机排序_EFCore+Mysql倉儲層建設(分頁、多字段排序、部分字段更新)
  2. 为VMware虚拟机中的Linux系统设置固定IP的方法
  3. 理解吞吐量和停顿时间
  4. 8类网线利弊_网线买机制成品还是自己DIY?有这些点要注意
  5. jzoj6276-[Noip提高组模拟1]树【线段树,扫描线,倍增】
  6. hdu 1806 Frequent values 线段树
  7. C#中一些常用的方法使用
  8. 由于找不到MSVCP20.dll,无法继续执行代码
  9. 【深度优先搜索】计蒜客:等边三角形
  10. 弗拉门戈-吉普赛婚礼-保利剧院
  11. 为 macOS Monterey 优化,有了快捷指令,这些软件效率倍增
  12. 面试考知识点,吾亦很难通过
  13. 概率空间probability space 伯努利实验 n次伯努利实验
  14. Java 数据填充到word模板中
  15. linux应用层读写event,Linux应用层获取鼠标坐标
  16. 复杂的密码学也可以人人可懂
  17. Conjugate function and Fenchel’s duality theorem
  18. 一起学习LLVM(一)
  19. [Eigen中文文档] 归约、访问者和广播
  20. 【信号处理】迫零均衡前与迫零均衡后眼图对比附Matlab代码

热门文章

  1. J2EE分布式框架之开发环境部署(上)
  2. springboot EnableAutoConfiguration
  3. Windows 7 with SP1中英文原版MSDN下载汇总(全版本收录完毕)
  4. 《乔布斯传》读后感---成功的启示
  5. mysql同步出现错误
  6. Vivado开发过程中生成的主要文件
  7. ubuntu下shutter的用法
  8. 牛客华为机试第3题python
  9. 神经网络设计与分析之sin函数拟合分析
  10. DRF 商城项目 - 用户操作(收藏, 留言, 收货地址)