摘要

与聚类不同的是,判别分析中,已知样本分类的前提(历史分组信息),利用历史数据,将给定的新样品按照某种准则判给某类。在机器学习中,可以理解为有监督学习。

文章目录

  • 摘要
  • 目标
    • 样品到总体的马氏距离
  • 距离判别法
    • 基本思想
  • Fisher判别法
    • 主要思想
    • 两总体Fisher判别
  • Bayes判别法
    • 主要思想
      • 最大后验判别准则
      • 最小平均误判代价准则
  • 练习

目标

寻找一种“分类规则”即判别函数,来描述或区别多个群体的差异。

样品到总体的马氏距离

设有一总体G,其均值为μ\muμ, 其协方差为Σ=(δij)p×p\Sigma=(\delta_{ij})_{p\times p}Σ=(δij​)p×p​,样品x=(x1,x2,..,xp)Tx=(x_1,x_2,..,x_p)^Tx=(x1​,x2​,..,xp​)T与G的马氏距离定义为
d2(x,G)=(x−μ)TΣ−1(x−μ)d^2(x,G)=(x-\mu)^T\Sigma^{-1}(x-\mu)d2(x,G)=(x−μ)TΣ−1(x−μ)

距离判别法

基本思想

新样品和哪个总体距离(通常使用马氏距离)近,就判给哪个总体。

假设有两个总体G1、G2,均值为μ1、μ2G_1、G_2,均值为\mu_1、\mu_2G1​、G2​,均值为μ1​、μ2​,新样品为x=(x1,x2,..,xp)Tx=(x_1,x_2,..,x_p)^Tx=(x1​,x2​,..,xp​)T
{x∈G1,ifd(x,μ1)<d(x,μ2)x∈G2,ifd(x,μ1)≥d(x,μ2)\begin{cases} x\in G_1 &,if~~d(x,\mu_1)<d(x,\mu_2)\\ x \in G_2 &,if~~ d(x,\mu_1)\ge d(x,\mu_2) \end{cases}{x∈G1​x∈G2​​,if  d(x,μ1​)<d(x,μ2​),if  d(x,μ1​)≥d(x,μ2​)​

  1. 假设两个总体的协方差矩阵不同,分别为Σ1、Σ2\Sigma_1、\Sigma_2Σ1​、Σ2​
    根据基本思想,我们来比较新样品距离那个总体更近
    d2(x,μ2)−d2(x,μ1)=(x−μ2)TΣ2−1(x−μ2)−(x−μ1)TΣ1−1(x−μ1)d^2(x,\mu_2)-d^2(x,\mu_1)\\=(x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2)-(x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1) d2(x,μ2​)−d2(x,μ1​)=(x−μ2​)TΣ2−1​(x−μ2​)−(x−μ1​)TΣ1−1​(x−μ1​)
    W(x)=(x−μ2)TΣ2−1(x−μ2)−(x−μ1)TΣ1−1(x−μ1)\\W(x)=(x-\mu_2)^T\Sigma_2^{-1}(x-\mu_2)-(x-\mu_1)^T\Sigma_1^{-1}(x-\mu_1) W(x)=(x−μ2​)TΣ2−1​(x−μ2​)−(x−μ1​)TΣ1−1​(x−μ1​)
  2. 假设两个总体具有相同的协方差矩阵
    d2(x,μ2)−d2(x,μ1)=(x−μ2)TΣ−1(x−μ2)−(x−μ1)TΣ−1(x−μ1)=2(x−μ1+μ22)TΣ−1(μ1−μ2)d^2(x,\mu_2)-d^2(x,\mu_1) \\ \\ =(x-\mu_2)^T\Sigma^{-1}(x-\mu_2)-(x-\mu_1)^T\Sigma^{-1}(x-\mu_1) \\ \\ =2(x-\frac{\mu_1+\mu_2}{2})^T\Sigma^{-1}(\mu_1-\mu_2)\\ d2(x,μ2​)−d2(x,μ1​)=(x−μ2​)TΣ−1(x−μ2​)−(x−μ1​)TΣ−1(x−μ1​)=2(x−2μ1​+μ2​​)TΣ−1(μ1​−μ2​)
    令μˉ=μ1+μ22,a=Σ−1(μ1−μ2),记\bar{\mu}=\frac{\mu_1+\mu_2}{2},a=\Sigma^{-1}(\mu_1-\mu_2) ,记μˉ​=2μ1​+μ2​​,a=Σ−1(μ1​−μ2​),记
    W(x)=2(x−μ1+μ22)TΣ−1(μ1−μ2)\\W(x)=2(x-\frac{\mu_1+\mu_2}{2})^T\Sigma^{-1}(\mu_1-\mu_2) W(x)=2(x−2μ1​+μ2​​)TΣ−1(μ1​−μ2​)

则,线性判别的判别准则为
{x∈G1,ifW(x)≥0x∈G2,ifW(x)<0\begin{cases} x\in G_1 &,if~~W(x)\ge 0\\ x \in G_2 &,if~~ W(x)< 0 \end{cases}{x∈G1​x∈G2​​,if  W(x)≥0,if  W(x)<0​

Fisher判别法

主要思想

将多维数据投影在一维直线上,是得同一类别中的数据在该直线上尽量靠拢,不同类别的数据尽可能分开。投影后,再利用上述得距离判别法来建立判别准则。下面介绍Fisher判别法的线性判别法。

两总体Fisher判别


如图所示,将两总体的点投影到该一维直线上。该一维直线表示为x1、x2x_1、x_2x1​、x2​的线性组合。即y=c1x1+c2x2=aTxvar(y)=var(aTx)=aTΣay=c_1x_1+c_2x_2=a^Tx\\var(y)=var(a^Tx)=a^T\Sigma ay=c1​x1​+c2​x2​=aTxvar(y)=var(aTx)=aTΣa

设总体G1、G2G_1、G_2G1​、G2​的均值分别为μ1、μ2\mu_1、\mu_2μ1​、μ2​,直线上总体一中心μ1y=aTμ1;μ2y=aTμ2μy=μ1y+μ2y2\mu_{1y}=a^T\mu_1;\\\mu_{2y}=a^T\mu_2 \\\mu_y=\frac{\mu_{1y}+\mu_{2y}}{2}μ1y​=aTμ1​;μ2y​=aTμ2​μy​=2μ1y​+μ2y​​

Q:μ1y、μ2y、μy\mu_{1y}、\mu_{2y}、\mu_yμ1y​、μ2y​、μy​的关系
通过计算得到μ1y−μy<0\mu_{1y}-\mu_y<0μ1y​−μy​<0,μ2y−μy>0\mu_{2y}-\mu_y>0μ2y​−μy​>0可知,在直线上,μ1y在μy左侧,μ2y在μy右侧\mu_{1y}在\mu_y左侧,\mu_{2y}在\mu_y右侧μ1y​在μy​左侧,μ2y​在μy​右侧。

投影直线的选取会影响数据点的分类效果,我们需要寻找分类效果最好的投影直线,使得同类别的点尽量靠拢,不同类别点尽量分开。数学上表示为使如下比值越大越好(μ1y−μ2y)2var(y)=aT(μ1−μ2)2aTΣa\frac{(\mu_{1y}-\mu_{2y})^2}{var(y)}=\frac{a^T(\mu_1-\mu_2)^2}{a^T\Sigma a}var(y)(μ1y​−μ2y​)2​=aTΣaaT(μ1​−μ2​)2​
高等代数中存在定理,当a=cΣ−1(μ1−μ2)a=c\Sigma^{-1}(\mu_1-\mu_2)a=cΣ−1(μ1​−μ2​)时,aT(μ1−μ2)2aTΣa\frac{a^T(\mu_1-\mu_2)^2}{a^T\Sigma a}aTΣaaT(μ1​−μ2​)2​达到最大,且最大值为(μ1−μ2)TΣ1−1(μ1−μ2)(\mu_1-\mu_2)^T\Sigma_1^{-1}(\mu_1-\mu_2)(μ1​−μ2​)TΣ1−1​(μ1​−μ2​)。
c=1c=1c=1时,y=aTx=(μ1−μ2)TΣ−1xy=a^Tx=(\mu_1-\mu_2)^T\Sigma^{-1}xy=aTx=(μ1​−μ2​)TΣ−1x称为Fisher线性判别函数

在投影直线上判断新样品属于哪个总体。如果新样品在该直线上的投影y位置在两总体均值的左侧,则判给总体1,在均值点右侧,则判给总体2。
数学上,表示为
{x∈G1,ify<μyx∈G2,ify≥μy\begin{cases} x\in G_1 &,if~~y <\mu_y\\ x \in G_2 &,if~~ y\ge \mu_y \end{cases}{x∈G1​x∈G2​​,if  y<μy​,if  y≥μy​​
其中,μy=(μ1−μ2)TΣ1−1(μ1−μ2)/2\mu_y=(\mu_1-\mu_2)^T\Sigma_1^{-1}(\mu_1-\mu_2)/2μy​=(μ1​−μ2​)TΣ1−1​(μ1​−μ2​)/2
W(x)=y−μy=(x−μ1+μ22)TΣ−1(μ1−μ2)W(x)=y-\mu_y=(x-\frac{\mu_1+\mu_2}{2})^T\Sigma^{-1}(\mu_1-\mu_2)W(x)=y−μy​=(x−2μ1​+μ2​​)TΣ−1(μ1​−μ2​)
{x∈G1,ifW(x)<0x∈G2,ifW(x)≥0\begin{cases} x\in G_1 &,if~~W(x)< 0\\ x \in G_2 &,if~~ W(x)\ge 0 \end{cases}{x∈G1​x∈G2​​,if  W(x)<0,if  W(x)≥0​

Bayes判别法

主要思想

是一种基于贝叶斯定理的概率判别法。Bayes判别首先假定对研究对象有一定的认识(先验概率,一般是处于某种经验,事先给出的概率),取得样本后,利用样本修正已有的先验概率分布,得到后验概率进行统计推断。判别准则分为两种:

最大后验判别准则

设有k个组,G1、G2、...、GkG_1、G_2、...、G_kG1​、G2​、...、Gk​,且各总体的概率密度函数为fi(x)f_i(x)fi​(x),样品来自总体GiG_iGi​的先验概率为Pi,∑i=0kPi=1P_i,\sum_{i=0}^kP_i=1Pi​,∑i=0k​Pi​=1,则x属于GiG_iGi​的后验概率为:
P(Gi∣x)=Pifi(x)∑i=0kPifi(x)P(G_i|x)=\frac{P_if_i(x)}{\sum^k_{i=0}P_if_i(x)}P(Gi​∣x)=∑i=0k​Pi​fi​(x)Pi​fi​(x)​
判别规则为:
x∈Gi,whenP(Gi∣x)=maxPifi(x)∑i=0kPifi(x),1≤i≤kx\in G_i,~when~~P(G_i|x)=max{\frac{P_if_i(x)}{\sum^k_{i=0}P_if_i(x)}},1\le i\le kx∈Gi​, when  P(Gi​∣x)=max∑i=0k​Pi​fi​(x)Pi​fi​(x)​,1≤i≤k

最小平均误判代价准则

现在规定Ω(x∈Ω)\Omega(x\in \Omega)Ω(x∈Ω)为样本空间,总体G1、G2G_1、G_2G1​、G2​的概率密度函数为f1(x),f2(x)f_1(x),f_2(x)f1​(x),f2​(x).
R1为样品x判入G1时x的所有可能取值,R2为样品x判入G2时x的所有可能取值R_1为样品x判入G_1时x的所有可能取值,R_2为样品x判入G_2时x的所有可能取值R1​为样品x判入G1​时x的所有可能取值,R2​为样品x判入G2​时x的所有可能取值,R1、R2是对Ω的分割R_1、R_2是对\Omega的分割R1​、R2​是对Ω的分割。
定义总错分率(TPM)
P(x错分到G1)=P(x∈R1∣x∈G2)P(G2)=P2∫R1f2(x)dxP(x错分到G2)=P(x∈R2∣x∈G1)P(G1)=P1∫R2f1(x)dxP(x错分到G_1)=P(x\in R_1|x\in G_2)P(G_2)=P_2\int_{R_1}f_2(x)dx\\ \\ P(x错分到G_2)=P(x\in R_2|x\in G_1)P(G_1)=P_1\int_{R_2}f_1(x)dx P(x错分到G1​)=P(x∈R1​∣x∈G2​)P(G2​)=P2​∫R1​​f2​(x)dxP(x错分到G2​)=P(x∈R2​∣x∈G1​)P(G1​)=P1​∫R2​​f1​(x)dx
代价/损失:x错分到G1损失为l(1∣2),x错分到G2损失为l(2∣1)x错分到G_1损失为l(1|2),x错分到G_2损失为l(2|1)x错分到G1​损失为l(1∣2),x错分到G2​损失为l(2∣1)
定义误判损失(ECM)
ECM(R1,R2)=l(1∣2)⋅P2⋅∫R1f2(x)dx+l(2∣1)⋅P1⋅∫R2f1(x)dx=P1⋅l(2∣1)+∫R1[l(1∣2)⋅P2⋅f2(x)−l(2∣1)⋅P1⋅f1(x)]dxECM(R_1,R_2)=l(1|2)·P_2·\int_{R_1}f_2(x)dx+l(2|1)·P_1·\int_{R_2}f_1(x)dx\\ =P_1·l(2|1)+\int_{R_1}[l(1|2)·P_2·f_2(x)-l(2|1)·P_1·f_1(x)]dxECM(R1​,R2​)=l(1∣2)⋅P2​⋅∫R1​​f2​(x)dx+l(2∣1)⋅P1​⋅∫R2​​f1​(x)dx=P1​⋅l(2∣1)+∫R1​​[l(1∣2)⋅P2​⋅f2​(x)−l(2∣1)⋅P1​⋅f1​(x)]dx
要是ECM最小,则被积函数为负的区域为R1R_1R1​,即
R1:{l(1∣2)⋅P2⋅f2(x)≤l(2∣1)⋅P1⋅f1(x)}R_1:\{l(1|2)·P_2·f_2(x)\le l(2|1)·P_1·f_1(x)\}R1​:{l(1∣2)⋅P2​⋅f2​(x)≤l(2∣1)⋅P1​⋅f1​(x)}
判别准则为:
{x∈R1,iff1(x)f2(x)≥l(1∣2)⋅P2l(2∣1)⋅P1x∈R2,iff1(x)f2(x)<l(1∣2)⋅P2l(2∣1)⋅P1\begin{cases} x\in R_1 &,if~~\frac{f_1(x)}{f_2(x)}\ge\frac{l(1|2)·P_2}{ l(2|1)·P_1}\\ \\ x \in R_2 &,if~~ \frac{f_1(x)}{f_2(x)}\lt\frac{l(1|2)·P_2}{ l(2|1)·P_1} \end{cases}⎩⎪⎨⎪⎧​x∈R1​x∈R2​​,if  f2​(x)f1​(x)​≥l(2∣1)⋅P1​l(1∣2)⋅P2​​,if  f2​(x)f1​(x)​<l(2∣1)⋅P1​l(1∣2)⋅P2​​​
实际应用中,

  • 先验概率未知,一般假设先验概率都为0.5。
  • 损失比值未知,一般令其等于1。
  • 损失相等时,等价于k=2时的最大后验概率准则。
  • Bayes判别,需要分布已知,不要求具有相同的协方差矩阵。

练习

练习1:

练习2:

多元统计分析--判别(距离判别、Fisher判别、Bayes判别)相关推荐

  1. 多元统计分析——欧式距离和马氏距离

    在一元的情形中,定义两个点和之间的距离: 两者作差的绝对值,我们称为欧式距离. 经过标准化的作差绝对值,我们称为统计距离,或者标准化过后的距离.其中,代表样本的标准差. 在多元的情形中,假设我们有两个 ...

  2. 贝叶斯判别matlab,Bayes判别matlab源程序

    Bayes判别matlab源程序 在分类判别中,bayes判别的确具有明显的统计优势,在我所做的应用中,与模糊,灰色,物元可拓相比,判别准确率一般都会高些,而BP神经网络由于调试麻烦,在调试过程中需要 ...

  3. 多元统计分析及R语言建模(第五版)——第6章 判别分析课后习题

    第6章 判别分析 文章会用到的数据请在这个网址下下载多元统计分析及R语言建模(第五版)数据 练习题 1)考虑两个数据集x1 = [3 7 2 4 4 7],x2 = [6 9 5 7 4 8] (1) ...

  4. 数学建模笔记(十五):多元统计分析及R语言建模(判别分析、聚类分析、主成分分析、因子分析,含数据代码注释,均可供运行)

    文章目录 一.多元数据的数学表达 1.多元分析资料的一般格式与矩阵化表示 2.数据特征(一元数据与多元数据的均值和方差) 二.R软件基本使用 1.向量创建(c函数) 2.行列合并(rbind,cbin ...

  5. 多元统计分析何晓群_多元统计分析第四章作业

    关注公众号,更多资源分享 回复关键词:多元统计分析 即可获取更多详细其他章节答案 <多元统计分析>课后答案||何晓群版(第二章) <多元统计分析>第一章课后答案(何晓群编第五版 ...

  6. 多元统计分析最短距离法_(完整word版)多元统计分析模拟试题

    多元统计分析模拟试题(两套:每套含填空.判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法.贝叶斯判别法.费歇判别法.逐步 判别法. 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的 ...

  7. 【多元统计分析】13.直接判别法

    文章目录 十三.直接判别法 1.马氏距离 2.直接判别法的使用 回顾总结 十三.直接判别法 1.马氏距离 判别分析指的是将某个对象归类,即判别某个对象属于哪一类,在实际生活中,判别分析的适用范围十分宽 ...

  8. 【多元统计分析】一、多元统计分析概述

    〇.前情提要 b站看[厦门大学MOOC]多元统计分析,因为老师很好看. 参考: [厦门大学MOOC]多元统计分析 https://www.bilibili.com/video/BV1v7411E7PB ...

  9. 【多元统计分析】14.贝叶斯判别法

    文章目录 十四.贝叶斯判别法 1.贝叶斯判别的定义 2.贝叶斯判别的解 3.广义马氏距离 回顾总结 十四.贝叶斯判别法 1.贝叶斯判别的定义 贝叶斯判别的定义,是找到一个错判平均损失最小的判别准则,这 ...

  10. 【应用多元统计分析】期末简答题高频考题

    一.判别分析 1.判别分析的基本思想:设有n个样本,对每个样本的p项指标,已知每个样本属于k个类别中的某一类,找到一个最优性质判别函数,能把不同类别的样本点尽可能区别开,以最优的性质对p维空间构造一个 ...

最新文章

  1. 移动方向_1908号台风“范斯高”继续向西北方向移动
  2. spring mvc学习(16)Could not publish server configuration for Tomcat v8.0 Server at localhost.
  3. pytorch分布式训练(一):torch.nn.DataParallel
  4. 函数定义的规范-电子书包
  5. vijos p1782——借教室(noip2012提高组第2题)
  6. 从零基础入门Tensorflow2.0 ----八、39.4. gpu4
  7. 扫盲:什么是steam令牌验证器?哪些行为会触发steam交易限制
  8. python3.10下载安装(附python学习教程)
  9. vue axios封装
  10. java程序员面试自身优缺点,详细说明
  11. ZOJ 3204 Connect them
  12. 电脑只能上qq不能打开网页
  13. 网站快照被劫持,网站被劫持跳转另一个网站解决办法
  14. 一种基于机器学习的电影推荐系统设计
  15. 自建图床之一:使用幻想领域搭建免费新浪图床网站
  16. 【Codeforces 1392F】Omkar and Landslide | 思维、结论
  17. Highest Scoring Word
  18. POS机IC卡参数、公钥下载流程及POSP数据库设计
  19. 您的计算机程序脱机,安捷伦脱机程序打不开,电脑脱机状态打不开
  20. 从服务业突然决定转行进入IT界

热门文章

  1. 计算机检索word文档检索式,完整word版)中国知网等文献检索的一般方法
  2. 少儿编程 电子学会图形化编程等级考试Scratch三级真题解析(判断题)2022年6月
  3. CVE-2017-0143(远程溢出)漏洞复现
  4. golang正则匹配中文字符,查询中文字符会panic退出的问题
  5. GateWay 集成 Swagger
  6. 北大计算机前辈徐,九年中获得国家最高科学技术奖的八位北大人
  7. 七夕祝福网页制作_七夕福利 | 程序员土味情话大PK,专属好礼等你拿
  8. 国外互联网公司大数据技术架构研究
  9. 18位身份证校验代码
  10. 一个人能不能月薪过万,放个小长假就知道了