判别分析

  • 判别分析是根据所研究的个体的观测指标来推断该个体所属类型的一种统计方法
    判别方法{距离判别(适用于连续性随机变量的判别类)Bayes判别(适用于假定对研究的对象已经有一定的认识,这种认识常用先验概率来描述)Fisher判别(适用于两总体的均值向量必须有显著的差异)判别方法\begin{cases} 距离判别 (适用于连续性随机变量的判别类) \\ Bayes 判别 (适用于假定对研究的对象已经有一定的认识,这种认识常用先验概率来描述)\\ Fisher判别(适用于两总体的均值向量必须有显著的差异) \end{cases} 判别方法⎩⎪⎨⎪⎧​距离判别(适用于连续性随机变量的判别类)Bayes判别(适用于假定对研究的对象已经有一定的认识,这种认识常用先验概率来描述)Fisher判别(适用于两总体的均值向量必须有显著的差异)​
  • 距离判别
  1. Mahalanobis 距离的概念
    通常我们定义的距离是 Euclid 距离(简称欧氏距离)。但在统计分析与计算中,Euclid 距离就不适用了。
    设 x,yx, yx,y 是从均值为μμμ ,协方差为ΣΣΣ 的总体 AAA 中抽取的样本,则总体 AAA 内两点 xxx 与 yyy 的MahalanobisMahalanobisMahalanobis 距离(简称马氏距离)定义为
    d(x,y)=(x−y)T∑(x−y)d(x,y)=\sqrt{\frac{(x-y)^T}{\sum(x-y)}} d(x,y)=∑(x−y)(x−y)T​​
    定义样本 xxx 与总体 AAA 的 MahalanobisMahalanobisMahalanobis 距离为
    d(x,y)=(x−μ)T∑(x−μ)d(x,y)=\sqrt{\frac{(x-\mu)^T}{\sum(x-\mu)}} d(x,y)=∑(x−μ)(x−μ)T​​
  2. 距离判别的判别准则和判别函数
    两个总体的距离判别,分协方差相同和协方差不同两种进行讨论:
    (1)协方差相同
    即:
    μ1≠μ2,,Σ1=Σ2=Σ\mu_1≠\mu_2 , ,Σ _1=Σ_2 =Σ μ1​̸​=μ2​,,Σ1​=Σ2​=Σ



    (2)协方差不同:
    即:
    μ1≠μ2,,Σ1≠Σ2\mu_1≠\mu_2 , ,Σ _1≠Σ_2 μ1​̸​=μ2​,,Σ1​̸​=Σ2​
    对于样本 xxx ,在方差不同的情况下,判别函数为:
    w(x)=(x−μ2)TΣ2−1(x−μ2)−(x−μ1)TΣ1−1(x−μ1)w(x)=(x-\mu_2)^TΣ_2^{-1}(x-\mu_2)-(x-\mu_1)^TΣ_1^{-1}(x-\mu_1) w(x)=(x−μ2​)TΣ2−1​(x−μ2​)−(x−μ1​)TΣ1−1​(x−μ1​)
    在实际计算中总体的均值与协方差是未知的,同样需要用样本的均值与协方差来代替。
    w^(x)=(x−x‾(2))TΣ^2−1(x−x‾(2))−(x−x‾(1))TΣ^1−1(x−x‾(1))\hat{w}(x)=(x-\overline{x}^{(2)})^T\hat{Σ}_2^{-1}(x-\overline{x}^{(2)})-(x-\overline{x}^{(1)})^T\hat{Σ}_1^{-1}(x-\overline{x}^{(1)}) w^(x)=(x−x(2))TΣ^2−1​(x−x(2))−(x−x(1))TΣ^1−1​(x−x(1))
    其中:
    Σ^i=1ni−1∑j=1ni(xj(i)−x‾(i))(xj(i)−x‾(i))T=1ni−1Si,i=1,2.\hat{Σ}_i=\frac{1}{n_i-1}\sum_{j=1}^{n_i}(x_j^{(i)}-\overline{x}^{(i)})(x_{j}^{(i)}-\overline{x}^{(i)})^T=\frac{1}{n_i-1}S_i,i=1,2. Σ^i​=ni​−11​j=1∑ni​​(xj(i)​−x(i))(xj(i)​−x(i))T=ni​−11​Si​,i=1,2.
  • FisherFisherFisher 判别



    当总体的参数未知时,我们用样本对 μ1,μ2及Σμ_1 , μ_2 及 Σμ1​,μ2​及Σ 进行估计,注意到这里的 FisherFisherFisher判别与距离判别一样不需要知道总体的分布类型,但两总体的均值向量必须有显著的差异才行,否则判别无意义。
  • Bayes 判别
    BayesBayesBayes 判别和 BayesBayesBayes 估计的思想方法是一样的,即假定对研究的对象已经有一定的认识,这种认识常用先验概率来描述,当我们取得一个样本后,就可以用样本来修正已有的先验概率分布,得出后验概率分布,再通过后验概率分布进行各种统计推断。
    1.误判概率与误判损失
     设有两个总体 X1X1X1和 X2X2X2 ,根据某一个判别规则,将实际上为 X1X1X1的个体判为 X2X2X2 或者将实际上为 X2X2X2 的个体判为 X1X1X1 的概率就是误判概率.一个好的判别规则应该使误判概率最小。除此之外还有一个误判损失问题或者说误判产生的花费(cost)问题,如把X1X1X1的个体误判到 X2X2X2 的损失比 X2X2X2 的个体误判到 X1X1X1 严重得多,则人们在作前一种判断时就要特别谨慎。因此一个好的判别规则还必须使误判损失最小。


    2.两总体的 Bayes 判别(做题准则,重点)
    由上面叙述知道,我们要选择样本空间ΩΩΩ 的一个划分: R1R1R1 和 R2=Ω−R1R2 = Ω − R1R2=Ω−R1 使得平均损失(56)式达到极小

    损失和先验概率以比值的形式出现是很重要的,因为确定两种损失的比值(或两总
    体的先验概率的比值)往往比确定损失本身(或先验概率本身)来得容易。下面列举(57)
    的三种特殊情况:

      对于具体问题,如果先验概率或者其比值都难以确定,此时就利用规则(58),同样如误判损失或者其比值都是难以确定,此时就利用规则(59),如果上述两者都难以确定则利用规则(60),最后这种情况是一种无可奈何的办法,当然判别也变得很简单:若f1(x)≥f2(x)f_1(x) \geq f_2(x)f1​(x)≥f2​(x) ,则判$x ∈ X_1 ,否则判 x∈X2x ∈X_2x∈X2​
    将上述的两总体 BayesBayesBayes 判别应用于正态总体 Xi∼Np(μi,Σi)(i=1,2)X_i \sim N_p (μ_i,Σ_i) (i =1,2)Xi​∼Np​(μi​,Σi​)(i=1,2),分两种情况讨论






    解:
a=[24.8 24.1 26.6 23.5 25.5 27.4
-2.0 -2.4 -3.0 -1.9 -2.1 -3.1];
b=[22.1 21.6 22.0 22.8 22.7 21.5 22.1 21.4
-0.7 -1.4 -0.8 -1.6 -1.5 -1.0 -1.2 -1.3];p1=6/14;p2=8/14;%p1,p2是先验概率,题中已给
train=[a';b'];
%train 为已知样本
n1=size(a,2);n2=size(b,2);
group=[ones(n1,1);2*ones(n2,1)];
%已知样本类别标识
prior=[p1; p2];
%已知样本的先验概率
sample=train;%sample 一般为未知样本,这里是准备回代检验误判
[x1,y1]=classify(sample,train,group,'linear',prior)
%线性分类
[x2,y2]=classify(sample,train,group,'quadratic',prior)
%二次分类
%函数 classify 的第二个返回值为误判率


解:

train=[9 7 8 8 9 8 7 4 3 6 2 1
8 6 7 5 9 9 5 4 6 3 4 2
7 6 8 5 3 7 6 4 6 3 5 2]';
sample=[6 4 5; 8 1 3; 2 4 5];
group=[ones(7,1);2*ones(5,1)];
%已知样本的分类
[x1,y1]=classify(sample,train,group,'mahalanobis')
%马氏距离分类
[x2,y2]=classify(sample,train,group,'linear')
%线性分类
[x3,y3]=classify(sample,train,group,'quadratic')
%二次分类
%函数classify的第二个返回值为误判率

MATLAB判别分析-----2019/8/26相关推荐

  1. 训练日志 2019.1.26

    上午补了道 2-sat 的题,这类问题还是不太熟练,不是很能准确的找到条件 下午打比赛,立的 flag 成功崩了...数组没开小但把精度爆了..+= 把 + 忘了...一道巨水的题把输入看错了...大 ...

  2. 18天精读掌握《费曼物理学讲义卷一》 第10天 2019/6/26

    18天精读掌握<费曼物理学讲义卷一> 第10天 2019/6/26 1. 18日掌握<费曼物理学讲义>卷一计划概览 2. 今日学习成果 3. 今日时间表 4.Atimelogg ...

  3. 2019.10.26

    2019.10.26 void Level::keyPressEvent(QKeyEvent *event){switch(event->key()){case Qt::Key_A:goingL ...

  4. 棒棒糖-小学数学出题机v1.4.2【更新2019/12/26】

    [推荐]2019 Java 开发者跳槽指南.pdf(吐血整理) >>> 今年儿子刚上一年级,现在每天要做口算题,每次都要打印100题随机题目让他做,网上找了很多出题器,不是操作太繁琐 ...

  5. 13 MATLAB判别分析

    更多MATLAB数据分析视频请点击,或者在网易云课堂上搜索<MATLAB数据分析与统计> http://study.163.com/course/courseMain.htm?course ...

  6. 野鸡NOI.AC模拟赛【2019.10.26】

    前言 截止至2019.10.2614:222019.10.26\ \ \ \ 14:222019.10.26    14:22 成绩 正题 T1:NOI.AC−T1:NOI.AC-T1:NOI.AC− ...

  7. 《DSP using MATLAB》Problem 7.26

    注意:高通的线性相位FIR滤波器,不能是第2类,所以其长度必须为奇数.这里取M=31,过渡带里采样值抄书上的. 代码: %% +++++++++++++++++++++++++++++++++++++ ...

  8. MATLAB聚类分析--------2019/8/22

    聚类分析 定义: 是对多个样本进行定量分析的多元统计分析方法. 聚类分析={Q型聚类分析:对样本进行分类R型聚类分析:对指标进行分类聚类分析= \begin{cases} Q型聚类分析 :对样本进行分 ...

  9. MATLAB判别分析例题,判别分析的matlab实现案例.doc

    判别分析的matlab实现案例.doc 读取EXAMP10_01XLS中数据,进行距离判别读取数据读取文件EXAMP10_01XLS的第1个工作表中C2F51范围的数据,即全部样本数据,包括未判企业S ...

  10. 【matlab】2019.5.10第一节上机课练习

    1.计算角度和弧度的方法 例 a = 17,b = 24,c = 26 求一个角分别以角度和弧度的方式给出 解: %//用余弦定理求出余弦值 pos = (a + b+ c)/(2*a*b) %//用 ...

最新文章

  1. c#获取DataTable某一列不重复的值,或者获取某一列的所有值
  2. DS1302示例子程序
  3. GWT 2 Spring 3 JPA 2 Hibernate 3.5教程
  4. 如何完全卸载 Sublime Text
  5. MCI:移动持续集成在大众点评的实践
  6. java liste_内功心法 -- java.util.ArrayListE (1)
  7. vs2008 及.netframework3.5 安装问题
  8. 特殊类型结构--枚举
  9. linux pam 解锁_Linux 密码复杂度设置pam_pwquality、pam_passwdqc(centos7)
  10. 目标检测——Anchor-Based算法的学习笔记
  11. vue 使用axios 出现跨域请求的两种解决方法
  12. solr 5.0.0 bin/start脚本详细解析
  13. 【机器学习】语音处理介绍
  14. SAP MM 发货到成本中心场景下的批次确定
  15. 【实习之T100开发】T100 单档程序开发,java工程师面试突击中华石杉
  16. 华硕计算机电源已连接未充电,笔记本电池显示“电源已接通,未充电”
  17. “我靠这4个项目,拿到了年薪30万+的大厂Offer”
  18. 【转】eclipse, Log4j配置(真心的详细~)
  19. 骞云数据库DBaaS解决方案深度解析
  20. es中should查询使用注意

热门文章

  1. matplotlib配色
  2. 18位身份证校验代码
  3. 代码的马斯洛金字塔理论
  4. JavaMail发送HTML邮件
  5. 微信openid存入数据库为空解决方案
  6. xdb 服务_如何删除默认的XPT和XDB这两个服务
  7. 线性代数让我想想:两步得到二阶矩阵的逆
  8. execute()方法
  9. android 色值(全)
  10. 【GAPPER乡村笔记项目】盘点老龄化社会背景下人工智能及机器人技术的应用