要学习正态分布有关的统计决策,正态分布相关的知识肯定是必不可少的!!!对于大多数同学来说,一维的正态分布应该是没什么问题,但是一旦涉及多维的正态分布,立刻就傻眼了。书本上对正态分布和性质的回顾,只能说懂的懂,不懂的还是不懂。当初学这一部分的时候,对多维正态分布很多知识点都不理解,参考了很多书籍和网上的资料。在这里,我强推透彻理解协方差与协方差矩阵和透彻理解多元正态分布两篇文章。第一篇很详细的讲解了协方差矩阵相关证明和性质;第二篇也是很系统的讲解了多维的正态分布。


学习完多维正态分布之后再学习后面的决策就会容易许多,不过以下几个性质需要特别牢记:

  • 可由期望值向量和协方差矩阵确定具体分布
  • 如果各随机变量不相关,则一定独立
  • 多元正态分布经过线性变换之后还是多元正态分布
  • 多元正态分布的条件分布也是多元正态分布
  • 多元正态分布的边缘分布也是多元正态分布

上述几个性质在我推荐的文章中都有证明!

在书上,多元正太分布的形式是:

:协方差矩阵,与一维正态分布的方差对应

:样本的维数


下面开始正式学习正太分布概率模型下的最小错误率贝叶斯决策。

根据最小错误率贝叶斯决策所学,我们可以在多元正态概率型下,令判别函数为:

两个判别函数可以确定一个决策边界:。由这个等式得到的决策边界是最一般的情况,接下来需要讨论三个特殊情况。

1.第一种情况:

第一种情况是每一个类别的协方差矩阵都相等,而且都是值为的对角矩阵,矩阵中其他元素均为0,用数学式表示就是。可以参考透彻理解协方差矩阵来理解。

代入中可以得到判别函数为:

由于在最后求解决策边界时我们利用公式来求解决策边界,因此与无关的项可以忽略,最终将化简为下面的式子:

适中是由样本到类的均值向量的欧式距离的平方。(什么是欧式距离?)

更特殊的情况是所有类的先验概率 相同。此时这项也可以从判别函数中省去,那么

依据最小风险贝叶斯决策中,(如下图)

那么计算,选出欧式距离最小的一类,即把样本归于具有的类。这种分类器称为最小距离分类器。

那决策面是怎么样的呢?当先验概率相同时,决策边界是通过连线中点并于连线正交,如下图所示:

当先验概率不相同时有 ,可以继续省略与无关的项得到:

决策边界则为:

计算后易知,决策边界和当各类先验概率相等时的决策边界平行,只是向先验概率小的方向偏移,即先验概率大的一类要占据更大的决策空间。

2.第二种情况:

第二种情况表示各类的协方差矩阵都相等。第二种情况对样本决策的判断标准与第一种情况类似。不同的是,当先验概率相同时,第二种情况需要寻找的是马氏距离最小的情况。

对于判别函数,我们可以像第一种情况一样化简为:

由此可知,它是的线性方程,因此决策面是一个超平面。通过计算其中一个超平面,即:

其中,

 略,

书中说到通常不在方向上,那什么时候在同一方向上呢?就是的特征向量时会在同一方向上,最一般的情况就是在第一种情况)时。表示正交,所以决策面通过点,当的特征向量时才与正交!若先验概率均相同则有。此时决策边界必过的中点。看一下下面的图就一目了然啦:

不正交

正交

3.第三种情况:各类的协方差矩阵不相等

有时间更新。。。。

模式识别学习笔记——第2章 统计学习方法-2.5 正态分布时的统计决策相关推荐

  1. 模式识别学习笔记——第2章 统计学习方法—2.3最小风险贝叶斯决策

    根据场合的不同,我们的决策可能不仅仅是错误率,还有可能是决策错误带来的风险.所谓最小风险贝叶斯决策,就是考虑各种错误造成损失不同时的一种最优决策. 下面用决策论的数学符号表示最小风险贝叶斯决策问题: ...

  2. 模式识别学习笔记——第2章—2.4 两类错误率、Neyman-Pearson决策与ROC曲线

    上一节学习了决策表,这一节我们在只有两类情况的决策表中继续深入研究.假设现在我们有两类状态分别是阳性和阴性.可以绘制出如下的决策表: 截至<模式识别(第三版)>阳性阴性状态与决策的可能性关 ...

  3. 复现经典:《统计学习方法》第1章 统计学习方法概论

    本文是李航老师的<统计学习方法>[1]一书的代码复现. 作者:黄海广[2] 备注:代码都可以在github[3]中下载. 我将陆续将代码发布在公众号"机器学习初学者", ...

  4. 数字图像识别学习笔记(第二章-数字图像基础(1))

    title: 数字图像识别学习笔记(第二章 数字图像基础(1)) categories: 数字图像识别 tags: 数字图像识别 date: 2020/9/30 21:22 mathjax: true ...

  5. 模式识别学习笔记(1)——基本概念

    模式识别学习笔记--绪论 一.从数据集D中产生训练集S和测试集T,主要有以下方法: --hold-out(留出法) --cross-validation(交叉验证法) --bootstrapping( ...

  6. 《统计学习方法》读书笔记第1章: 统计学习及监督学习概论

    第1章: 统计学习及监督学习概论 统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称为统计机器学习(statstic ...

  7. 第1章统计学习方法概论之1.1统计学习

    1统计学习(也称统计机器学习) 1.1统计学习定义: 统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科. 统计学习就是计 ...

  8. 统计学习笔记(1)——统计学习方法概论

    1.统计学习 统计学习是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称统计机器学习.统计学习是数据驱动的学科.统计学习是一门概率论.统计学.信息论.计算理论.最优化理 ...

  9. 统计学习方法 学习笔记(1)统计学习方法及监督学习理论

    统计学习方法及监督学习理论 1.1.统计学习 1.1.1.统计学习的特点 1.1.2.统计学习的对象 1.1.3.统计学习的目的 1.1.4.统计学习的方法 1.1.5.统计学习的研究 1.1.6.统 ...

最新文章

  1. 7-28 猴子选大王 (C语言)
  2. 从一次react异步setState引发的思考
  3. iOS开发火了九年,这些错误你还在犯嘛?
  4. Pro ASP.NET MVC –第五章 使用Razor
  5. 64位java_99.9%的Java程序员都说不清的问题:JVM中的对象内存布局?
  6. 企业用户福利来袭!腾讯三大研发管理产品集中亮相2018腾讯合作伙伴大会
  7. 全球五大顶级域名一周统计:7月第三周新增超9万个
  8. C++编译出现binding ‘const string {aka const std::__cxx11::basic_string<char>}’ to reference of type ‘std
  9. HDU 6127 Hard challenge(极角 + 二分)
  10. 与神经网络相比,你对P图一无所知
  11. 20130912计划
  12. 20200121每日一句
  13. 苹果耳机无线真假测试软件,苹果耳机“真伪”终极鉴别来了,原来,区别如此大!...
  14. python调用excel的宏_配置Office Excel运行Python宏脚本
  15. ireader_使用iReader在Chrome和Firefox上获取Safari Reader
  16. ThinkPHP5房屋中介管理系统
  17. 计算机断层CT检查肺部混浊,揪出早期肺癌 低剂量电脑断层检查
  18. 团队管理,领导的“无为”就是最大“有为”
  19. 中文分词工具安装教程及分词和词性标注应用(jieba、pyhanlp、pkuseg、foolnltk、thulac、snownlp、nlpir)
  20. 腾讯游戏10大经典案例(二):天堂等于天下

热门文章

  1. JAVA11_03学习总结(面向对象!)
  2. 1856 老赵的挑逗
  3. C#开发GIS应用简明教程(二)
  4. python获取CPU和操作系统类型
  5. 用c#做的工作流设计器
  6. android string中换行,android StringBuffer实现换行
  7. 2021年安全员-B证(广西省)考试题及安全员-B证(广西省)考试题库
  8. .Net Core in Docker - 使用阿里云Codepipeline及阿里云容器镜像服务实现持续集成(CI)
  9. Siemens Logo!Soft Comfort 8.3
  10. VR全景创业为什么要选择加盟?