模式识别 —— 第一章 贝叶斯决策理论

前言

新的学期开始了,当然是要给不爱吃香菜的月亮记录学习笔记呀~

没多久了,待夏花绚烂之时~人山人海,我们如约而至!

以后清河海风 溶溶月色 共赏之人 就在身侧 mua~

文章目录

  • 模式识别 —— 第一章 贝叶斯决策理论
    • 前言
    • 贝叶斯决策
      • 先验概率
      • 类条件概率
      • 后验概率
      • 最大后验概率决策(最小错误率决策)
      • 最小风险决策
      • 含拒取的最小损失判别规则
      • N-P判决
    • 判别函数和决策面
    • 正态分布下的贝叶斯决策
      • 协方差方差矩阵

贝叶斯决策

先验概率


先验概率就是人们根据一些先验知识预先知道的一些概率。比如,南理工男女比例7:3.

类条件概率


就是在先验概率 w i w_i wi​的条件下发生 x x x事件的概率。

后验概率


由这张图也可以看出,最大后验概率决策其实就是最小错误决策。

最大后验概率决策(最小错误率决策)

后验概率形式:


条件概率形式

其实就是用贝叶斯公式展开后约去分母

似然比形式
通过上式移项得到。

对数形式

主要是方便求导,也可将之后的累乘化为累加。

最小风险决策


从不同性质的错误会引起不同程度的损失这一考虑出发,我们有时宁肯扩大一些总的错误率,也要使总的损失最小。这就提出了最小损失准则的决策方法。例如,有时2类代价相差很大,比如医疗诊断的场合、工业检测。

为了区分不同错误的代价,我们这里引入了决策代价。


对应的决策代价表如下:

在采取决策 a j a_j aj​的条件期望是:

看所有判决对应的期望,选最小的风险判决。


整体流程如下:


最小错误率判决(最大后验概率判决)与最小风险决策的似然比形式一样,只不过在判别阈值上最小风险决策要加上损失代价。

含拒取的最小损失判别规则

例如,人脸识别中有一些未识别的情况,而不是错误的将你识别成另外一个人。那么当后验概率小于多少时采取拒取呢?如下图推导:

N-P判决

在实际问题中,可能存在某一个错误较另一个错误更为重要。于是我们想在限定一类错误的概率下使得另一类错误的概率最小。

  • 例如,在人脸识别中判断错误比未识别要严重许多。所以我们要求判断错误的概率要不超过 1 0 − 6 10^{-6} 10−6(要不超过6位密码的安全级才能投入使用)。在此基础上,我们尽量降低拒取的概率。这里用的是拉格朗日乘子法,不再详解。

判别函数和决策面

正态分布下的贝叶斯决策


对于二维正态分布有如下公式:

这里的 Σ \Sigma Σ是协方差矩阵

协方差方差矩阵

协方差定义
X、Y 是两个随机变量,X、Y 的协方差 cov(X, Y) 定义为:

协方差矩阵定义
矩阵中的数据按行排列与按列排列求出的协方差矩阵是不同的,这里默认数据是按行排列。即每一行是一个observation(or sample),那么每一列就是一个随机变量。

求解协方差矩阵的步骤

协方差代表的意义

正相关

负相关

不相关

  • 当X 与Y 正相关时,它们的分布大部分在区域(1)和(3)中,小部分在区域(2)和(4)中,所以平均来说,有 ( X − E X ) ( Y − E Y ) > 0 (X-EX)(Y-EY)>0 (X−EX)(Y−EY)>0 。

  • 当 X与 Y负相关时,它们的分布大部分在区域(2)和(4)中,小部分在区域(1)和(3)中,所以平均来说,有 ( X − E X ) ( Y − E Y ) < 0 (X-EX)(Y-EY)<0 (X−EX)(Y−EY)<0。

  • 当 X与 Y不相关时,它们在区域(1)和(3)中的分布,与在区域(2)和(4)中的分布几乎一样多,所以平均来说,有 ( X − E X ) ( Y − E Y ) = 0 (X-EX)(Y-EY)=0 (X−EX)(Y−EY)=0 。

所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是协方差.

c o v ( X , Y ) = E ( X − E X ) ( Y − E Y ) cov(X, Y) = E(X-EX)(Y-EY) cov(X,Y)=E(X−EX)(Y−EY)

当 c o v ( X , Y ) > 0 cov(X, Y)>0 cov(X,Y)>0时,表明 X与Y 正相关;

当 c o v ( X , Y ) < 0 cov(X, Y)<0 cov(X,Y)<0时,表明X与Y负相关;

当 c o v ( X , Y ) = 0 cov(X, Y)=0 cov(X,Y)=0时,表明X与Y不相关。


模式识别 —— 第一章 贝叶斯决策理论相关推荐

  1. 【面试宝典】软件测试工程师2021烫手精华版(第一章测试理论篇)

    前言: 翻了很多论坛博客关于面试的文章,很多都是不完整的,还都是比较常见规规矩矩的,那大家刷过的基本都不拿出来了,都是一些大家平时见得不多,但是面试官很看中的一些题. 第一章 测试理论 一. 软件工程 ...

  2. 数学分析-第一章-极限理论

    第一章 极限理论1 1.1 数列的极限 1.1.1 数列极限的定义 定义(ϵ−N\epsilon-Nϵ−N) {xn}\{x_n\}{xn​}是已知数列,aaa为已知实数,如果对任给ϵ>0\ep ...

  3. 全文检索工具elasticsearch:第一章:理论知识

    搜索 什么是搜索, 计算机根据用户输入的关键词进行匹配,从已有的数据库中摘录出相关的记录反馈给用户. 常见的全网搜索引擎,像百度.谷歌这样的.但是除此以外,搜索技术在垂直领域也有广泛的使用,比如淘宝. ...

  4. 软件测试技术指南-第一章软件测试理论(此章完结)

    1.3软件测试基本概念 测试(Test)就是检测特定的目标,是否符号标准而采用专用工具或方法进行验证,并最终得出特定结构,软件测试(Software Testing)伴随着软件的诞生而产生,软件测试就 ...

  5. 第一章 数据仓库理论专题

    1.数据仓库概述 1.1.诞生背景 (1)历史数据积存 历史数据使用频率低,积压在业务库中,导致业务系统的性能下降;企业定期将冷数据存储到数据仓库中 (2)企业数据分析需要 各个部门自己建立独立的数据 ...

  6. 模式识别-从贝叶斯决策理论看模式分类

    模式识别中的贝叶斯决策理论 理论路线 难点解析 话不多说,我们先梳理一下贝叶斯模式分类的基本流程: 收集训练样本 用每一类的样本估计类条件概率密度p(x∣wi)p(x|w_i)p(x∣wi​) 估计类 ...

  7. 模式识别—贝叶斯决策理论

    绪论 模式的两个层次:样本.类别 模式的表示:两个 识别对象的表示:选择特征来对所识别的对象进行表示,特征选择的好坏对识别对象的难度有很大影响. 每个对象可选择多个特征来表示,这些特征用一个特征向量来 ...

  8. 《模式识别原理及工程应用》——第2章 基于贝叶斯决策理论的分类器 2.1 分类器的描述方法...

    第2章 基于贝叶斯决策理论的分类器 2.1 分类器的描述方法 分类器是一种计算机程序,它的设计目标是在通过学习后,可自动将数据分到已知类别.分类器常应用在搜索引擎以及各种检索程序中,同时也大量应用于数 ...

  9. 模式识别与机器学习·第一章——概论

    模式识别与机器学习·第一章--概论 开篇 模式识别 模式 识别 机器学习 研究目的 发展历史 模式识别简史 机器学习简史 系统方法 系统目标 假说的获得 系统的构成 小结 开篇 这系列博客主要用来回忆 ...

最新文章

  1. 运维提升首选技能KubernetesPrometheus,你了解多少?(文末福利)
  2. 密码太多记不住?SSO帮你轻松访问VDI及外部资源
  3. [LeetCode 001] Two Sum
  4. MySQLdb批量插入数据
  5. 使用VMware VSphere WebService SDK进行开发 (一)——基本信息阐述
  6. installEventFilter、eventFilter函数理解
  7. jvm配置参数,查看大对象直接分配到老年代
  8. 如何在React Native中使用文本输入组件?
  9. 我又踩坑了!如何为 HttpClient 请求设置 Content-Type 标头?
  10. SQLite Tutorial 5 : How to Import CSV or Excel file into SQLite database
  11. 【性能测试】性能测试中问题反思和心得
  12. 数据归档方案(带流程图)
  13. 等保测评机构申请难吗?到哪里申请?
  14. Git Tortoise安装 CodeHub
  15. 如何提高自身跟团队的领导力?
  16. Redis的基本使用
  17. C++解决报错常量中有换行符
  18. 对话 CTO | 服务万亿旅游市场,去哪儿网企业级运维的精益实践
  19. HTML5期末大作业:动漫网站设计——火影忍者动漫(7页) HTML+CSS+JavaScript 漫画网页制作作业_电影网页设计...
  20. jython 调用java_Jython简介,第1部分:Java编程变得更容易

热门文章

  1. 聚焦机器人集成应用,看未来工厂“智”变!
  2. php-beast源码加密
  3. org.yaml.snakeyaml.scanner.ScannerException: while scanning a simple key
  4. 夺宝网站服务器配置,【合区公告】“夺宝奇兵”“决战昆仑”服务器数据互通操作...
  5. ssm小型物流信息系统毕业设计源码071146
  6. Python   pip安装selenium安装不了报错原因
  7. 普通本科毕业一年后的真实感受
  8. 2016年开发的供水管线设计工具进行升级
  9. 于明:AMD比INTEL更受青睐
  10. Python批量跑Hive数据到本地目录