模式识别 —— 第一章 贝叶斯决策理论
模式识别 —— 第一章 贝叶斯决策理论
前言
新的学期开始了,当然是要给不爱吃香菜的月亮记录学习笔记呀~
没多久了,待夏花绚烂之时~人山人海,我们如约而至!
以后清河海风 溶溶月色 共赏之人 就在身侧 mua~
文章目录
- 模式识别 —— 第一章 贝叶斯决策理论
- 前言
- 贝叶斯决策
- 先验概率
- 类条件概率
- 后验概率
- 最大后验概率决策(最小错误率决策)
- 最小风险决策
- 含拒取的最小损失判别规则
- N-P判决
- 判别函数和决策面
- 正态分布下的贝叶斯决策
- 协方差方差矩阵
贝叶斯决策
先验概率
先验概率就是人们根据一些先验知识预先知道的一些概率。比如,南理工男女比例7:3.
类条件概率
就是在先验概率 w i w_i wi的条件下发生 x x x事件的概率。
后验概率
由这张图也可以看出,最大后验概率决策其实就是最小错误决策。
最大后验概率决策(最小错误率决策)
后验概率形式:
条件概率形式
其实就是用贝叶斯公式展开后约去分母
似然比形式
通过上式移项得到。
对数形式
主要是方便求导,也可将之后的累乘化为累加。
最小风险决策
从不同性质的错误会引起不同程度的损失这一考虑出发,我们有时宁肯扩大一些总的错误率,也要使总的损失最小。这就提出了最小损失准则的决策方法。例如,有时2类代价相差很大,比如医疗诊断的场合、工业检测。
为了区分不同错误的代价,我们这里引入了决策代价。
对应的决策代价表如下:
在采取决策 a j a_j aj的条件期望是:
看所有判决对应的期望,选最小的风险判决。
整体流程如下:
最小错误率判决(最大后验概率判决)与最小风险决策的似然比形式一样,只不过在判别阈值上最小风险决策要加上损失代价。
含拒取的最小损失判别规则
例如,人脸识别中有一些未识别的情况,而不是错误的将你识别成另外一个人。那么当后验概率小于多少时采取拒取呢?如下图推导:
N-P判决
在实际问题中,可能存在某一个错误较另一个错误更为重要。于是我们想在限定一类错误的概率下使得另一类错误的概率最小。
- 例如,在人脸识别中判断错误比未识别要严重许多。所以我们要求判断错误的概率要不超过 1 0 − 6 10^{-6} 10−6(要不超过6位密码的安全级才能投入使用)。在此基础上,我们尽量降低拒取的概率。这里用的是拉格朗日乘子法,不再详解。
判别函数和决策面
正态分布下的贝叶斯决策
对于二维正态分布有如下公式:
这里的 Σ \Sigma Σ是协方差矩阵
协方差方差矩阵
协方差定义
X、Y 是两个随机变量,X、Y 的协方差 cov(X, Y) 定义为:
协方差矩阵定义
矩阵中的数据按行排列与按列排列求出的协方差矩阵是不同的,这里默认数据是按行排列。即每一行是一个observation(or sample),那么每一列就是一个随机变量。
求解协方差矩阵的步骤
协方差代表的意义
正相关
负相关
不相关
当X 与Y 正相关时,它们的分布大部分在区域(1)和(3)中,小部分在区域(2)和(4)中,所以平均来说,有 ( X − E X ) ( Y − E Y ) > 0 (X-EX)(Y-EY)>0 (X−EX)(Y−EY)>0 。
当 X与 Y负相关时,它们的分布大部分在区域(2)和(4)中,小部分在区域(1)和(3)中,所以平均来说,有 ( X − E X ) ( Y − E Y ) < 0 (X-EX)(Y-EY)<0 (X−EX)(Y−EY)<0。
当 X与 Y不相关时,它们在区域(1)和(3)中的分布,与在区域(2)和(4)中的分布几乎一样多,所以平均来说,有 ( X − E X ) ( Y − E Y ) = 0 (X-EX)(Y-EY)=0 (X−EX)(Y−EY)=0 。
所以,我们可以定义一个表示X, Y 相互关系的数字特征,也就是协方差.
c o v ( X , Y ) = E ( X − E X ) ( Y − E Y ) cov(X, Y) = E(X-EX)(Y-EY) cov(X,Y)=E(X−EX)(Y−EY)
当 c o v ( X , Y ) > 0 cov(X, Y)>0 cov(X,Y)>0时,表明 X与Y 正相关;
当 c o v ( X , Y ) < 0 cov(X, Y)<0 cov(X,Y)<0时,表明X与Y负相关;
当 c o v ( X , Y ) = 0 cov(X, Y)=0 cov(X,Y)=0时,表明X与Y不相关。
模式识别 —— 第一章 贝叶斯决策理论相关推荐
- 【面试宝典】软件测试工程师2021烫手精华版(第一章测试理论篇)
前言: 翻了很多论坛博客关于面试的文章,很多都是不完整的,还都是比较常见规规矩矩的,那大家刷过的基本都不拿出来了,都是一些大家平时见得不多,但是面试官很看中的一些题. 第一章 测试理论 一. 软件工程 ...
- 数学分析-第一章-极限理论
第一章 极限理论1 1.1 数列的极限 1.1.1 数列极限的定义 定义(ϵ−N\epsilon-Nϵ−N) {xn}\{x_n\}{xn}是已知数列,aaa为已知实数,如果对任给ϵ>0\ep ...
- 全文检索工具elasticsearch:第一章:理论知识
搜索 什么是搜索, 计算机根据用户输入的关键词进行匹配,从已有的数据库中摘录出相关的记录反馈给用户. 常见的全网搜索引擎,像百度.谷歌这样的.但是除此以外,搜索技术在垂直领域也有广泛的使用,比如淘宝. ...
- 软件测试技术指南-第一章软件测试理论(此章完结)
1.3软件测试基本概念 测试(Test)就是检测特定的目标,是否符号标准而采用专用工具或方法进行验证,并最终得出特定结构,软件测试(Software Testing)伴随着软件的诞生而产生,软件测试就 ...
- 第一章 数据仓库理论专题
1.数据仓库概述 1.1.诞生背景 (1)历史数据积存 历史数据使用频率低,积压在业务库中,导致业务系统的性能下降;企业定期将冷数据存储到数据仓库中 (2)企业数据分析需要 各个部门自己建立独立的数据 ...
- 模式识别-从贝叶斯决策理论看模式分类
模式识别中的贝叶斯决策理论 理论路线 难点解析 话不多说,我们先梳理一下贝叶斯模式分类的基本流程: 收集训练样本 用每一类的样本估计类条件概率密度p(x∣wi)p(x|w_i)p(x∣wi) 估计类 ...
- 模式识别—贝叶斯决策理论
绪论 模式的两个层次:样本.类别 模式的表示:两个 识别对象的表示:选择特征来对所识别的对象进行表示,特征选择的好坏对识别对象的难度有很大影响. 每个对象可选择多个特征来表示,这些特征用一个特征向量来 ...
- 《模式识别原理及工程应用》——第2章 基于贝叶斯决策理论的分类器 2.1 分类器的描述方法...
第2章 基于贝叶斯决策理论的分类器 2.1 分类器的描述方法 分类器是一种计算机程序,它的设计目标是在通过学习后,可自动将数据分到已知类别.分类器常应用在搜索引擎以及各种检索程序中,同时也大量应用于数 ...
- 模式识别与机器学习·第一章——概论
模式识别与机器学习·第一章--概论 开篇 模式识别 模式 识别 机器学习 研究目的 发展历史 模式识别简史 机器学习简史 系统方法 系统目标 假说的获得 系统的构成 小结 开篇 这系列博客主要用来回忆 ...
最新文章
- 运维提升首选技能KubernetesPrometheus,你了解多少?(文末福利)
- 密码太多记不住?SSO帮你轻松访问VDI及外部资源
- [LeetCode 001] Two Sum
- MySQLdb批量插入数据
- 使用VMware VSphere WebService SDK进行开发 (一)——基本信息阐述
- installEventFilter、eventFilter函数理解
- jvm配置参数,查看大对象直接分配到老年代
- 如何在React Native中使用文本输入组件?
- 我又踩坑了!如何为 HttpClient 请求设置 Content-Type 标头?
- SQLite Tutorial 5 : How to Import CSV or Excel file into SQLite database
- 【性能测试】性能测试中问题反思和心得
- 数据归档方案(带流程图)
- 等保测评机构申请难吗?到哪里申请?
- Git Tortoise安装 CodeHub
- 如何提高自身跟团队的领导力?
- Redis的基本使用
- C++解决报错常量中有换行符
- 对话 CTO | 服务万亿旅游市场,去哪儿网企业级运维的精益实践
- HTML5期末大作业:动漫网站设计——火影忍者动漫(7页) HTML+CSS+JavaScript 漫画网页制作作业_电影网页设计...
- jython 调用java_Jython简介,第1部分:Java编程变得更容易
热门文章
- 聚焦机器人集成应用,看未来工厂“智”变!
- php-beast源码加密
- org.yaml.snakeyaml.scanner.ScannerException: while scanning a simple key
- 夺宝网站服务器配置,【合区公告】“夺宝奇兵”“决战昆仑”服务器数据互通操作...
- ssm小型物流信息系统毕业设计源码071146
- Python pip安装selenium安装不了报错原因
- 普通本科毕业一年后的真实感受
- 2016年开发的供水管线设计工具进行升级
- 于明:AMD比INTEL更受青睐
- Python批量跑Hive数据到本地目录