计算机视觉与模式识别速成

模式识别的基本定义

分类：输出量是离散的类别表达，即输出待识别模式所属的类别

回归：输出量是连续的信号表达（回归值），输出量维度：单个/多个维度

模式识别：根据已有知识的表达，针对待识别模式，判别决策其

所属的类别或者预测其对应的回归

分类(Classificat

(特征提取(feature extraction)：从原始输入数据提取更有效的信息

回归器(regressor)：将特征映射到回归值

判别函数：使用一些特定的非线性函数来实现，记作函数g 。由于判别函数通常固定已知，所以不把它当做模型的一部分

特征：

可以用于区分不同类别模式的、可测量的量。

例子：针对橙子和苹果两个类，形状or颜色？

输入数据也可以看做是一种原始特征表达。

特征的特点：鲁棒性

特征空间：每个坐标轴代表一维特征

空间中的每个点代表一个模式（样本）

从坐标原点到任意一点（模式）之间的向量即为该模式的特征

向量。

练样本

特征向量

一组训练样本（数据），记作

 每个训练样本 , 都是通过采样得到的一个模式，即输入特征空

间中的一个向量；通常是高维度（即 p 很大），例如一幅图像。

 训练样本可以认为是尚未加工的原始知识，模型则是经过学习（即加工

整理归纳等）后的真正知识表达。

 所有训练样本假设满足independent and identical distribution (iid) 。

 如果想学得好，这组训练样本要覆盖模型所有可能的分布空间。

模型的参数和结构

 模型的参数：

 模型的结构：函数 f 的形式。

 可见，模型结构决定了模型有哪些参数。

 通常情况下，模型的结构是设计人员事先给定的。

 如何学习模型结构是当前和未来机器学习领域的研究内容之一。

线性模型

非线性模型

特征向量的定义

训练样本个数=模型参数个数（N=M )参数有唯一的解。

训练样本个数 > 模型参数个数(N>M，Over-determined）：没有准确的解。

训练样本个数< 模型参数个数(N<M, Under-determined) : 无数个解/无解。

对亍over-determined的情况，需要额外添加一个标准，通过优化该标

准来确定一个近似解。该标准就叫目标函数（Objective function），

也称作代价函数（cost function）或损失函数（loss function）。

真值（ground truth）：针对每个训练样本，其对应的真实

正确的输出值, 记作。

标签（label）：对亍分类仸务，真值又称作标签。

通常，每个真值是一个向量。二类分类：真值是一个标量。

标注（labeling）：给每个训练样本标出真值的过程。目前，主

要由人工完成。

标注的样本（labeled samples）：有提供真值的样本。

未标注的样本（unlabeled samples）：没有提供真值的样本。

强化学习

有些仸务需要先后累积多次决策劢作才能知道最终结果好坏，

很难针对单次决策给出对应的真值，例如，棋类游戏。

强化学习：机器自行探索决策、真值滞后反馈的过程。

定义从输入状态到劢作决策为一个策略（policy）

使用该策略迚行决策探索时，给予每次决策一个奖励(reward）

累积多次奖励获得回报值(return)

回报的期望值作为该策略的价值函数（value function）

通过最大化回报的期望值，解出策略的参数

误差（error）：模型（机器）给出的预测/决策输出与真值输

出之间的差异。

训练误差( training error）：模型在训练集上的误差。

测试误差（test error）：模型在测试集上的误差。它反映了模

型的泛化能力，也称作泛化误差。

训练样本存在的问题：

训练样本稀疏：给定的训练样本数量是有限的（即有限采

样），很难完整表达样本真实分布。

训练样本采样过程可能不均匀：有些区域采样密一些，有些

区域采样稀疏一些。

一些训练样本可能带有噪声。

泛化能力：训练得到的模型不仅要对训练样本具有决策能力，

也要对新的（训练过程中未看见）的模式具有决策能力。

过拟合（over-fitting）：

模型训练阶段表现很好，但是在测试阶段表现很差。

模型过于拟合训练数据。

对于回归任务：测试误差。

二类分类：真阳性（TP），假阳性（FP），真阴性（TN），假阴性（FN）

多类分类：依次以单个类作为正类，其余为负类

混淆矩阵

根据模型的预测数值，对样本迚

行从高到低排序，排在前面的样

本是正例的可能性更高。

按此顺序逐个样本作为正例迚行

预测（或设置阈值截断正例和负

例），则每次可以计算一个召回

率和精度。

将这些值连成（拟合）一条曲线

横轴：False positive rate (FPR)，度量所有阴性样本中被错误

识别为阳性的比率。FPR=1-specificity。

 纵轴：True positive rate (TPR)，即recall。度量所有阳性样本

被识别为阳性的比例。

理想性能：左上角(0,1)处。

ROC曲线越往左上凸，说明模型的性能越好。

对角线：随机识别的ROC曲线。

绘制方法：不PR曲线相似。

ROC曲线：对于各类别之间

样本分布比例不敏感，因为

FPR和TPR各自只跟真值为负

或真值为正的样本相关。

 PR曲线：对于各类别样本分

布比例敏感，因为precision

同时和真值正负的样本都相关

MED分类器

特征正交白化

将原始特征映射到一个新的特征空间，使得在新空间

中特征的协方差矩阵为单位矩阵，从而去除特征变化

的不同及特征之间的相关性。

将特征转换分为两步：先去除特征之间的相关性（解耦, Decoupling），

然后再对特征进行尺度变换（白化, Whitening），使每维特征的方差

相等

Classification)

计算机视觉与模式识别速成相关推荐

VALSE 2020来了！60位计算机视觉、模式识别领域的优秀青年学者齐聚一堂
点击上方,选择星标或置顶,不定期资源大放送! 阅读大概需要15分钟 Follow小博主,每天更新前沿干货来源|VALSE VALSE 2020在线大会将于2020年7月31日-8月5日在线举办.大会 ...
计算机视觉和模式识别领域SCI期刊介绍
原帖地址: http://blog.sciencenet.cn/blog-370458-750306.html 关于计算机视觉和模式识别领域的期刊并不是很多,下面我收集了一些该领域的代表性期刊,并介绍 ...
【计算机视觉】计算机视觉、模式识别、机器学习常用牛人主页链接
计算机视觉.模式识别.机器学习常用牛人主页链接牛人主页(主页有很多论文代码) Serge Belongie at UC San Diego Antonio Torralba at MIT Alexe ...
国内外研究主页集合：计算机视觉-机器学习-模式识别
本文整理自 http://cvnote.info/pages-collection-by-carson2005/ 国际大牛 Adobe研究院 Jianchao Yang研究员 [进入主页] (稀疏表 ...
计算机视觉与模式识别代码合集第二版three
计算机视觉与模式识别代码合集第二版three Topic Name Reference code Optical Flow Horn and Schunck's Optical Flow ...
计算机视觉期刊水平,计算机视觉和模式识别领域的SCI期刊菜鸡一枚,领域,识别,EditSprings,艾德思...
计算机视觉和模式识别领域的代表就是四大顶会了:ICCV/ECCV/CVPR/NIPS,还有就是难度最高的PAMI了,这些都让人望而生畏.那么除了这些耳熟能详的期刊和会议之外,还有哪些该领域的期刊呢 ...
Paper之CVPRICCVECCV：2009年~2019年CVPRICCVECCV(国际计算机视觉与模式识别会议国际计算机视觉大会欧洲计算机视觉会议)历年最佳论文简介及其解读
Paper之CVPR&ICCV&ECCV:2009年~2019年CVPR&ICCV&ECCV(国际计算机视觉与模式识别会议&国际计算机视觉大会&欧洲计算 ...
车牌识别计算机应用领域,计算机视觉和模式识别在车牌识别中的应用
摘要: 车牌识别技术已经被越来越广泛地应用到现代交通的各个领域,在提高工作效率,降低劳动强度方面发挥着积极的作用. 本文以"车牌自动检测系统"项目为背景,研究了计算机视觉和模式识别 ...
清华博士计算机视觉,清华姚班本科生荣获国际计算机视觉与模式识别大会最佳论文奖...
清华姚班本科生荣获国际计算机视觉与模式识别大会最佳论文奖清华新闻网7月31日电 2017年国际计算机视觉与模式识别大会(IEEE Conference on Computer Vision and ...

计算机视觉与模式识别速成

模式识别的基本定义

计算机视觉与模式识别速成相关推荐

最新文章

热门文章