模式识别技术漫谈(3)

-------高维空间

我们在表示某个事物的特征时,其特征数一般有三个以上的,甚至有好几百个特征,为了表示方便,对于特征值一般采用向量的形式来表示,所以我们在研究模式识别时会有很多的矩阵运算,对于特征值的运算我们可以把它想象成是一个高维空间中的运算,矩阵运算可以方便地表达高维空间中的运算,所以说线性代数是研究模式识别的数学基础,更高层次的数学理论是泛函分析,它是研究无限维空间的几何学和分析学。

对于三维以下空间,我们可以较容易地想象出来,但是三维以上的空间超出了我们的感知能力,很多在三维以下空间的计算,推广到高维空间时,则不灵了,出现了所谓的“维数灾难”,这是因为高维空间中出现了稀疏性和空空间的现象,即高维空间中的数据分布会非常地稀疏,且可能出现密度会很高的空区域中点,维数灾难是Bellman首先提出来的,它泛指在数据分析中遇到的由于变量过多而引起的一系列问题,有点象“指数爆炸”,随着指数的递增,数据会迅速膨胀到难以想象的大。

SVM模式识别技术利用核方法,在高维空间中进行变换,巧妙地解决了维数灾难的问题,所以很多实验表明SVM分类算法总是能够优于其它分类算法。虽然有如此的好办法,但是我们还是得想办法降低维数,降低了维数,不仅可以降低计算的复杂度,也可以排除不必要的干扰特征,在众多的特征中也许有些特征是没有用的,即可能存在不是特征的特征,把这些无用的特征去掉,可以改善分类器的性能,目前降低维数主要应用的办法是PCA方法,很多人在描述这个方法时总要扯上协方差矩阵,让人陷入一大堆公式的推导中,其实核心思想就是把方差最小的那些特征排除掉,如果你知道这一点,可以不用理协方差矩阵,直接通过统计样本的特征值方差来实现PCA方法。

两组特征之间的距离可以有很多种表示方法,如欧氏距离、绝对值距离、切比雪夫距离、马氏距离、兰氏距离、相似系数、定性指标的距离等,大家比较熟悉的是欧氏距离,其实这种距离在高维空间并不常用,不仅是因为计算量大,还因为不同特征的值,其计算单位不一样,不可以把每种特征同等看待,在模式识别中采用哪种距离计算方式很重要,会关系到分类器设计的成败。计算距离的方式需要根据实际情况灵活应用,有时甚至可以自己设计距离计算方式,只要满足距离的四个条件即可:

1.当且仅当两点重合时距离才会等于0;

2.距离值必需是大于或等于0;

3.对称性:从A点到B点求得的距离等于从B点到A点求得的距离;

4.三角不等式:三个点形成的三角距离关系中,任两边的和大于第三边。

模式识别技术漫谈(3)相关推荐

  1. 模式识别技术漫谈(1)

    模式识别技术漫谈(1) ------引言 在人工智能技术(Artificial Intelligence)领域中,模式识别(Pattern Recognition)技术也许是最具有挑战性的一门技术了, ...

  2. 模式识别技术漫谈(2)

    模式识别技术漫谈(2) -------大量应用了概率和统计分析方法 模式识别大体上可以分为统计模式识别和句法模式识别,统计模式识别是对大量的样本进行统计或学习而最后得到一个分类器,如贝叶斯分类器.神经 ...

  3. 模式识别技术漫谈(4)

    模式识别技术漫谈(4) ------------关于机器学习 一提到机器学习,首先大家会想到的一定是神经网络,其实机器学习方法很多,这里借用"Learning OpenCV"(Ga ...

  4. 模式识别技术漫谈(5)

    神经网络基本原理 学习模式识别我个人觉得从神经网络入手可能是个较好的选择,一方面可以避免一下子就陷入复杂的公式推导中,另一方面可以让我们较快就能体验到模式识别是个什么样的技术,因为我们可以利用matl ...

  5. doe报告模板_技术漫谈|关于制剂研发过程中的实验设计(DOE)误区讨论

    技术漫谈 第01期 关于制剂研发过程中的实验设计(DOE)误区讨论 // 作者:合全药业制剂业务后期项目部 感谢合全药业制剂研发后期团队朱莹.夏彬等同事对本稿件的支持 早在2004-2005年,FDA ...

  6. 【深度学习】模式识别技术探索之决策树(Decision tree)

    [深度学习]模式识别技术探索之决策树(Decision tree) 文章目录 1 什么是模式和模式识别? 2 常见的模式识别系统 3 应用领域 4 举例:随机森林(Random Forest)4.1 ...

  7. 客户端软件GUI开发技术漫谈:原生与跨平台解决方案分析

    原生开发应用开发 Microsoft阵营的 Winform WinForm是·Net开发平台中对Windows Form的一种称谓. 如果你想深入的美化UI,需要耗费很大的力气,对于目前主流的CSS样 ...

  8. SSO(单点登录)技术漫谈

    目录 1. 名词解释 2. 简介 3. SSO的优势 4. 产品表现 5. 客户需求 6. SSO技术漫谈 7. 基础组件 8. 反向代理SSO 9. 有端SSO 10. 参考资料 1. 名词解释 S ...

  9. 当前电子鼻系统数据处理中常用的模式识别技术

    当前电子鼻系统数据处理中常用的模式识别技术 当前电子鼻数据处理中所采用的模式识别算法主要包括k近邻法(k-Nearest Neighbor ,k-NN).聚类分析(Cluster Analysis , ...

最新文章

  1. 初学者python笔记(os模块、sys模块)
  2. Android -- Camera.ShutterCallback
  3. vue+vuex初入门
  4. Python3入门机器学习经典算法与应用 第3章 更多相关操作
  5. AspectJ+AJDT+用Ant管理AspectJ项目+AspectJ教程
  6. dos命令查看电脑配置
  7. 用计算机写作文教学反思,语文作文教学反思(精选6篇)
  8. 解决ThinkPad E580因AMD显卡导致系统崩溃的问题
  9. vs2017 自定义背景图片
  10. 13 个非常有用的 Python 代码片段,建议收藏
  11. 数学知识的一些常用公式
  12. 我们是怎么一步步陷入贫穷的
  13. USACO 1.4 Mother's Milk 母亲的牛奶(经典的dfs倒水问题)
  14. php操作主从mysql_PHP 操作MySQL数据库
  15. 基于协同过滤 算法推荐系统图书推荐猜你喜欢
  16. 多层神经元感知器模型_使用多层感知器模型对星系进行分类
  17. 征途服务器维护后可以判国家吗,12月22日全服更新维护公告
  18. sparksql insertinto 源码解析
  19. 卷积、自相关函数、功率谱密度
  20. JVM上篇_01_JVM与Java体系结构_尚硅谷

热门文章

  1. LLC环路计算与仿真分析——K因子法
  2. 【cocos2dx学习笔记】制作Loding场景
  3. 英语论文格式修改(两栏)
  4. EasyExcel使用教程
  5. css实现内容两端对齐
  6. Position属性值的相关解析
  7. oracle数据库审计优点缺点,Oracle数据库安全性:标准数据库审计
  8. NBA勇士陷入苦境 威金斯不保证这季会归队
  9. 外盘国际期货招商:每日港股市场要闻
  10. Oracle 官网登录账号