0、前言

降维是计算机视觉、模式识别、机器学习等领域常见的数据分析和处理方法。在人脸识别、数据可视化等领域,通常需要从高维数据中提取有效的低维特征,以方便数据分析和处理。

降维算法主要包括线性降维算法和非线性降维算法。线性降维算法最典型的包括:主成分分析(Principal Component Analysis,PCA)和线性判别分析(Linear Discriminant Analysis,LDA)。PCA 是一种无监督的降维算法,其核心思想是找到一组正交基,将高维数据映射到低维空间,使降维后的数据方差最大,从而达到尽可能多的保留原始高维数据的信息。LDA 是一种监督的降维算法,其目标是寻找一组最优投影向量来最大化类间散度矩阵和类内散度矩阵之间的比值,使得同一类数据尽可能聚集在一起,不同类数据尽可能分开。

但是这两种算法都旨在保留原始高维数据的全局欧氏结构,并不能挖掘到原始高维数据的局部流形特征。因此,众多基于流形学习的非线性降维算法被广泛研究。

典型的算法有:邻域保持嵌入( Neighborhood PreservingEmbedding , NPE )和局部保留 投影(Locality Preserving Projection,LPP),此类算法都通过线性嵌入来保留数据的局部流形特征,给出了高维数据到低维数据的映射关系,但仅通过保留原始高维数据的局部流形特征,并不能很好地表征原始高维数据的可分性。于是,基于图嵌入的降维算法——边界 Fisher 分析(Marginal Fisher Analysis,MFA)、局部敏感判别分析(Locality Sensitive Discriminant Analysis ,LSDA)、 判 别最大化边界投影(Discriminant Maximum Margin Projections,DMMP),相继被提出 。

1、MFA理论

MFA通过边界Fisher准则寻找最佳投影方向 :目标函数如下

其中:

同类近邻连接权重矩阵:,根据该矩阵构造本征图

异类近邻连接权重矩阵:,根据该矩阵构造惩罚图

图1  MFA边界点分析图

结合MFA目标函数和边界点示意图,可以看出MFA旨在找到一个投影,使得同类近邻样本更加紧凑(即目标函数分母更小)和异类近邻样本间距离即异类边界点更远(目标函数分子更大)。以最大化目标函数为目标得到投影矩阵A。

2、理论优缺点分析

2.1 优点

如上述所说,在流形学习基础上,考虑边界的问题

2.2 可能存在的不足

①首先这是一种线性映射,不能增加原有数据集的信息(只可能减少原有数据集的信息)即不可能超越原有数据集具有的区分能力,线性降维只是实现用尽可能少的特征去逼近原始数据包含的所有信息(有用或者干扰信息),当然如果能保持有用信息剔除干扰信息更好。

②MFA对于边界较为清晰或者是异类样本重合度不够高的数据空间应该是有效的,可以想象图1中两类样本点完全杂乱无章融合在一起,这时候样本的异类边界和同类边界也完全融合在一起(目标点与其同类样本和异类样本的连接权重接近),根据目标函数,很难找到一组映射使得分子大而分母小。这个时候取得的映射矩阵并不能达到我们想要的效果(当然这种情况下任何线性方法都不一定能做到)。

③MFA选择的异类边界点与同类边界点之间没有直接的关联(都是独立寻找,并建立权重矩阵),我们为了两类样本尽可能分开,理想情况肯定是异类边界点与同类边界点尽可能分离,即应该将这两种边界点建立一种联系。

2.3  改进方向:

根据上述分析改进点如下:

①非线性化

②非线性基础上如何进一步改进样本间权重计算方法,避免权重接近情况

③异类边界和同类边界关联化,即本征图和惩罚图的构建不应该独立无关

④其他

3、MFA实现效果

基于相同的数据集,将MFA与PCA、LPP、LE、NPE这几种特征提取方法进行对比分析,结果如下:

基于图嵌入的降维算法——边界Fisher分析(MFA)相关推荐

  1. 基于图嵌入的兵棋联合作战态势实体知识表示学习方法

    基于图嵌入的兵棋联合作战态势实体知识表示学习方法 人工智能技术与咨询 来源:<指挥控制与仿真>,作者王保魁等 摘 要:为将基于离散符号的兵棋联合作战态势实体知识表示为机器更加容易学习.处理 ...

  2. 【推荐系统】基于图嵌入技术的推荐系统长文综述

    |作者:邓月 | 单位:电子科技大学 | 研究方向:图嵌入技术.推荐系统 近几年,基于图嵌入技术的推荐系统已成为一个热门的研究焦点,并将随着图嵌入技术的不断发展而持续.近日发布的<基于图嵌入技术 ...

  3. 基于图的异常检测算法——概述

    正在调研基于图的异常检测算法,先出个概述,后面再慢慢填坑 基于图的异常检测 给定一个图数据库,找到其中罕见不同于其他数据对象的点/边/子结构 静态图的异常检测 普通静态图 基于结构 基于特征:利用图结 ...

  4. 边界Fisher分析(MFA)及其非线性改进核边界Fisher分析(KMFA)的验证对比

    0.前言 前期博文讲述了MFA相关理论及其可以改进的点,本期文章对MFA进行非线性改进,提出核边界Fisher分析(KMFA)方法,并将MFA与KMFA在相同数据集上进行验证对比分析.MFA理论介绍见 ...

  5. 【图的着色问题】算法设计与分析实验1

    计算机科学与工程学院实验报告 课程名称 算法设计与分析 班级 实验内容 实验1:图的着色问题 指导教师 姓名 重剑DS 学号 实验日期 2022.04.28 一.问题描述,含输入.输出数据内容.格式 ...

  6. 基于图卷积神经网络的微博疫情情感分析

    一.前言 参考论文:Graph Convolutional Networks for Text Classification 官方Github源码:text_gcn 关于微博疫情情感分析,博主之前有过 ...

  7. 经典线性降维算法—独立成分分析(ICA)

    虽然很多时候A矩阵是n*n的,但是如果n取k(k<n),那么该方法就符合线性降维的一般模型,因此它可以看作一种线性降维算法. ICA算法的实现步骤: 白化处理步骤:

  8. Python实现基于图神经网络的异构图表示学习和推荐算法研究

    资源下载地址:https://download.csdn.net/download/sheziqiong/85978304 资源下载地址:https://download.csdn.net/downl ...

  9. SIGIR 2019 开源论文 | 基于图神经网络的协同过滤算法

    作者丨纪厚业 单位丨北京邮电大学博士生 研究方向丨异质图神经网络,异质图表示学习和推荐系统 引言 协同过滤作为一种经典的推荐算法在推荐领域有举足轻重的地位.协同过滤(collaborative fil ...

最新文章

  1. python 流写入文件_python文件流操作
  2. telegram bot 机器人 发送 加粗 斜体 字体
  3. Android的一个关于Activity和UI的小程序
  4. Apache开启Gzip压缩,LAMP网页压缩
  5. linux随机10字母病毒
  6. 表单如何添加大的文本框_在 Flutter 中进行文本框的创建和设定
  7. 什么是宇宙安全声明_《三体》三体人是否知道如何向宇宙发表安全声明?
  8. 各种机械原理动态图,看完脑洞大开,绝对涨姿势!
  9. Android设计模式之——中介者模式
  10. SQL-6查找所有员工入职时候的薪水情况,给出emp_no以及salary, 并按照emp_no进行逆序...
  11. ORACLE 10G修改主机名后EM Enterprise Manager无法启动的解决办法-Robert
  12. Struts项目中引入了过滤器filter后出现中文乱码情况
  13. Navicat Mac版中如何使用搜索筛选
  14. java的css的块_CSS基础知识(概念、块级元素、行内元素、选择器)
  15. 计算机表格中格式隐藏了怎么办,excel表格第一列被隐藏起来了怎么办
  16. win10怎么更改照片分辨率和大小?图片dpi修改方法
  17. 腾讯云云通信TLS后台API在mac上JAVA DEMO搭建
  18. 在win10系统中安装多个不同版本的python环境
  19. 基于物联网的无线温度系统在钢铁行业的应用
  20. Prokka:从安装到使用的那些坑!!!

热门文章

  1. PW2330原厂规格书12V转5V,3.3V稳压电源芯片,1A-3安
  2. 写一个杀戮尖塔存档修改器
  3. 企业内部培训——华微软件的培训制度
  4. 微信小程序中显示html格式内容的方法
  5. 计算100以内所有奇数的和以及所有偶数的和
  6. java获取上级菜单_java在多菜单中返回上级菜单如何实现
  7. 开发自主芯片,原来没有国产手机四强说的那么难
  8. 精准解决IDEA中文字体大小不一 奇奇怪怪
  9. 全球及中国体相全息透射光栅行业研究及十四五规划分析报告
  10. 电影订票网站的设计与开发