引言:在学习拉普拉斯特征映射(Laplacian Eigenmaps, LE)的过程中,发现大多数参考资料仅列出了其中的最优化问题,然后直接过渡到特征值问题,对于该优化问题,特别是其中的约束条件解释的很少,不多的解释也很模糊。阅读过 LE 的原论文之后,将个人的理解整理如下。

Laplacian eigenmaps and spectral techniques for embedding and clustering​papers.nips.cc

一句话结论

  1. 约束条件

    起到

    消除缩放因子防止特征映射退化到更低维的空间 两个作用。

2. 拉普拉斯特征映射等价的最优化问题应该为

这时解为

个最小的

非零特征值之和,

是对应的特征向量作为列构成的矩阵。

而不是各种资料中常见的

注:下文的阅读可能需要预先非常熟悉 LE 的计算过程。

拉普拉斯特征映射

以下简单的定义下符号:LE 将

维空间中近似流形上的数据
建成无向图,用(带权)邻接矩阵
表示它们之间的邻接关系。引入度数矩阵

和拉普拉斯矩阵

拉普拉斯矩阵半正定,且具有

特征值:

LE 将

映射到
维空间中的
,其优化目标是

将投影后的向量按行构成,(1) 等价于

因为(以下为了偷懒不将向量符号加粗了)

该无约束的优化问题解显然是任意的:首先,解可以退化到一个点,即所有

相同;其次,
可以有任意的尺度。因此,为该优化问题加上约束

消除缩放因子:为什么度量是

比较容易理解的是,约束 (2) 的必要条件

消除了

的缩放因子,固定了其尺度

至于为什么选择

作为度量矩阵,论文中原文是

Matrix D provides a natural measure on the vertices of the graph

《机器学习——原理、算法与应用》一书中解释为 “主对角元反映了图的每个节点的重要性”,这比较晦涩难懂。

这里有一个相关的提问

Question about the constraint in Laplacian eigenmaps​math.stackexchange.com

其中第一个回答讲的比较虚,强调了一个好的度量在实际中是非常重要的。第二个回答则从数值角度解释了为什么这是一个好的度量

the eigenvector will have extreme large number on the position corresponding to the vertex with high degree.

简单来说,这一度量使得特征向量(也就是下文中原问题等价的广义特征值问题的解)的数值分布更 “均匀、自然”,也就是嵌入低维空间后的分布更 “均匀、自然”。

防止空间退化:约束究竟应该是什么

在加入了

的约束后,运用拉格朗日乘数法

求导后得到
。问题转化为广义特征值问题

即最优化的必要条件是

是 (3) 的特征向量。

为了使特征映射不退化到更低维的空间,加上约束

的列向量之间正交。

对于对称阵

,显然其

不同特征值的特征向量满足正交条件:设两个不同的特征值和对应特征向量分别为

,则有下式

是半正定阵,广义特征值问题 (3) 的特征值非负。constraint 1 和 2 共同构成约束条件 (2),此时我们得到

的最优解是

个最小的特征值之和,
是由最小
个特征值对应的特征向量作为列构成的矩阵。

并不是各种中文参考资料中说明的最小

非零 特征值。

实际上,注意到 (3) 具有特征值

和特征向量
,如果选取
去构成
会导致所有
的第一个分量都是
,退化到更低一维的空间。

因此,在原论文中,以一维情况引入时,最优化问题写作

保证特征向量

被排除在外,但是在推广到嵌入
维时略去了
的推广项。

因此,实际上拉普拉斯特征映射等价的最优化问题应该为

此时解为

个最小的

非零特征值之和

是对应的特征向量作为列构成的矩阵。

算法流程

附拉普拉斯特征映射的算法流程

第一步:构造邻接关系,判断两点是否邻近有两种方法:欧氏距离小于设定的阈值

;或者若
近邻中或
近邻中,则邻接

第二步:计算权重,一种方法是对于邻接点

是参数;或者直接令邻接点
,否则

第三步:特征映射。取广义特征值问题的前

小的特征值对应的特征向量
,其中
对应特征值
,则投影结果为

参考文献

[1] Belkin, M., & Niyogi, P. (2002). Laplacian eigenmaps and spectral techniques for embedding and clustering. InAdvances in neural information processing systems(pp. 585-591).

[2] 雷明. (2019). 机器学习——原理、算法与应用. 清华大学出版社.

拉普拉斯分布_理解拉普拉斯特征映射中的优化问题的约束条件相关推荐

  1. matlab中表示拉普拉斯分布_神奇的正态分布

    在统计学中有各种各样的分布,称为统计分布,例如有离散型的伯努利分布.二项分布.超几何分布.几何分布.负二项分布.泊松分布,有连续型的均匀分布.指数分布.t分布.卡方分布.F分布.正态分布等等,其中正态 ...

  2. matlab中表示拉普拉斯分布_拉普拉斯分布的随机数

    一.功能 产生拉普拉斯分布的随机数. 二.方法简介 1.产生随机变量的组合法 将分布函数\(F(x)\)分解为若干个较为简单的子分布函数的线性组合 \[F(x)=\sum_{i=1}^{K}p_{i} ...

  3. matlab中表示拉普拉斯分布_分布拟合——正态/拉普拉斯/对数高斯/瑞利 分布

    作者:桂. 时间:2017-03-16  20:30:20 声明:欢迎被转载,记得注明出处~ 前言 本文为曲线与分布拟合的一部分,主要介绍正态分布.拉普拉斯分布等常用分布拟合的理论推导以及代码实现. ...

  4. matlab中表示拉普拉斯分布_深度优化局部拉普拉斯金字塔滤波器。

    微信公众号:OpenCV学堂关注获取更多计算机视觉与深度学习知识 觉得文章有用,请戳底部[好看]支持 算法概述 基于局部拉普拉斯金字塔的Edge-aware滤波器是在2011年由Adobe 公司的研究 ...

  5. matlab中表示拉普拉斯分布_双导体球在匀强外电场中的空间电场分布

    导体球或球壳在匀强外电场中的场强分布是电动力学中的经典题目,也是大家所熟悉的题目,但均匀电场中出现两个导体球或球壳(二聚体)时的场强却少有讨论.两导体球电极化所引起的导体球间电磁场的局域增强是表面等离 ...

  6. 拉普拉斯分布_中心极限定理:从高尔顿板到麦克斯韦分布

    ​神奇的正态分布源于"加". 撰文 | 张和持 时隔多年,或许你早就记不得16岁那年夏天高中闷热的教室,但可能会记得有一天数学老师说着要给大伙看个稀奇--一块祖传的高尔顿板.尽管班 ...

  7. 下列统计量服从什么分布_设 ,且 是从 中抽取的样本,则统计量 服从的分布为( )。_学小易找答案...

    [单选题]我国资金流量核算的初始流量是( ). [填空题]影响人际交往的主观因素有: 认识因素.情感因素._. [判断题]防火墙,也成为防护墙,是指建筑物之间用来防止火势蔓延的防火隔离墙. [单选题] ...

  8. asp绑定gridview属性_理解ASP.NET Core中的模型验证

    当MVC执行模型绑定后,为了验证绑定为参数提供的值是否符合预期,还需要进行模型验证. 一.理解模型验证 模型验证是指模型绑定后对Action参数进行验证的过程.它会根据事先定义的规则对参数的值进行验证 ...

  9. java泛型中的通配符是_理解在Java泛型中使用通配符?

    我问了一个类似的问题,这是一个更具体的版本,希望能得到明确的答案. 在尝试了解Java通用类型和通配符"?"的用法时,我尝试了以下操作: List li4 = new ArrayL ...

最新文章

  1. Java8 Stream应用:Map合并、过滤、遍历、values int求和等
  2. 多协程爬取中大微博内容(以及转发数,点赞数,评论数)
  3. OC中runtime的使用
  4. 对datatable操作经验-排序和分页
  5. 在既有系统中打通Apache Ignite、MySQL和Node.js
  6. RTX移植到STM32F103
  7. (65)FPGA面试题-状态机编码选择原则?
  8. 谈谈java中的集合框架
  9. 详解BetterZip对压缩包注释的一些相关小功能
  10. pythonnumpy算术函数_python的numpy.prod函数运行实例详解
  11. C语言 知识点总结完美版
  12. 疫情下,裁员补偿标准不可不知
  13. 怎么搭配丝袜优雅不低俗?
  14. Android fragment中广告图片轮播效果的实现(附图 )
  15. 新特性速递 | InnoDB redo log archiving(归档)
  16. 写好 JS 条件语句的 5 条守则
  17. 跑跑卡丁车蛋白石盒喜当托儿纪念,2022/06/12,22:59:24
  18. Oracle卸载:指定数据库的诊断目标位置不存在解决
  19. 嵌入式Linux系统的电子书阅读器项目1——Overview
  20. Tabby 安装步骤

热门文章

  1. 定区关联快递员 定区关联收派时间
  2. 【AtCoder】ARC 081 E - Don't Be a Subsequence
  3. 【转】三星8552 手机提示升级系统 完成后重启 开机画面一直停留在三星的LOGO 一闪一闪 怎么办...
  4. C#实现WebService服务 项目完整总结
  5. 从程序员到CTO的Java技术路线图 JAVA职业规划 JAVA职业发展路线图 系统后台框架图、前端工程师技能图 B2C电子商务基础系统架构解析...
  6. 分布式 Spring Cloud 基于 Spring Boot 开发一整套
  7. VS2017控制台打印问题
  8. 小行星编号_一颗比造成通古斯爆炸更大的小行星正疾速飞来,两天后与地球相会...
  9. 时间序列模型matlab_平稳时间序列分析01---AR模型
  10. uni-app 封装请求