多维尺度变换(multidimensional scaling, MDS)是在低维空间去展示高维多元数据的一种可视化方法。该方法看起来类似于利用主成分得分作图，或者对两个线性判别量的得分作图。与上述方法不同的是，多维尺度变换的基本目标是将原始数据“拟合”到一个低维坐标系中，使得由降维所引起的任何变形最小。多维尺度变换涉及到的问题可以描述为：当n个项目中各对项目之间的相似性(或距离)给定时，求这些项目在低维空间的表示，并使得项目间的接近程度与原先的相似性(或距离) “大体匹配”。
　　根据样本是否可以计量，多维尺度变换可分为度量型多维尺度变换(metric MDS)和非度量型多维尺度变换(non-metric MDS)。在可计量的多维尺度变换中，依据度量的距离标准是否是欧氏距离，分为经典多维尺度变换(classical MDS)和非经典多维尺度变换(non-classical MDS)。

度量型多维尺度变换(metric MDS)

经典多维尺度变换(classical MDS)

　　多维尺度变换就是从经典多维尺度变换这个问题开始的。这个问题起源于当我们仅能获取到物体之间的距离的时候，如何由此去重构它的欧几里得坐标(Torgerson, W.S. 1958. Theory & Methods of Scaling. New York: Wiley)。譬如，在以前，对一个国家的许多城市而言，并不能确定各个城市的经纬度信息，却知道所有城市之间的两两距离。任意两个城市的距离可表示为

D=⎡⎣⎢⎢⎢⎢⎢d11d21⋮dn1d12d21⋮dn1⋯⋯⋱⋯d1nd2n⋮dnn⎤⎦⎥⎥⎥⎥⎥(1)

\mathbf{D}=\left[ \begin{matrix}{{d}_{11}} _{12}} & \cdots _{1n}} \\{{d}_{21}} _{21}} & \cdots _{2n}} \\\vdots & \vdots & \ddots & \vdots \\{{d}_{n1}} _{n1}} & \cdots _{nn}} \\ \end{matrix} \right] (1)
经典多维尺度变换方法便是利用这些距离数据计算出各个城市在二维空间上的地理分布，即重构出城市的位置坐标 x~\mathbf{\tilde{x}}(原始真实的位置坐标记为 x)，使得第 i 个和第 j 个城市的距离 ∥∥x~i−x~j∥∥≈dij\left\| {{{\mathbf{\tilde{x}}}}_{i}}-{{{\mathbf{\tilde{x}}}}_{j}} \right\|\approx {{d}_{ij}}。这样多维尺度变换问题可以看成一个优化问题，优化的目标函数为

minx~1,⋯,x~n⎛⎝∑i<j(∥∥x~i−x~j∥∥−dij)2⎞⎠1/2(2)

\underset{{{{\mathbf{\tilde{x}}}}_{1}},\cdots ,{{{\mathbf{\tilde{x}}}}_{n}}}{\mathop{\min }}\,{{\left( {{\sum\limits_{i
这里 ∥.∥\left\| . \right\|是向量的范数。在经典多维尺度变换中，该范数是欧氏距离，但广义的讲，这个范数可以是任意函数。

Matlab实现

%原始数据
cities = ...
{'Atl','Chi','Den','Hou','LA','Mia','NYC','SF','Sea','WDC'};
D = [    0  587 1212  701 1936  604  748 2139 2182   543;587    0  920  940 1745 1188  713 1858 1737   597;1212  920    0  879  831 1726 1631  949 1021  1494;701  940  879    0 1374  968 1420 1645 1891  1220;1936 1745  831 1374    0 2339 2451  347  959  2300;604 1188 1726  968 2339    0 1092 2594 2734   923;748  713 1631 1420 2451 1092    0 2571 2408   205;2139 1858  949 1645  347 2594 2571    0  678  2442;2182 1737 1021 1891  959 2734 2408  678    0  2329;543  597 1494 1220 2300  923  205 2442 2329     0];
[Y,eigvals] = cmdscale(D);
%绘图
plot(Y(:,1),Y(:,2),'.')
text(Y(:,1)+25,Y(:,2),cities)
xlabel('Miles')
ylabel('Miles')

　　经典多维尺度变换是基于欧氏距离假设的，所以不能直接应用在一般相似性矩阵情况上(wiki: Multidimensional scaling)。虽然Matlab官方文档中说D矩阵不必要是欧氏距离矩阵(Euclidean distance matrix)，但应用非欧氏矩阵或者更一般的非相似性矩阵（dissimilarity matrix）时，特征值向量eigvals中会出现负值。需要注意的是，当eigvals中负值较大的情况下计算出来的低维几何表示就没有意义了。

　　在前面的问题中，各个城市的坐标信息是未知的。然而即使样本的坐标信息是已知的，但样本若是处于高维空间中，依然需要使用多维尺度变换，将其转化到低维可视化空间上展示。
　　给定n 个q 维(q 值较大)的样本数据：

X=⎡⎣⎢⎢⎢⎢x1x2⋮xn⎤⎦⎥⎥⎥⎥=⎡⎣⎢⎢⎢⎢⎢x11x21⋮xn1x12x21⋮xn1⋯⋯⋱⋯x1qx2q⋮xnq⎤⎦⎥⎥⎥⎥⎥(3)

\mathbf{X}=\left[ \begin{matrix}{{\mathbf{x}}_{1}} \\{{\mathbf{x}}_{2}} \\\vdots \\{{\mathbf{x}}_{n}} \\ \end{matrix} \right]=\left[ \begin{matrix}{{x}_{11}} _{12}} & \cdots _{1q}} \\{{x}_{21}} _{21}} & \cdots _{2q}} \\\vdots & \vdots & \ddots & \vdots \\{{x}_{n1}} _{n1}} & \cdots _{nq}} \\ \end{matrix} \right] (3)
那么， n个样本间的欧氏距离 D可以表示为公式(1)的形式，其中 dij=∥∥xi−xj∥∥=∑k=1q(xik−xjk)2−−−−−−−−−−−−√{{d}_{ij}}=\left\| {{\mathbf{x}}_{i}}-{{\mathbf{x}}_{j}} \right\|=\sqrt{\sum\limits_{k=1}^{q}{{{\left( {{x}_{ik}}-{{x}_{jk}} \right)}^{2}}}}。
　　在经典多维尺度变换问题中，假定矩阵 D是欧氏距离(如城市间的距离)，在计算的过程中，不需要采用数值计算的方法去优化目标函数(2)。可以利用主成分分析的思想，可以简化目标函数，得到准确的解析解。或者说可以根据欧氏距离矩阵准确的重构原坐标的位置矩阵。这是基于一个事实，原坐标矩阵可以由中心化后的内积矩阵进行特征值分解得到(参考 wiki, Multidimensional scaling)。经典解析解的详细推导参考《多元统计分析》 1 何晓群编著P311-314。

经典多维尺度变换解析算法步骤

由距离矩阵D=[dij]∈Rn×n\mathbf{D}=\left[ {{d}_{ij}} \right]\in {{\Re }^{n\times n}}，构造矩阵A=[aij]=[−12d2ij]\mathbf{A}=\left[ {{a}_{ij}} \right]=\left[ -\frac{1}{2}d_{ij}^{2} \right]。
计算内积阵B=[bij]=[aij−a¯i.−a¯.j+a¯..]\mathbf{B}=\left[ {{b}_{ij}} \right]=\left[ {{a}_{ij}}-{{{\bar{a}}}_{i.}}-{{{\bar{a}}}_{.}}_{j}+{{{\bar{a}}}_{..}} \right]。
求B的特征值λ1≥λ2≥⋯≥λn{{\lambda }_{1}}\ge {{\lambda }_{2}}\ge \cdots \ge {{\lambda }_{n}}和特征向量。这里的距离矩阵时欧氏矩阵，所以特征值都为非负，若出现负的特征值，说明矩阵D一定不是欧氏型。令
sk=∑i=1kλi∑i=1n|λi|(4)

{{s}_{k}}=\frac{\sum\limits_{i=1}^{k}{{{\lambda }_{i}}}}{\sum\limits_{i=1}^{n}{\left| {{\lambda }_{i}} \right|}} (4)
其中，s_k 相当于主成分分析中的累计贡献率，当然我们希望k不要取太大，而使累计贡献率比较大。在前面提出的预测城市坐标的是示例中，由于x_i 是二维坐标数据，所以k值取2时，累计贡献率就几乎等于100%。但对于一般的数据来说，可能保留二维数据累计贡献率并不能达到100%。需要根据情况作出判断。
确定一个k值后，重构X~=EkΛ1/2k\mathbf{\tilde{X}}={{\mathbf{E}}_{k}}\mathbf{\Lambda }_{k}^{{1}/{2}\;}, 其中Ek{{\mathbf{E}}_{k}}是矩阵B保留下来的前k个特征向量组成的矩阵，Λk{{\mathbf{\Lambda }}_{k}}是k个特征值组成的对角矩阵。
从上面的推导中可以看出，经典多维尺度变换和主成分分析本质上是一样的，区别在于多维尺度变换是以样本为分析对象，主成分分析是以变量为分析对象。而且可以证明经过经典多维尺度变换后的X~\mathbf{\tilde{X}}的k维主坐标正好是X中心化后的利用主成分分析得到的前k个主成分的值（参考<多元统计分析>何晓群编著P317）。

非经典多维尺度变换(non-classical MDS)

　　当矩阵D不是欧氏距离矩阵，或者只是一般的相似性矩阵时，不满足经典多维度变化假设，此时不存在解析解，需要采用优化算法求解。为了能够直观的衡量重构出的低维空间的几何表示偏离原始数据的程度，目标函数(2)可改为百分比形式的偏离度度量

Stress(x~1,x~2,⋯,x~n)=⎛⎝∑i<j(∥∥x~i−x~j∥∥−dij)2/∑i<jd2ij⎞⎠1/2(5)

Stress({{\mathbf{\tilde{x}}}_{1}},{{\mathbf{\tilde{x}}}_{2}},\cdots ,{{\mathbf{\tilde{x}}}_{n}})={{\left( {{{\sum\limits_{i
除了这种偏离度度量，还有另一种偏离度的度量，记为Squared stress

SStress(x~1,x~2,⋯,x~n)=⎛⎝∑i<j(∥∥x~i−x~j∥∥2−d2ij)2/∑i<jd4ij⎞⎠1/2(6)

SStress({{\mathbf{\tilde{x}}}_{1}},{{\mathbf{\tilde{x}}}_{2}},\cdots ,{{\mathbf{\tilde{x}}}_{n}})={{\left( {{{\sum\limits_{i
关于该目标函数有很多数值优化方法，参考 MDS (multidimensional scaling)多维尺度分析。

Matlab实现

[Y, stress, disparities] = mdscale(D, p, 'criterion', 'metricstress')

　　与经典多维尺度变换cmdscale不同的是，这里需要指定希望的维度和重构的方法。多维尺度变换目的是根据距离矩阵寻找高维样本数据X(q 维)在低维空间中的表示，也就是说多维尺度变换试图找到高维空间Rq{{\Re }^{q}}的一个子空间。所以优化目标函数(5)求解低维空间的坐标之前，需给定子空间的维度p。如果给定p 维子空间中，经过优化后得到的stress依然较大(一般2.5%称为非常好)，需要增加子空间的维度重新进行优化计算，直至得到满意的stress值(更多的最优维度确定方法请参考《实用多元统计分析》2陆璇译 P553)。当偏离度度量选择公式(5)时，重构的方法’criterion’选择’metricstress’，而当偏离度度量选择公式(6)，’criterion’选择’metricsstress’。

非度量型多维尺度变换(non-metric MDS)

　　上面的度量多维尺度变换根据差异(或距离)矩阵创建了一系列点，使得这些点的距离矩阵与原始距离矩阵近似，这个要求有时是比较严格的，因为有些差异是不易量化的。非度量多维尺度变换就是为了放松这一要求。与前面近似距离矩阵不同，非度量多维尺度变换是近似一个非线性但单调的变换，只用距离矩阵D的顺序信息而不用其数值。它只是试图保存差异性的次序。因此，在不同的尺度可能有距离的压缩或展开。
类似于度量型多维尺度变换，非度量型尺度变换也有两种偏离度的度量标准

Stress(x~1,x~2,⋯,x~n)=⎛⎝∑i<j(∥∥x~i−x~j∥∥−d^ij)2/∑i<j∥∥x~i−x~j∥∥2⎞⎠1/2(7)

Stress({{\mathbf{\tilde{x}}}_{1}},{{\mathbf{\tilde{x}}}_{2}},\cdots ,{{\mathbf{\tilde{x}}}_{n}})={{\left( {{{\sum\limits_{i
Squared stress

SStress(x~1,x~2,⋯,x~n)=⎛⎝∑i<j(∥∥x~i−x~j∥∥2−d^2ij)2/∑i<j∥∥x~i−x~j∥∥4⎞⎠1/2(8)

SStress({{\mathbf{\tilde{x}}}_{1}},{{\mathbf{\tilde{x}}}_{2}},\cdots ,{{\mathbf{\tilde{x}}}_{n}})={{\left( {{{\sum\limits_{i

需要注意的是，这里的d^ij{{\hat{d}}_{ij}}与度量型多维尺度变换方法中的dij{{d}_{ij}}是不一样的。在度量型尺度变换方法中，dij{{d}_{ij}}表示距离矩阵D对应的值。而非度量型尺度变换不考虑距离矩阵的元素的值的大小，只关心其排序。将距离矩阵D所有上对角元素按照严格上升的顺序排成一列

di1j1≤di2j2≤⋯≤dimjm, m=n(n−1)/2(9)

{{d}_{{{i}_{1}}{{j}_{1}}}}\le {{d}_{{{i}_{2}}{{j}_{2}}}}\le \cdots \le {{d}_{{{i}_{m}}{{j}_{m}}}},\ m={n\left( n-1 \right)}/{2}\; (9)
这里 di1j1{{d}_{{{i}_{1}}{{j}_{1}}}}是所有样本间距离最小值。 d^ij{{\hat{d}}_{ij}}满足公式(9)，即它们与 dij{{d}_{ij}}有一样的排序的单调关系，其具体值与 dij{{d}_{ij}}无关。因此 d^ij{{\hat{d}}_{ij}}并不是真正的距离，仅仅是用来评价与真实距离 ∥∥x~i−x~j∥∥\left\| {{{\mathbf{\tilde{x}}}}_{i}}-{{{\mathbf{\tilde{x}}}}_{j}} \right\|的非单调性的一些参考值。
　　非度量多维尺度变换的算法确定 x~i{{\mathbf{\tilde{x}}}_{i}}和 d^ij{{\hat{d}}_{ij}}是一个双重优化过程，首先根据预先给定的点寻找最优的单调变换，然后再反过来优化点的位置结构，具体步骤为(参考 wiki: Multidimensional scaling)：

找到一组随机点结构x~i{{\mathbf{\tilde{x}}}_{i}}
计算这些点之间的距离，得到低维空间重构点之间的距离矩阵d~ij{{\tilde{d}}_{ij}}
根据原距离矩阵dij{{d}_{ij}}的顺序，对新重构的距离矩阵d~ij{{\tilde{d}}_{ij}}进行保序回归(isotonic regression)，得到d^ij{{\hat{d}}_{ij}}
将得到d^ij{{\hat{d}}_{ij}}带入公式(7)或者(8)，通过优化计算，找到新的点的位置x~i{{\mathbf{\tilde{x}}}_{i}}
比较stress值是否满足一些指标，如果不满足将回到步骤2

Matlab实现

[Y, stress, disparities] = mdscale(D, p, 'criterion', 'stress')

两种多维尺度变换的比较

　　对于Metric MDS，这个方法以样本间相似度作为实际输入，需要样本是等距（interval）比例（ratio）尺度，优点是精确，可以根据多个准则评估样本间差异，缺点是计算成本高，耗时。对于很多应用问题，样本不费可计量，需要使用NonMetric MDS，这种方法接受样本的顺序尺度作为输入，并以此自动计算相似值。样本尺度要求是顺序的（ordinal），较简便，直观，从非计量的样本导出计量的分析结果，应用范围更广，但没法知道评估准则，效果较差。参考MDS（multidimensional scaling）多维尺度分析

参考资料

《多元统计分析》何晓群编著中国人民大学出版社第三版 ↩
《实用多元统计分析》陆璇译清华大学出版社第六版 ↩

多维尺度变换(multidimensional scaling, MDS)相关推荐

MDS(多维尺度变换)
MDS(多维尺度变换) 多维尺度变换算法解决的问题是:当n个对象之间的相似性给定,确定这些对象在低维空间中的表示,并使其尽可能与原先的相似性大致匹配.高维空间中每一个点代表一个对象,因此点与点之间的距 ...
MDS（多维尺度变换）降维算法
1.目标: 将目标的()维表示特征的向量降为()维,. 2.输入数据: ,其中为()维表示第个目标特征的向量,我们将每一个目标看作维空间中的一个点,那么为空间中第个点的坐标. 3.输出数据: ,其中为 ...
Multidimensional Scaling (MDS)
MDS aims to embed data in a lower dimensional space in such a way that pair-wise distances between d ...
DS之MDS：MDS(Multidimensional Scaling)多维尺度降维算法的简介、使用方法、案例应用之详细攻略
DS之MDS:MDS(Multidimensional Scaling)多维尺度降维算法的简介.使用方法.案例应用之详细攻略目录 MDS的简介 MDS(Multidimensional Scalin ...
SPSS（十四）SPSS之多维尺度分析（图文+数据集）
SPSS(十三)SPSS之多维尺度分析(图文+数据集) 多维尺度分析简介多维尺度(Multidimensional scaling,缩写MDS,又译"多维标度")也称作" ...
Matlab 多维标度,详解多维标度法（MDS，Multidimensional scaling）
流形学习(Manifold Learning)是机器学习中一大类算法的统称,而MDS就是其中非常经典的一种方法.多维标度法(Multidimensional Scaling)是一种在低维空间展示&qu ...
多维尺度分析MDS详解
一概述 MDS的初衷是将图结构中的距离在空间的一种表示.例如,已知几个城市的距离,但是不知道城市的坐标,那么MDS就能通过距离矩阵转换成空间坐标向量来近似描述距离.更重要地是,MDS可以更广泛地应用 ...
jquery多维对象计算个数_多维尺度分析理论概述
在工作中常常会遇到这样的情况,有 n 个由多个指标反映的客体,但是反映客体的指标个数是多少不清楚,甚至指标本身是什么也是模糊的,更谈不上直接测量或观察它,仅仅所能知道的是这 n 个客体之间的某种距离( ...

多维尺度变换(multidimensional scaling, MDS)

度量型多维尺度变换(metric MDS)

经典多维尺度变换(classical MDS)

Matlab实现

经典多维尺度变换解析算法步骤

非经典多维尺度变换(non-classical MDS)

Matlab实现

非度量型多维尺度变换(non-metric MDS)

Matlab实现

两种多维尺度变换的比较

多维尺度变换(multidimensional scaling, MDS)相关推荐

最新文章

热门文章