1.MATLAB drtoolbox介绍

The Matlab Toolbox for Dimensionality Reduction contains Matlab implementations of 38 techniques for dimensionality reduction and metric learning.

官方网站:

This Matlab toolbox implements 32 techniques for dimensionality reduction. These techniques are all available through the COMPUTE_MAPPING function or trhough the GUI. The following techniques are available:

- Principal Component Analysis ('PCA')

- Linear Discriminant Analysis ('LDA')

- Multidimensional scaling ('MDS')

- Probabilistic PCA ('ProbPCA')

- Factor analysis ('FactorAnalysis')

- Sammon mapping ('Sammon')

- Isomap ('Isomap')

- Landmark Isomap ('LandmarkIsomap')

- Locally Linear Embedding ('LLE')

- Laplacian Eigenmaps ('Laplacian')

- Hessian LLE ('HessianLLE')

- Local Tangent Space Alignment ('LTSA')

- Diffusion maps ('DiffusionMaps')

- Kernel PCA ('KernelPCA')

- Generalized Discriminant Analysis ('KernelLDA')

- Stochastic Neighbor Embedding ('SNE')

- Symmetric Stochastic Neighbor Embedding ('SymSNE')

- t-Distributed Stochastic Neighbor Embedding ('tSNE')

- Neighborhood Preserving Embedding ('NPE')

- Linearity Preserving Projection ('LPP')

- Stochastic Proximity Embedding ('SPE')

- Linear Local Tangent Space Alignment ('LLTSA')

- Conformal Eigenmaps ('CCA', implemented as an extension of LLE)

- Maximum Variance Unfolding ('MVU', implemented as an extension of LLE)

- Landmark Maximum Variance Unfolding ('LandmarkMVU')

- Fast Maximum Variance Unfolding ('FastMVU')

- Locally Linear Coordination ('LLC')

- Manifold charting ('ManifoldChart')

- Coordinated Factor Analysis ('CFA')

- Gaussian Process Latent Variable Model ('GPLVM')

- Autoencoders using stack-of-RBMs pretraining ('AutoEncoderRBM')

- Autoencoders using evolutionary optimization ('AutoEncoderEA')

Furthermore, the toolbox contains 6 techniques for intrinsic dimensionality estimation. These techniques are available through the function INTRINSIC_DIM. The following techniques are available:

- Eigenvalue-based estimation ('EigValue')

- Maximum Likelihood Estimator ('MLE')

- Estimator based on correlation dimension ('CorrDim')

- Estimator based on nearest neighbor evaluation ('NearNb')

- Estimator based on packing numbers ('PackingNumbers')

- Estimator based on geodesic minimum spanning tree ('GMST')

In addition to these techniques, the toolbox contains functions for prewhitening of data (the function PREWHITEN), exact and estimate out-of-sample extension (the functions OUT_OF_SAMPLE and OUT_OF_SAMPLE_EST), and a function that generates toy datasets (the function GENERATE_DATA).

The graphical user interface of the toolbox is accessible through the DRGUI function. 2.安装

将下载好的drtoolbox工具包解压到指定目录:D:\MATLAB\R2012b\toolbox

找到'D:\MATLAB\R2012b\toolbox\local\pathdef.m'文件,打开,并把路径添加到该文件中,保存。

运行 rehash toolboxcache 命令,完成工具箱加载

>>rehash toolboxcache

测试

>> what drtoolbox

3.工具箱说明

数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧致的低维表示。

算法基本分类:

线性/非线性

线性降维是指通过降维所得到的低维数据能保持高维数据点之间的线性关系。线性降维方法主要包括PCA、LDA、LPP(LPP其实是Laplacian Eigenmaps的线性表示);非线性降维一类是基于核的,如KPCA,此处暂不讨论;另一类就是通常所说的流形学习:从高维采样数据中恢复出低维流形结构(假设数据是均匀采样于一个高维欧式空间中的低维流形),即找到高维空间中的低维流形,并求出相应的嵌入映射。非线性流形学习方法有:Isomap、LLE、Laplacian Eigenmaps、LTSA、MVU

整体来说,线性方法计算块,复杂度低,但对复杂的数据降维效果较差。

监督/非监督

监督式和非监督式学习的主要区别在于数据样本是否存在类别信息。非监督降维方法的目标是在降维时使得信息的损失最小,如PCA、LPP、Isomap、LLE、Laplacian Eigenmaps、LTSA、MVU;监督式降维方法的目标是最大化类别间的辨别信,如LDA。事实上,对于非监督式降维算法,都有相应的监督式或半监督式方法的研究。

全局/局部

局部方法仅考虑样品集合的局部信息,即数据点与临近点之间的关系。局部方法以LLE为代表,还包括Laplacian Eigenmaps、LPP、LTSA。

全局方法不仅考虑样本几何的局部信息,和考虑样本集合的全局信息,及样本点与非临近点之间的关系。全局算法有PCA、LDA、Isomap、MVU。

由于局部方法并不考虑数据流形上相距较远的样本之间的关系,因此,局部方法无法达到“使在数据流形上相距较远的样本的特征也相距较远”的目的。 4.工具箱使用

工具箱提供给用户使用的接口函数都在与这个Readme文件同路径的目录,主要包括如下文件:

使用实例:

clc

clear

close all

% 产生测试数据

[X, labels] = generate_data('helix', 2000);

figure

scatter3(X(:,1), X(:,2), X(:,3), 5, labels)

title('Original dataset')

drawnow

% 估计本质维数

no_dims = round(intrinsic_dim(X, 'MLE'));

disp(['MLE estimate of intrinsic dimensionality: ' num2str(no_dims)]);

% PCA降维

[mappedX, mapping] = compute_mapping(X, 'PCA', no_dims);

figure

scatter(mappedX(:,1), mappedX(:,2), 5, labels)

title('Result of PCA')

% Laplacian降维

[mappedX, mapping] = compute_mapping(X, 'Laplacian', no_dims, 7);

figure

scatter(mappedX(:,1), mappedX(:,2), 5, labels(mapping.conn_comp))

title('Result of Laplacian Eigenmaps')

drawnow

% Isomap降维

[mappedX, mapping] = compute_mapping(X, 'Isomap', no_dims);

figure

scatter(mappedX(:,1), mappedX(:,2), 5, labels(mapping.conn_comp))

title('Result of Isomap')

drawnow

matlab corrsep,MATLAB数据降维工具箱drtoolbox介绍相关推荐

  1. MATLAB数据降维工具箱drtoolbox

    The Matlab Toolbox for Dimensionality Reduction contains Matlab implementations of 38 techniques for ...

  2. 数据降维工具箱drtoolbox

    drttoolbox : Matlab Toolbox for Dimensionality Reduction是Laurens van der Maaten数据降维的工具箱. 里面囊括了几乎所有的数 ...

  3. matlab 降维工具箱mle,Matlab数据降维工具箱

    [实例简介] Matlab Toolbox for Dimensionality Reduction Matlab数据降维工具箱,包括几乎所有的数据降维方法:PCA.LDA.ICA.MDS.Isoma ...

  4. 核主元分析 KPCA及matlab代码,主要用于数据降维。

    clc clear all close all %% 载入数据 % 注意 数据样本为行 样本属性或者样本参数列!!!!!!!!!!!!!!!!!!!!! % 特征参数维度与样本属性维度一致. tztq ...

  5. lle matlab 实例_数据降维方法LLE算法matlab代码

    LLE算法代码 % LLE ALGORITHM (using K nearest neighbors) % % [Y] = lle(X,K,dmax) % % X = data as D x N ma ...

  6. MATLAB降维工具箱

    降维工具箱drtool 工具箱下载:http://leelab.googlecode.com/svn/trunk/apps/drtoolbox/ --------------------------- ...

  7. 【数据降维】数据降维方法分类

    数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧致的低维表示. 数据降维工具箱drtoolbox中众多算法,这里简单做个分类. 因为很多并没有仔细 ...

  8. 基于MATLAB的多项式数据拟合方法研究-毕业论文

    摘要:本论文先介绍了多项式数据拟合的相关背景,以及对整个课题做了一个完整的认识.接下来对拟合模型,多项式数学原理进行了详细的讲解,通过对文献的阅读以及自己的知识积累对原理有了一个系统的认识.介绍多项式 ...

  9. matlab 数据降维和重构_核主成分分析(Kernel PCA, KPCA)的MATLAB 实现

    前言 核主成分分析 (KPCA) 是一种非线性数据处理方法,其核心思想是通过一个非线性映射把原始空间的数据投影到高维特征空间, 然后在高维特征空间中进行基于主成分分析 (PCA) 的数据处理.KPCA ...

最新文章

  1. mapreduce python实例_MapReduce程序实例(python)
  2. Installshield 2010 中集成. Net framework4 与 vc++ 2010运行安装包
  3. CountDownLatch 源码分析
  4. ios开发 json数据文件的存取
  5. C语言之函数指针和函数的首地址
  6. C++(STL):04---智能指针之weak_ptr
  7. python中协程与函数的区别_python 协程与go协程的区别
  8. Django-ORM数据库操作
  9. LeetCode(682)——棒球比赛(JavaScript)
  10. 【前端 · 面试 】HTTP 总结(一)—— HTTP 概述
  11. Chrome浏览器离线安装包下载 独立安装包下载 方法
  12. Mybatis对象中含有list对象
  13. 需要两张图片合成一个PDF文件(两页)
  14. 解决kindeditor上传图片时发生“服务器发生故障”的问题
  15. Bean 工厂和Application contexts有什么区别?
  16. 编译原理学习基本概念汇总
  17. 备份VMWare ESXi虚拟机
  18. 2020年下半年网络工程师下午真题及答案
  19. 织梦cms是什么-织梦CMS免费搭建工具只需要输入域名
  20. 数字计算机所有的信息是采用什么表示的,第2课在计算机中如何表示信息

热门文章

  1. 美国网红python微博_GitHub - dataabc/weiboPR: 用python判断微博用户的影响力
  2. euraka 分区概念
  3. 来自:www.hoopchina.com 作者:儿童节 《雄心一万丈》
  4. 解决flashfxp连接虚拟机报错 530 permission denied
  5. 计算机配件声卡,什么是声卡?声卡(也叫音频卡)是mpc的必要部件,它是计算机进行 爱问知识人...
  6. 通用方法 windows下安装Git +Gerrit环境以及配置提交日志模板
  7. 如何复制百度文库中的文章,方法你绝对想不到!
  8. 关于mete标签 description、keywords
  9. android 8 音质,体验中国好音质 8款HiFi音质手机推荐
  10. SpringBoot 使用Phoenix操作HBase数据库教程