1.MATLAB drtoolbox介绍

The Matlab Toolbox for Dimensionality Reduction contains Matlab implementations of 38 techniques for dimensionality reduction and metric learning.

官方网站:

This Matlab toolbox implements 32 techniques for dimensionality reduction. These techniques are all available through the COMPUTE_MAPPING function or trhough the GUI. The following techniques are available:

- Principal Component Analysis ('PCA')

- Linear Discriminant Analysis ('LDA')

- Multidimensional scaling ('MDS')

- Probabilistic PCA ('ProbPCA')

- Factor analysis ('FactorAnalysis')

- Sammon mapping ('Sammon')

- Isomap ('Isomap')

- Landmark Isomap ('LandmarkIsomap')

- Locally Linear Embedding ('LLE')

- Laplacian Eigenmaps ('Laplacian')

- Hessian LLE ('HessianLLE')

- Local Tangent Space Alignment ('LTSA')

- Diffusion maps ('DiffusionMaps')

- Kernel PCA ('KernelPCA')

- Generalized Discriminant Analysis ('KernelLDA')

- Stochastic Neighbor Embedding ('SNE')

- Symmetric Stochastic Neighbor Embedding ('SymSNE')

- t-Distributed Stochastic Neighbor Embedding ('tSNE')

- Neighborhood Preserving Embedding ('NPE')

- Linearity Preserving Projection ('LPP')

- Stochastic Proximity Embedding ('SPE')

- Linear Local Tangent Space Alignment ('LLTSA')

- Conformal Eigenmaps ('CCA', implemented as an extension of LLE)

- Maximum Variance Unfolding ('MVU', implemented as an extension of LLE)

- Landmark Maximum Variance Unfolding ('LandmarkMVU')

- Fast Maximum Variance Unfolding ('FastMVU')

- Locally Linear Coordination ('LLC')

- Manifold charting ('ManifoldChart')

- Coordinated Factor Analysis ('CFA')

- Gaussian Process Latent Variable Model ('GPLVM')

- Autoencoders using stack-of-RBMs pretraining ('AutoEncoderRBM')

- Autoencoders using evolutionary optimization ('AutoEncoderEA')

Furthermore, the toolbox contains 6 techniques for intrinsic dimensionality estimation. These techniques are available through the function INTRINSIC_DIM. The following techniques are available:

- Eigenvalue-based estimation ('EigValue')

- Maximum Likelihood Estimator ('MLE')

- Estimator based on correlation dimension ('CorrDim')

- Estimator based on nearest neighbor evaluation ('NearNb')

- Estimator based on packing numbers ('PackingNumbers')

- Estimator based on geodesic minimum spanning tree ('GMST')

In addition to these techniques, the toolbox contains functions for prewhitening of data (the function PREWHITEN), exact and estimate out-of-sample extension (the functions OUT_OF_SAMPLE and OUT_OF_SAMPLE_EST), and a function that generates toy datasets (the function GENERATE_DATA).

The graphical user interface of the toolbox is accessible through the DRGUI function. 2.安装

将下载好的drtoolbox工具包解压到指定目录:D:\MATLAB\R2012b\toolbox

找到'D:\MATLAB\R2012b\toolbox\local\pathdef.m'文件,打开,并把路径添加到该文件中,保存。

A174644946-81624.jpg

运行 rehash toolboxcache 命令,完成工具箱加载

>>rehash toolboxcache

测试

>> what drtoolbox

A174647259-81625.jpg_small.jpg

3.工具箱说明

数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧致的低维表示。

算法基本分类:

线性/非线性

线性降维是指通过降维所得到的低维数据能保持高维数据点之间的线性关系。线性降维方法主要包括PCA、LDA、LPP(LPP其实是Laplacian Eigenmaps的线性表示);非线性降维一类是基于核的,如KPCA,此处暂不讨论;另一类就是通常所说的流形学习:从高维采样数据中恢复出低维流形结构(假设数据是均匀采样于一个高维欧式空间中的低维流形),即找到高维空间中的低维流形,并求出相应的嵌入映射。非线性流形学习方法有:Isomap、LLE、Laplacian Eigenmaps、LTSA、MVU

整体来说,线性方法计算块,复杂度低,但对复杂的数据降维效果较差。

监督/非监督

监督式和非监督式学习的主要区别在于数据样本是否存在类别信息。非监督降维方法的目标是在降维时使得信息的损失最小,如PCA、LPP、Isomap、LLE、Laplacian Eigenmaps、LTSA、MVU;监督式降维方法的目标是最大化类别间的辨别信,如LDA。事实上,对于非监督式降维算法,都有相应的监督式或半监督式方法的研究。

全局/局部

局部方法仅考虑样品集合的局部信息,即数据点与临近点之间的关系。局部方法以LLE为代表,还包括Laplacian Eigenmaps、LPP、LTSA。

全局方法不仅考虑样本几何的局部信息,和考虑样本集合的全局信息,及样本点与非临近点之间的关系。全局算法有PCA、LDA、Isomap、MVU。

由于局部方法并不考虑数据流形上相距较远的样本之间的关系,因此,局部方法无法达到“使在数据流形上相距较远的样本的特征也相距较远”的目的。 4.工具箱使用

工具箱提供给用户使用的接口函数都在与这个Readme文件同路径的目录,主要包括如下文件:

A174649665-81626.jpg_small.jpg

A174652087-81627.jpg_small.jpg

A174655899-81628.jpg

使用实例:

clc

clear

close all

% 产生测试数据

[X, labels] = generate_data('helix', 2000);

figure

scatter3(X(:,1), X(:,2), X(:,3), 5, labels)

title('Original dataset')

drawnow

% 估计本质维数

no_dims = round(intrinsic_dim(X, 'MLE'));

disp(['MLE estimate of intrinsic dimensionality: ' num2str(no_dims)]);

% PCA降维

[mappedX, mapping] = compute_mapping(X, 'PCA', no_dims);

figure

scatter(mappedX(:,1), mappedX(:,2), 5, labels)

title('Result of PCA')

% Laplacian降维

[mappedX, mapping] = compute_mapping(X, 'Laplacian', no_dims, 7);

figure

scatter(mappedX(:,1), mappedX(:,2), 5, labels(mapping.conn_comp))

title('Result of Laplacian Eigenmaps')

drawnow

% Isomap降维

[mappedX, mapping] = compute_mapping(X, 'Isomap', no_dims);

figure

scatter(mappedX(:,1), mappedX(:,2), 5, labels(mapping.conn_comp))

title('Result of Isomap')

drawnow

matlab drtoolbox 使用,MATLAB数据降维工具箱drtoolbox介绍相关推荐

  1. MATLAB数据降维工具箱drtoolbox

    The Matlab Toolbox for Dimensionality Reduction contains Matlab implementations of 38 techniques for ...

  2. matlab corrsep,MATLAB数据降维工具箱drtoolbox介绍

    1.MATLAB drtoolbox介绍 The Matlab Toolbox for Dimensionality Reduction contains Matlab implementations ...

  3. 数据降维工具箱drtoolbox

    drttoolbox : Matlab Toolbox for Dimensionality Reduction是Laurens van der Maaten数据降维的工具箱. 里面囊括了几乎所有的数 ...

  4. matlab 降维工具箱mle,Matlab数据降维工具箱

    [实例简介] Matlab Toolbox for Dimensionality Reduction Matlab数据降维工具箱,包括几乎所有的数据降维方法:PCA.LDA.ICA.MDS.Isoma ...

  5. MATLAB降维工具箱

    降维工具箱drtool 工具箱下载:http://leelab.googlecode.com/svn/trunk/apps/drtoolbox/ --------------------------- ...

  6. 【数据降维】数据降维方法分类

    数据降维基本原理是将样本点从输入空间通过线性或非线性变换映射到一个低维空间,从而获得一个关于原数据集紧致的低维表示. 数据降维工具箱drtoolbox中众多算法,这里简单做个分类. 因为很多并没有仔细 ...

  7. matlab 数据降维和重构_核主成分分析(Kernel PCA, KPCA)的MATLAB 实现

    前言 核主成分分析 (KPCA) 是一种非线性数据处理方法,其核心思想是通过一个非线性映射把原始空间的数据投影到高维特征空间, 然后在高维特征空间中进行基于主成分分析 (PCA) 的数据处理.KPCA ...

  8. matlab数据拟合工具箱的应用(转载)

    数据拟合工具箱笔记 在matlab中做数据拟合是非常常见的事,而又以多项式拟合最为常用,下面简单介绍一下常见的多项式拟合的方法: 多项式拟合 1. 多项式拟合命令 x=[1 2 3 4 5 6 7 8 ...

  9. matlab 降维工具箱

    Matlab Toolbox for Dimensionality Reduction 降维方法包括: Principal Component Analysis (PCA) • Probabilist ...

  10. matlab lda数据降维,LDA有标签数据降维

    之前无标签数据降维PCA,那么像下图带有标签数据,如果用PCA降维将会投影到v轴上,这个投影方差最大,数据将变成不可分状态,LDA将把数据投影加上已有分类这个变量,将数据投影到u轴上 假设原数据分成n ...

最新文章

  1. 必看,10篇定义计算机视觉未来的论文
  2. csv data set config使用介绍
  3. php umount强制,linux mount挂载与umount 卸载及“Device is busy”问题 | 璞玉(POOY)
  4. jenkins slave在master显示和运行问题
  5. 实验吧---隐写术之男神一般都是很低调的!
  6. Java网页小程序——Java Applet
  7. git 快速入门笔记
  8. scroll-view 横向滑动无效的问题
  9. c语言有语段不运行,各位C语言的高手,帮忙看下下面两段代码!他们不能运行!急!!!!!!...
  10. define定义的是什么类型_为什么Django 3后建议使用Field.choices枚举类型定义choices选项...
  11. ASP.NET MVC5 之 分部页
  12. rds本地库到rds恢复_阿里云rds 备份和还原
  13. win11错误代码0xc1900101怎么解决 windows11错误代码0xc1900101的解决方法
  14. 计算机毕业设计ssm汽车租赁系统42876系统+程序+源码+lw+远程部署
  15. 和Keyle一起学ShaderForge - Overview
  16. Python中的爬虫
  17. c语言关于多边形的所有算法,教你如何在C语言中进行点在多边形内算法
  18. csdner: china_jeffery, C++默认构造函数; csdner: thief thief, 什么情况下C++编译器会生成默认的构造函数
  19. 华为路由器:ospf协议入门介绍
  20. HSB/HSV/HSL区别

热门文章

  1. ass字幕转换成文本文件
  2. 六、配置基于 IP 子网划分 VLAN 示例
  3. 打字慢?双拼了解一下!
  4. python题目练习001--A+B Problem
  5. Windows 下快速删除大量文件的办法
  6. cad2016中选择全图字体怎么操作_CAD2016(精简版)安装教程
  7. 计算机管理规划,2019年计算机软考系统规划与管理师考试大纲
  8. 使用SVG画一个罗盘
  9. 怎么提高文公写作水平?公文写作请示类模板
  10. 问卷设计与统计分析——常用的量表