Dimensionality Reduction

--Hands-on Machine Learning with Scikit-Learn and TensorFlow -Chapter 8


Introduction

  1. 降维 pros:有助于加快训练速度;有助于数据可视化。cons:可能会导致重要信息丢失。
  2. Two main approaches to dimensionality:projection and manifold learning
  3. Three popular dimensionality reduction techniques:PCA,Kernel PCA, and LLE

Two main approaches for Dimensionalty Reduction

  1. Projection 在实际问题当中,训练数据通常是非均匀的分布在整个维度里面。有很多特征是连续的,但是有一些特征非常相似。结果这些训练数据在低纬度空间中挨得非常近。
  2. Manifold Learning (流形学习)

PCA(Principal Component Analysis)

  1. pca是迄今为止最流行的降维算法。首先定义一个超平面,然后将数据投影到上面去。
  2. pca降维应当注意点地方: 2.1 preserving the variance
  1. 2.2 the axis minimizes the mean squared distance between the original dataset and projection onto the axis

3. Principal Components:PCA identifies the axis that accounts for the largest amount of variance in the training set.

the unit vector that defines the i(th) axis is called i(th) principal component.

如何找到训练数据的主成分?Singular Value Decomposition(SVD)

PAC默认数据集是以愿数据为中心的。Sklearn 的pca 包已经将数据集中化处理了。而用其他方法构造pca时候,不要忘记首先集中化处理数据。(centering the data)

在降维的时候,一定要尽可能的保证更大的方差。

from sklearn.decomposition import PCApca=PCA(n_components=2)
X2D=pcd.fit_transform(X)pca.explained_variance_ratio_

选择合适的维数

转载于:https://www.cnblogs.com/makino/p/9626871.html

Dimensionality Reduction相关推荐

  1. 文献记录(part17)--VARCLUST: clustering variables using dimensionality reduction

    学习笔记,仅供参考,有错必究 关键词:子空间聚类,降维,主成分分析,贝叶斯信息准则,k-centroids VARCLUST: clustering variables using dimension ...

  2. An Indexable Time Series Dimensionality Reduction Method for Maximum Deviation Reduction and Simi...

    An Indexable Time Series Dimensionality Reduction Method for Maximum Deviation Reduction and Simi... ...

  3. Dimensionality Reduction - Principle Component Analysis problem formulation

    摘要: 本文是吴恩达 (Andrew Ng)老师<机器学习>课程,第十五章<降维>中第117课时<主成分分析问题规划>的视频原文字幕.为本人在视频学习过程中记录下来 ...

  4. sklearn - Dimensionality reduction

    参考: 1.http://scikit-learn.org/stable/ 2.http://scikit-learn.org/stable/modules/decomposition.html#de ...

  5. [论文翻译]A Global Geometric Framework for Nonlinear Dimensionality Reduction

    论文题目:A Global Geometric Framework for Nonlinear Dimensionality Reduction 论文来源:Science 290, 2319 (200 ...

  6. Review of Feature Selection, Dimensionality Reduction and Classification for Chronic Disease Diagnos

    Review of Feature Selection, Dimensionality Reduction and Classification for Chronic Disease Diagnos ...

  7. 【论文阅读】Dimensionality Reduction by Learning an Invariant Mapping

    1.背景 对比学习算是比较早就已经提出了一种技术.其中,早期比较有名的一篇文章就是Lecun等在<Dimensionality Reduction by Learning an Invarian ...

  8. 【论文翻译】:Nonlinear Dimensionality Reduction by Locally Linear Embedding

    [论文题目]:Nonlinear Dimensionality Reduction by Locally Linear Embedding [论文来源]:Nonlinear Dimensionalit ...

  9. 【论文翻译】Nonlinear Dimensionality Reduction by Locally Linear Embedding

    论文题目:Nonlinear Dimensionality Reduction by Locally Linear Embedding 论文来源:http://science.sciencemag.o ...

最新文章

  1. IE下Ajax 提交中文乱码问题
  2. let const 命令
  3. figure文本框乱码 matlab_Matlab给系统自动生成的窗体Figure1改名称
  4. Python编码规范:IF中的多行条件
  5. VeeValidate在vue项目里表单校验应用案例
  6. 【基础】pandas中apply与map的异同
  7. 贡献一个连jquery都觉的大的时候可以用的 js库
  8. 读书笔记_C#入门经典(第5版)第六章_函数
  9. struts2中非表单标签的使用 componen
  10. Vue Bootstrap 静态服务器 实现文件追加上传、断点续传、极速秒传
  11. 前端js嵌套遍历优化_2020web前端最新面试面经:阿里、字节、小红书
  12. Python之split()函数
  13. dict字典,以及字典的一些基本应用
  14. 7. JavaScript RegExp 对象
  15. Altium designer-PCB设计基础笔记
  16. 云南 代理服务器_今日更新快速ip代理服务地址 免费国外代理服务器 2013.4.17
  17. 作业一 统计软件简介与数据操作
  18. 武汉理工大学计算机转专业名单,武汉理工大学转专业的限制
  19. maven问题:org.eclipse.jdt.internal.compiler.classfmt.ClassFormatException
  20. 被误解的鸟枪换炮:实体资产通证化没那么容易

热门文章

  1. Java实现 LeetCode 91 解码方法
  2. ACP敏捷9.敏捷应用场景
  3. 2022第三届全国大学生网络安全精英赛练习题(5)
  4. myeclipse下使用maven搭建SSM(spring、springmvc、mybatis)框架
  5. marathon错误记录
  6. 解读测试能力素质模型
  7. ping回显目标主机不可达destination host unreachable的含义及发生情况
  8. yolov5控制测试视频窗口大小
  9. 手把手教你用 pyecharts 制作日历图
  10. IOT(34 )---联网常见通信协议与通讯协议梳理- 通讯协议