PCA(Principal Components Analysis)即主成分分析,也称主分量分析或主成分回归分析法,是一种无监督的数据降维方法

首先利用线性变换,将数据变换到一个新的坐标系统中;然后再利用降维的思想,使得任何数据投影的第一大方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上。这种降维的思想首先减少数据集的维数,同时还保持数据集的对方差贡献最大的特征,最终使数据直观呈现在二维坐标系。

sklearn.decomposition.PCA(n_components=None, copy=True, whiten=False)
import matplotlib.pyplot as plt
from mpl_toolkits.mplot3d import Axes3D
from sklearn import datasets
from sklearn.decomposition import PCA# import some data to play with
iris = datasets.load_iris()
X = iris.data[:, :2]  # we only take the first two features.
y = iris.targetx_min, x_max = X[:, 0].min() - .5, X[:, 0].max() + .5
y_min, y_max = X[:, 1].min() - .5, X[:, 1].max() + .5plt.figure(2, figsize=(8, 6))
plt.clf()# Plot the training points
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Set1,edgecolor='k')
plt.xlabel('Sepal length')
plt.ylabel('Sepal width')plt.xlim(x_min, x_max)
plt.ylim(y_min, y_max)
plt.xticks(())
plt.yticks(())# To getter a better understanding of interaction of the dimensions
# plot the first three PCA dimensions
fig = plt.figure(1, figsize=(8, 6))
ax = Axes3D(fig, elev=-150, azim=110)
X_reduced = PCA(n_components=3).fit_transform(iris.data)
ax.scatter(X_reduced[:, 0], X_reduced[:, 1], X_reduced[:, 2], c=y,cmap=plt.cm.Set1, edgecolor='k', s=40)
ax.set_title("First three PCA directions")
ax.set_xlabel("1st eigenvector")
ax.w_xaxis.set_ticklabels([])
ax.set_ylabel("2nd eigenvector")
ax.w_yaxis.set_ticklabels([])
ax.set_zlabel("3rd eigenvector")
ax.w_zaxis.set_ticklabels([])plt.show()

PCA 主成分分析 (sklearn PCA)相关推荐

  1. PCA主成分分析(PCA降维)

    PCA主成分分析 PCA任务介绍 公式推导 算法实现 降维是对数据高维度特征的一种预处理方法. 降维是将高维度的数据保留下最重要的一些特征,去除噪声和不重要的特征,从而实现提升数据处理速度的目的.在实 ...

  2. [学习笔记] [机器学习] 8. 聚类算法(聚类算法:K-means、K-means++;聚类算法评估;特征降维:特征选择(Pearson相关系数、Spearman相关系数)、PCA主成分分析)

    视频链接 数据集下载地址:无需下载 1. 聚类算法简介 学习目标: 掌握聚类算法实现过程 知道 K-means 算法原理 知道聚类算法中的评估模型 说明 K-means 的优缺点 了解聚类中的算法优化 ...

  3. 主成分分析(PCA)原理及R语言实现

    在生物信息分析中,PCA.t-SNE和diffusionMap其实是一类东西. StatQuest: Principal Component Analysis (PCA) clearly explai ...

  4. 主成分分析(PCA)算法,K-L变换 角度

    主成分分析(PCA)是多元统计分析中用来分析数据的一种方法,它是用一种较少数 量的特征对样本进行描述以达到降低特征空间维数的方法,它的本质实际上是K-L变换.PCA方法最著名的应用应该是在人脸识别中特 ...

  5. PCA 与 Robust PCA区别

    之前的一篇博客对PCA的原理.特点进行了介绍以及用python实现了PCA.本篇博客对PCA和Robust PCA进行简单的区别. 1.PCA 主成分分析(PCA)可以有效的找出数据中最重要的元素和结 ...

  6. sklearn 主成分分析法 PCA和IPCA

    主成分分析法 (PCA) 是一种常用的数据分析手段.对于一组不同维度 之间可能存在线性相关关系的数据,PCA 能够把这组数据通过正交变换变 成各个维度之间线性无关的数据.经过 PCA 处理的数据中的各 ...

  7. 数据分析实战:python热门音乐分析 附代码+数据 +论文(PCA 主成分分析,sklearn 机器学习,pytorch 神经网络,k-means 聚类,Librosa 音频处理,midi 音序)

    项目概述: 本选取了抖音当下最热门的 400 首音乐,通过一系列方法提取每首歌的波形特征,再经过降维以及机器学习等手段,进行无监督学习对音乐数据进行聚类的同时训练并使用监督学习分类器进行音乐流派分类, ...

  8. python sklearn PCA 实例-主成分分析

    python sklearn decomposition PCA 主成分分析 主成分分析(PCA) 1.主成分分析(Principal Component Analysis,PCA)是最常用的一种降维 ...

  9. Sklearn——PCA主成分分析

    Sklearn--PCA主成分分析 1.特征降维 2.特征选择和特征降维的区别 3.常用降维算法 4.sklearn中PCA算法函数 1.主成分分析 (PCA) 2.不同主成分个数对应的可解释方差分析 ...

最新文章

  1. EJB3.1 JBoss7.1 Eclipse3.7
  2. Android线程模型和AsyncTask
  3. Oracle 原理: 公有同义词 和 私有同义词
  4. linux C++ 多线程编程
  5. 快速创建 IEqualityComparer 实例:改进
  6. 颜色协调模型Color Harmoniztion
  7. [原]Jenkins(二十) jenkins再出发之Error: Opening Robot Framework log failed
  8. sqlserver 2008express版本启用混合登陆和sa
  9. DeFi保险项目Bumper完成1000万美元私募轮融资
  10. python dbf 修改_在Python中将数据写入dbf时出错
  11. the import XXXX cannot be resolved 解决方法
  12. dataframe 切片_NumPy中的ndarray与Pandas的Series和DataFrame之间的区别与转换
  13. 自学程序员和科班程序员差别到底在哪里?
  14. 贝叶斯估计、最大似然估计、最大后验概率估计
  15. 个人电子邮箱怎么填写?电子邮箱格式怎么写?
  16. 【Android智能硬件开发】【011】安卓串口转USB
  17. 2009NOIP提高组初赛讲解
  18. 1.1 OpenFlow 概述
  19. Android的根证书颁发机构列表
  20. Sigmoid函数的理解

热门文章

  1. Windows强制删除文件夹
  2. 180124 逆向-XMAN结营赛(前方高能)
  3. (转载)经纬度与西安80,北京54的坐标系转换(JAVA实现)
  4. 2022,软件测试行业岗位细分,薪资分布
  5. 薪资17K是一个怎样的水平?来看看98年测试工程师的面试全过程…
  6. php能写入英文不能写入中文,ios,uitextfield_IOS textField怎样设置只能输入英文字母或者数字,不能输入汉字,ios,uitextfield - phpStudy...
  7. mcu芯片是指什么芯片
  8. 前端基础题集合---ing
  9. python迷你停车管理系统_停车管理系统课程设计
  10. win10下MySQL5.7基本操作指南