啊作为一个没学过线代的人……当初写eigenface的时候看PCA看了非常之久……
这里尽量简单的描述这个概念
啊全是随手画的图

基本介绍

需要知道的:
矩阵乘法的本质是坐标变换。
主要通过二维到一维的方式来通俗的描述一下PCA。定义什么可以参考维基之类的。
https://zh.wikipedia.org/wiki/%E4%B8%BB%E6%88%90%E5%88%86%E5%88%86%E6%9E%90

看到下面这幅图上有一堆的二维点。

那我们要找一个方式把他转换到一维的。
当然如果考虑非线性就很复杂了……这里就考虑线性的。

提供AB两种降维方式。实心的点是他们降到一维之后的坐标。

或许这个图看起来可以说是A这种降维【我无数次打出来姜维小哥哥】比较合理,直观上来讲

  • 每个点的失真比较小(就空心点到实心点的距离比较小)
  • 最后结果比较分散,也就是说在A这条直线上点的差异性得以保留,而在B这条直线上提取出来的更多是它们的共性。

主成分分析中,这种直观的判断方式,被确定为投影之后方差最大
(后来看资料发现两种定义都有)
而经过求解,这个向量正好对应协方差矩阵最大特征值对应的特征向量。(证明放在最后)

那么来一个直观一点的方式……【这里的一些符号定义和下面证明里一样】
如果求出的两个特征向量分别为【markdown公式啥时候那么丑了……预览不是这样的不是!】

a1=⎡⎣2√22√2⎤⎦a1=[2222]
a2=⎡⎣2√2−2√2⎤⎦a2=[22−22]

那么降到特征空间之后得到的值为

⎡⎣2√22√22√2−2√2⎤⎦[12]=⎡⎣32√2−2√2⎤⎦[222222−22][12]=[322−22]

如果不做什么的话是可以正常还原的……

⎡⎣2√22√22√2−2√2⎤⎦⎡⎣32√2−2√2⎤⎦=[12][222222−22][322−22]=[12]

但是需要降维也就是认为

⎡⎣32√2−2√2⎤⎦[322−22]

可以省去特征根比较小的点。这些点我们认为体现了更多的“共性”而不是“特性”。

这样还原结果如下【0表示这个维度被省去】

⎡⎣2√22√22√2−2√2⎤⎦[32√20]=[3232][222222−22][3220]=[3232]

可以看到有一定的失真……但是也可以认为还保留着基本的一些特征【废话】

其他

Q 如果用非人脸图像降维到人脸空间会怎么样?

A 不会怎么样……就,你重构出来可能还是一个脸……失真比较大
就相当于,你提取的特征都是于脸有关的,虽然输入的不是脸但是他依然会提取其中代表人脸的特征……这样

失真差不多和上图那个Q点一样大(比划)因为A不是由他提取出的特征

Q 简化计算

https://zh.wikipedia.org/wiki/%E7%89%B9%E5%BE%81%E8%84%B8
可以参考一下这个……

直观点理解就是,比如在这个二维空间中只有一个点,那么肯定只需要一个特征向量就可以表示它。

如上图,不管P在什么位置上,肯定可以只用A一个特征向量来表示,它在B上的值肯定是0.因此,我们可以不关心B的这个向量,而只求出A这个向量。
然后这就涉及某些线代的运算了……

Q 其他

我觉得PCA只能保证提取的是一维向量特征的时候,结果是最好的……而不一定能保证提取k维特征的时候最好……主成分分析法的证明过程可以看出,他能保证对于取得的特征根最大的值,一定是方差最大的,而缺少对于提取k维特征是最好的定义。毕竟这样提取的结果也包括方差最小的(特征根最小)。

证明

来自ZJU潘纲老师课件// 后来看到请勿上传外网还是算惹
这个markdown公式长这样毫无重新输一遍的热情……

然后这个链接会全一点 把两种定义都证了
http://www.cnblogs.com/pinard/p/6239403.html




转载于:https://www.cnblogs.com/BirdCage/p/9974015.html

PCA主成分分析 理解相关推荐

  1. 【数学与算法】PCA主成分分析(降维)的通俗理解

    1.PCA降维 PCA主成分分析简单的理解,就是把某物的很多个能直接获取到的特征,经过变换得到很多个新特征,这些新特征对该物体来说,有的影响很大,有的影响很小,只需要使用这些影响大的新特征,舍弃很多影 ...

  2. 通俗解释如何理解主成分分析PCA,Python实现PCA主成分分析2维降到1维

    知道IEEE这个世界最大电子电气学术组织禁止华为资助和中国某些一流大学教授参与审稿这个消息我是愤怒的.我也是无奈的,学校考核必须发论文到这儿,不得不发.IEEE上面的论文中国人几乎占了三成(美国人搞学 ...

  3. pca 主成分分析_超越普通PCA:非线性主成分分析

    pca 主成分分析 TL;DR: PCA cannot handle categorical variables because it makes linear assumptions about t ...

  4. pca 主成分分析_六分钟的主成分分析(PCA)的直观说明。

    pca 主成分分析 Principle Component Analysis (PCA) is arguably a very difficult-to-understand topic for be ...

  5. canoco5主成分分析步骤_R语言 PCA主成分分析

    微信公众号:生信小知识 关注可了解更多的教程及生信知识.问题或建议,请公众号留言; R语言 PCA主成分分析 前言统计学背景知识协方差相关系数函数总结实例讲解1.载入原始数据2.作主成分分析3.结果解 ...

  6. 无监督学习 | PCA 主成分分析之客户分类

    文章目录 1. 开始 2. 数据探索 2.2 特征相关性 2.3 可视化特征分布 3. 数据预处理 3.1 特征缩放 3.2 异常值检测 4. 数据转换 4.1 主成分分析(PCA) 4.2 降维 4 ...

  7. 一文看懂PCA主成分分析

    前言 NGS系列文章包括NGS基础.转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这).ChIP-seq分析 (ChIP-seq基本分析流程).单细胞测序分析 (重磅综述:三万字 ...

  8. 旋转成分矩阵结果分析_30分钟学会PCA主成分分析

    PCA主成分分析算法(Principal Components Analysis)是一种最常用的降维算法.能够以较低的信息损失(以样本间分布方差衡量)减少特征数量. PCA算法可以帮助分析样本中分布差 ...

  9. 三维点云学习(1)上-PCA主成分分析 法向量估计

    三维点云学习(1)上 环境安装 1.系统环境 win10 或者 ubuntu 2. Anaconda3+python3.6 使用Anaconda创建的conda虚拟环境进行python的编写 环境安装 ...

最新文章

  1. python个人博客网站的搭建说明书_个人博客搭建线上实施方案
  2. Visual Studio下包含多项目的解决方案及项目间引用
  3. C++xor cipher异或密码算法(附完整源码)
  4. 关于JWT(Json Web Token)的思考及使用心得
  5. 一键托管,阿里云全链路追踪服务正式商用:成本仅自建1/5或更少
  6. Openshift3.9部署手册
  7. 作者:崔代锐(1985-),男,百度外卖研发中心技术总监。
  8. marquee标签、插入百度地图
  9. 【数字水印】图像数字水印技术-含Matlab Gui界面-含文档【0100期】
  10. ITIL、COBIT、CMMi和ISO 17799管理新一代数据中心的最佳实践介绍
  11. 重构手法46:Parameterize Method (令函数携带参数)
  12. YARN-client提交任务处理过程
  13. Win10 如何把MP4格式视频制作成屏幕保护
  14. 投资学实务-郑商所比赛-交易记录7
  15. 算法导论 — 比较排序算法对比实验
  16. Day11(重写,多态,final,抽象类)
  17. ltspice语言中文_LTspice 一 简介(中文教程)
  18. 急,电脑开机自检过不去,(急在线等),
  19. 促销活动表结果的学习探讨
  20. 抛物样条曲线(最详细简单的解析)

热门文章

  1. 1月27日全国铁路预计发送旅客1047万人次
  2. java 测试带宽_使用Speedtest CLI测试你的网速
  3. html5响应式个人博客模板《初见》
  4. 最直白理解NFC开发的三种工作模式
  5. maven 如何移除无用的依赖
  6. VBA操作Excel代码收集
  7. 众筹,颠覆时代的商业模式?
  8. CentOS7搭建github
  9. 用计算机画图说课稿,教科版小学信息技术《画图中基本工具的使用》说课稿.doc...
  10. 智能厨房重构-使用Bmob后端云实现朋友圈的功能