文章目录

  • 一、分析PCA与LDA的各自特点
    • 1.从求解方法来看
    • 2. 从目标来看
    • 3. 从结果来看
    • 4. 从应用角度来看
  • 二、分析PCA降维的一些优缺点

插眼:

  • 百面机器学习—1.特征工程
  • 百面机器学习—2. 特征工程与模型评估要点总结
  • 百面机器学习—3.逻辑回归与决策树要点总结
  • 百面机器学习—4.SVM模型基础知识
  • 百面机器学习—5.SVM要点总结
  • 百面机器学习—6.PCA与LDA要点总结
  • 百面机器学习—7.K均值算法、EM算法与高斯混合模型要点总结
  • 百面机器学习—8.概率图模型之HMM模型
  • 百面机器学习—9.前馈神经网络面试问题总结
  • 百面机器学习—10.循环神经网络面试问题总结
  • 百面机器学习—11.集成学习(GBDT、XGBoost)面试问题总结
  • 百面机器学习—12.优化算法

一、分析PCA与LDA的各自特点

1.从求解方法来看

PCA求解方法:

LDA求解方法:

从PCA和LDA两种降维方法的求解过程来看,它们确实有着很大的相似性,但对应的原理却有所区别。

2. 从目标来看

  PCA选择的是投影后数据方差最大的方向。由于它是无监督的,因此PCA假设方差越大,信息量越多,用主成分来表示原始数据可以去除冗余的维度,达到降维。而LDA选择的是投影后类内方差小、类间方差大的方向。其用到了类别标签信息,为了找到数据中具有判别性的维度,使得原始数据在这些方向上投影后,不同类别尽可能区分开。

3. 从结果来看

  利用PCA进行降维时,一般情况下保留的是最佳描述特征(主成分)而非分类特征。利用LDA进行降维时,一般能够保留更多的分类特征,使特征具有一定的区分性。

4. 从应用角度来看

  对无监督任务使用PCA进行降维,对有监督的则应用LDA进行降维。降维可以寻找数据内部的特性,从而提高特征表达能力,降低训练复杂度。在sklearn中分别通过下面两个来调用,

from sklearn.decomposition import PCA
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

二、分析PCA降维的一些优缺点

  作为一个非监督学习的降维方法,它只需要特征值分解,就可以对数据进行压缩,去噪,因此在实际场景应用很广泛。为了克服PCA 的一些缺点,出现了很多PCA的变种,比如为解决非线性降维的KPCA,还有解决内存限制的增量PCA方法Incremental PCA,以及解决稀疏数据降维的PCA方法Sparse PCA等。

PCA算法的主要优点有:

  1. 仅仅需要以方差衡量信息量,不受数据集以外的因素影响。
  2. 各主成分之间正交,可消除原始数据成分间的相互影响的因素。
  3. 计算方法简单,主要运算是特征值分解,易于实现。

PCA算法的主要缺点有:

  1. 主成分各个特征维度的含义具有一定的模糊性,不如原始样本特征的解释性强。
  2. 方差小的非主成分也可能含有对样本差异的重要信息,因降维丢弃可能对后续数据处理有影响。

如果对您有帮助,麻烦点赞关注,这真的对我很重要!!!如果需要互关,请评论或者私信!


百面机器学习—6.PCA与LDA要点总结相关推荐

  1. 百面机器学习—7.K均值算法、EM算法与高斯混合模型要点总结

    文章目录 一.总结K均值算法步骤 二.如何合理选择K值? 三.K均值算法的优缺点是什么? 四.如何对K均值算法进行调优? 五.EM算法解决什么问题? 六.EM算法流程是什么? 六.EM算法能保证收敛嘛 ...

  2. 百面机器学习—4.SVM模型基础知识

    文章目录 引言 一.间隔与支持向量 1.什么是线性可分? 2.什么是超平面?什么是最大间隔超平面? 3.什么是支撑向量? 4.SVM最优化问题 二.对偶问题 1.约束条件下的目标函数如何求解最优化问题 ...

  3. “降维算法”面试知识点总结-PCA+LDA算法-百面机器学习系列4

    提示:在准备机器学习算法工程师面试的过程中,我主要参考<百面机器学习>去巩固自己的基础知识.本系列博客将以该书为主题,并以八股文的方式去概述整本书的内容,以尽量减少读者们的阅读作量,并方便 ...

  4. 四大机器学习降维算法:PCA、LDA、LLE、Laplacian Eigenmaps

    四大机器学习降维算法:PCA.LDA.LLE.Laplacian Eigenmaps 引言 机器学习领域中所谓的降维就是指采用某种映射方法,将原高维空间中的数据点映射到低维度的空间中.降维的本质是学习 ...

  5. 百面机器学习!算法工程师面试宝典!

    本文部分内容经授权节选自<百面机器学习> 责编 | 胡巍巍 去年年底到今年年初,整个互联网圈,都笼罩着裁员的阴霾. 以至于很多程序员,都不敢看新闻了. 前段时间,SOHO中国董事长潘石屹, ...

  6. 百面机器学习!算法工程师面试宝典!| 码书

    本文部分内容经授权节选自<百面机器学习> 责编 | 胡巍巍 去年年底到今年年初,整个互联网圈,都笼罩着裁员的阴霾. 以至于很多程序员,都不敢看新闻了. 但是,昨天SOHO中国董事长潘石屹, ...

  7. 个人面试问答题知识库(一)百面机器学习篇

    第二篇(基础模型篇)已更新!        在前段时间的校招应聘经历中,我发现有时候即使面试官问的问题基本都回答上来了,最后还是没有通过面试,这固然跟自己是非科班.没有论文和相关实习经历有关,但自己的 ...

  8. 百面机器学习--机器学习面试问题系列(四)降维

    本文是在学习<百面机器学习 算法工程师带你去面试>过程中的学习笔记,将面试问题进行记录以方便查阅,根据目录分成系列.持续更新中- 目录 1. PCA最大方差理论 2. PCA最小平方误差理 ...

  9. 【机器学习基础】数学推导+纯Python实现机器学习算法27:LDA线性判别分析

    Python机器学习算法实现 Author:louwill Machine Learning Lab 线性判别分析(Linear Discriminant Analysis,LDA)是一种经典的线性分 ...

  10. PCA与LDA算法的解释,浅显易懂

    2019独角兽企业重金招聘Python工程师标准>>> 转自:http://www.cnblogs.com/LeftNotEasy/archive/2011/01/08/lda-an ...

最新文章

  1. 全球最大资管公司押注人工智能!要做这些大事
  2. Web测试介绍2一 安全测试
  3. android H5支付 网络环境未能通过安全验证,请稍后再试
  4. Druid:一个用于大数据实时处理的开源分布式系统——大数据实时查询和分析的高容错、高性能开源分布式系统...
  5. HJ37 统计每个月兔子的总数
  6. html画圆中有个正方形,这样画圆内接正方形,非常简单!
  7. 数据库存在即更新的并发处理 - 转
  8. No buffer space available
  9. ssm使用全注解实现增删改查案例——DeptServiceImpl
  10. 【Microsoft Azure学习之旅】测试消息队列(Service Bus Queue)是否会丢消息
  11. Java+sql server+CallableStatement调用存储过程三种情况 (转)
  12. 从对集合数据去重到Distinct源码分析
  13. 艺术创意灵感地---集设网 | 人体彩绘的张力
  14. python socket接收图像 数据_python中socket接受数据的三种方法 | 学步园
  15. 项目管理与项目组合管理的不同
  16. 载入Haskell的函数
  17. 华硕电脑GeForce类显卡如何解决:NVIDIA安装程序无法继续
  18. 怎样将计算机和电视机连接网络连接,家里怎么连接网络到电视机,让电脑和电视都可以上网...
  19. 商标注册后的注意事项
  20. 应届大学毕业生户口迁移须知

热门文章

  1. XNA 三维入门讲解
  2. Json格式类的转换相关代码--转载
  3. 关于软件测试的5个误传
  4. Windows7下安装redmine-3.4.6
  5. FieldGroup绑定ItemDataSource
  6. ros control
  7. csu 1812: 三角形和矩形 凸包
  8. 前端知识体系及修炼攻略
  9. 【百度地图API】情人节求爱大作战——添加标注功能
  10. Codeforces Round #309 (Div. 1) A(组合数学)