目录

1)Motivation 1:Data Compression

2)Motivation 2: Data Visualization

3)Principal Component Analysis problem formulation

4)Principal Component Analysis algorithm

5)Advice for applying PCA


1)Motivation 1:Data Compression

无监督学习第二个算法:降维,降维有两个目的:1是数据压缩,2是可视化,数据压缩就是减少特征。工业中我们常常会碰到上万的特征,这是我们就需要压缩数据,找出其中重要的特征。下面是3维压缩为2维的例子:

2)Motivation 2: Data Visualization

能将数据可视化的话对我们处理问题很有帮助,下面是关于几个国家GDP可视化的例子:

3)Principal Component Analysis problem formulation

主成分分析是常见的降维方法。

需要注意的是:主成分分析不是线性回归。

主成分分析是最小化投射误差,线性回归是最小化预测误差。下图左面是线性回归,右边是主成分分析。

4)Principal Component Analysis algorithm

下面介绍PCA算法:

1)均值归一化:

2)计算协方差矩阵:

3)计算协方差矩阵的特征向量;

5)Advice for applying PCA

使用从训练集得来特征向量;

PCA不宜用来防止过拟合;

PCA不是必要的机器学习过程;

机器学习笔记(十三):降维相关推荐

  1. 机器学习笔记之降维(一)维数灾难

    机器学习笔记之降维--维数灾难 引言 回顾:过拟合 维度灾难 从数值角度观察维数灾难 从几何角度观察维度灾难 示例1 示例2 引言 本节将介绍降维算法,并介绍降维算法的相关背景. 回顾:过拟合 我们在 ...

  2. 机器学习笔记之降维(二)样本均值与样本方差的矩阵表示

    机器学习笔记之降维--样本均值与样本方差的矩阵表示 引言 场景介绍 样本均值与样本方差 样本均值与样本方差的矩阵表示 样本均值的矩阵表达 样本方差的矩阵表达 中心矩阵的性质 引言 上一节介绍了维数灾难 ...

  3. 机器学习笔记(十)降维和度量学习

    10.降维和度量学习 10.1k近邻学习 k近邻(k-NearestNeighbor,简称kNN)学习是一种常用的监督学习方法,其原理是:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练 ...

  4. 吴恩达机器学习笔记十三之推荐系统

    本节目录 1 问题形式化 2 基于内容的推荐系统 3 协同过滤 4 向量化:低秩矩阵分解 5 推行工作上的细节:均值归一化 1 问题形式化 对机器学习来说,特征是很重要的,你所选择的特征,将对你学习算 ...

  5. [吴恩达机器学习笔记]14降维3-4PCA算法原理

    14.降维 觉得有用的话,欢迎一起讨论相互学习~Follow Me 14.3主成分分析原理Proncipal Component Analysis Problem Formulation 主成分分析( ...

  6. 机器学习笔记十三:Ensemble思想(上)

    从上面几篇的决策树开始,就可以开始进入到集成学习(ensemble learning)了,与其说集成学习是一种算法,倒不如说集成学习是一种思想. 集成学习的思想也是很自然很符合人类直观理解的. 用通俗 ...

  7. 机器学习笔记之——降维(二)主成分分析(PCA)

    目录 主成分分析(PCA) 1. 坐标投影 2. 最近重构性 3. 最大可分性 4. 求解 主成分分析(PCA) 1. 坐标投影 主成分分析(PCA, Principal Component Anal ...

  8. 机器学习笔记(十三)半监督学习

    13.半监督学习 这章介绍半监督学习方法. 13.1未标记样本 先说两个概念: 1)有标记样本(Labeled) 训练样本集Dl={(x1,y1), (x2,y2),-, (xl,yl)},这l个样本 ...

  9. 机器学习笔记十四:随机森林

    在上一篇机器学习笔记十三:Ensemble思想(上)中,简要的提了一下集成学习的原理和两种主要的集成学习形式.  而在这部分要讲的随机森林,就算是其中属于bagging思路的一种学习方法.为了篇幅,b ...

  10. 李弘毅机器学习笔记:第十三章—CNN

    李弘毅机器学习笔记:第十三章-CNN 为什么用CNN Small region Same Patterns Subsampling CNN架构 Convolution Propetry1 Propet ...

最新文章

  1. torch中tensor的普通索引以及index_select()
  2. jquery validation对隐藏的元素不进行验证
  3. GDCM:DICOM文件转储飞利浦ECHO的测试程序
  4. exsi vmfs 没了_它是“推粪机”,隔三差五吃一盘,口臭没了排出宿便,肠道变干净...
  5. 文件处理_月隐学python第21课
  6. ux和ui_糟糕的UI与UX番茄酱模因
  7. 暑期训练日志----2018.8.25
  8. dj鲜生-07-静态文件的成功加载-用户注册的页面
  9. SIFT特征检测算子和sift = cv2.xfeatures2d.SIFT_create出错的解决办法
  10. Windows 7 测试体验
  11. 基于树莓派的DLNA和Airplay无线音频传输
  12. J2Cache以RabbitMQ作为消息通知配置
  13. plot、plot,semilogx(x,y),semilogy(x,y),loglog(x,y), bar(x):hist(x): fplot
  14. 数据分析之RFM——用户模型分析(附案例数据和代码)
  15. PxCook 点击设计稿即可生成代码前端,高效智能的设计研发工具,智能标注软件。...
  16. 如何锻炼提高自己的逻辑思维?这里给你7个方法!
  17. 关于kali出现乱码问题
  18. ASP.NET通过流方式导出EXCEL并且单元格换行
  19. miui资源全集K60 K50 k40 k30 K20 小米14 小米13 小米12 小米11-小米6
  20. java根据提供word模板导出word文档

热门文章

  1. 计算机应用综合实践实验心得,综合实践活动培训心得体会范文(精选5篇)
  2. python 元组遍历_Python中的for循环:元组、列表、字典的遍历和相互转化
  3. win10切第二屏幕_Win10特有的31个快捷键,装逼利器,赶快收藏吧!学习电脑知识...
  4. html5本地存储论坛,Web Storage--HTML5本地存储
  5. iview 可以选择当天 禁用_人脸识别刚要普及,怎么就被禁用了?|人脸识别|人脸信息|世超|rekognition...
  6. python如何移动图片_python之详细图像仿射变换讲解(图像平移、旋转、缩放、翻转),一文就够了,赶紧码住...
  7. mysql-plus多数据库_Springboot+mybatisplus+mysql配置多数据源(注解版)
  8. mysql数据备份在哪里_mysql之数据备份与恢复
  9. js 多个定时器_JS中的同步/异步编程
  10. java高级mysql面试题_Java高级面试题