目录

动机一:数据压缩

动机二:数据可视化

主成分分析问题

主成分分析算法

主成分分析的数量(选择k值)

重建的压缩表示(从低维还原回高维)

主成分分析法的应用建议


【此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!】

动机一:数据压缩


这里将谈论第二种类型的无监督学习问题,称为降维。

降维的目的:数据压缩(减少特征)、节省计算资源(内存、磁盘)、加快学习速度。

如将数据从二维降到一维:

将数据从三维降至二维:

这样的处理过程可以被用于把任何维度的数据降到任何想要的维度,例如将 1000 维的特征降至 100 维。

动机二:数据可视化


在许多机器学习问题中,如果能将数据可视化,降维是不错的方法。

如果要将 50 维的数据可视化是不可能的,使用降维的方法将其降至 2 维,我们便可以将其可视化了。

这样做的问题在于,降维算法只负责减少维数,新产生的特征的意义就必须由我们自己去发现了。

主成分分析问题


主成分分析(PCA)是最常见的降维算法。

在 PCA 中,我们要做的是找到一个方向向量( Vector direction),把所有的数据都投射到该向量上时,我们希望投射平均均方误差能尽可能地小。方向向量是一个经过原点的向量,而投射误差是从特征向量向该方向向量作垂线的长度。

主成分分析问题是要将

机器学习-吴恩达-笔记-10-降维相关推荐

  1. 机器学习-吴恩达-笔记-14-应用实例:图片文字识别

    目录 问题描述和流程图 滑动窗口 获取大量数据和人工数据 上限分析:哪部分管道得接下去做 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 问题描述和流程图 图像文字识别应用,是从一张给 ...

  2. 机器学习-吴恩达-笔记-13-大规模机器学习

    目录 大型数据集的学习 批量梯度下降 随机梯度下降 小批量梯度下降 随机梯度下降收敛 在线学习 映射化简和数据并行 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 大型数据集的学习 如 ...

  3. 机器学习-吴恩达-笔记-15-总结

    [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 机器学习是一门对科技.工业产生深远影响的重要学科. 机器学习的理论知识:微积分.线性代数.统计学.信息论等. 机器学习的实践框架:PyT ...

  4. 机器学习-吴恩达-笔记-12-推荐系统

    目录 问题形式化 基于内容的推荐系统 协同过滤 向量化:低秩矩阵分解 推行工作上的细节:均值归一化 基于相似内容推荐和基于相似用户推荐(个人扩展) [此为本人学习吴恩达的机器学习课程的笔记记录,有错误 ...

  5. 机器学习-吴恩达-笔记-11-异常检测

    目录 问题的动机 高斯分布 算法 开发和评价一个异常检测系统 异常检测与监督学习对比 选择特征 多元高斯分布 使用多元高斯分布进行异常检测 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出! ...

  6. 机器学习-吴恩达-笔记-9-聚类

    目录 无监督学习:简介 K-均值算法(K-Means) 优化目标 随机初始化 选择聚类数 相似度/距离计算方法 聚类的衡量指标 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 无监督学 ...

  7. 机器学习-吴恩达-笔记-8-支持向量机

    目录 优化目标 大边界的直观理解 大边界分类背后的数学 核函数-1 核函数-2 使用支持向量机 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 优化目标 为了描述支持向量机,我们将会从 ...

  8. 机器学习-吴恩达-笔记-7-机器学习系统的设计

    目录 误差分析 类偏斜的误差度量 查准率和查全率之间的权衡 机器学习的数据 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 误差分析 在本次课程中,我们将会讲到误差分析( Error ...

  9. 机器学习-吴恩达-笔记-6-应用机器学习的建议

    目录 评估一个假设(假设函数) 模型选择和交叉验证集 诊断偏差和方差 正则化和偏差/方差 学习曲线 决定下一步做什么 [此为本人学习吴恩达的机器学习课程的笔记记录,有错误请指出!] 当我们运用训练好了 ...

最新文章

  1. 《嵌入式linux应用程序开发标准教程》笔记——7.进程控制开发
  2. 家乡的楼房正在往高层发展
  3. 【CodeForces - 227C】Flying Saucer Segments (思维)
  4. 前端动态获取servlet虚拟路径_Day40_Servletamp;HTTPamp;Request
  5. js学习(node.js环境)
  6. 战“疫”日记②|火神山小分队:像听到发令枪一样;徐碧江带勇士集结长沙“小汤山”...
  7. windows server下安装SSHD服务
  8. stm32 整数加法循环时间_剑指 Offer 65. 不用加减乘除做加法 leetcode 剑指offer系列...
  9. GaussView 6 linux 64
  10. vue引入图片url变量
  11. HTML5前端设计——课表制作
  12. win10有效清理c盘空间: 移动pagefile.sys和删除hiberfil.sys文件
  13. chrome清楚缓存并硬性重新加载
  14. 软件的接口设计图_面向服务架构(SOA)的汽车软件分析和设计
  15. electron-builder打包过程中报错——网络下载篇
  16. STL map的几种赋值方式
  17. Android FileProvider配置和当引用包内已经含有FileProvider的多节点解决办法
  18. 树莓派PCA9685的舵机MG996R二度自由云台操控代码,搭配mqtt进行远程操控
  19. MySQL 数据库去重处理(小白)
  20. 什么是超线程,开启超线程有什么作用

热门文章

  1. 【软件分析与挖掘】An Empirical Study of Bugs in Build Process
  2. 用php向MySQL的datetime类型插入数据
  3. Oracle数据安全解决方案(1)——透明数据加密TDE
  4. PHP 实现定时任务的几种方法
  5. HDU——1272小希的迷宫(并查集+拓扑排序)
  6. [Flex] ButtonBar系列——labelFunction用户提供的函数,在每个项目上运行以确定其标签...
  7. group by 多个字段
  8. Unity Application Block 1.0系列文章
  9. INSTALLSHIELD11.5中打包水晶报表的问题,ScriptProject与ScriiptMSIProject差异引起的错误!...
  10. 如何解决testng执行用例失败自动重跑问题