机器学习笔记(十三):降维
目录
1)Motivation 1:Data Compression
2)Motivation 2: Data Visualization
3)Principal Component Analysis problem formulation
4)Principal Component Analysis algorithm
5)Advice for applying PCA
1)Motivation 1:Data Compression
无监督学习第二个算法:降维,降维有两个目的:1是数据压缩,2是可视化,数据压缩就是减少特征。工业中我们常常会碰到上万的特征,这是我们就需要压缩数据,找出其中重要的特征。下面是3维压缩为2维的例子:
2)Motivation 2: Data Visualization
能将数据可视化的话对我们处理问题很有帮助,下面是关于几个国家GDP可视化的例子:
3)Principal Component Analysis problem formulation
主成分分析是常见的降维方法。
需要注意的是:主成分分析不是线性回归。
主成分分析是最小化投射误差,线性回归是最小化预测误差。下图左面是线性回归,右边是主成分分析。
4)Principal Component Analysis algorithm
下面介绍PCA算法:
1)均值归一化:
2)计算协方差矩阵:
3)计算协方差矩阵的特征向量;
5)Advice for applying PCA
使用从训练集得来特征向量;
PCA不宜用来防止过拟合;
PCA不是必要的机器学习过程;
机器学习笔记(十三):降维相关推荐
- 机器学习笔记之降维(一)维数灾难
机器学习笔记之降维--维数灾难 引言 回顾:过拟合 维度灾难 从数值角度观察维数灾难 从几何角度观察维度灾难 示例1 示例2 引言 本节将介绍降维算法,并介绍降维算法的相关背景. 回顾:过拟合 我们在 ...
- 机器学习笔记之降维(二)样本均值与样本方差的矩阵表示
机器学习笔记之降维--样本均值与样本方差的矩阵表示 引言 场景介绍 样本均值与样本方差 样本均值与样本方差的矩阵表示 样本均值的矩阵表达 样本方差的矩阵表达 中心矩阵的性质 引言 上一节介绍了维数灾难 ...
- 机器学习笔记(十)降维和度量学习
10.降维和度量学习 10.1k近邻学习 k近邻(k-NearestNeighbor,简称kNN)学习是一种常用的监督学习方法,其原理是:给定测试样本,基于某种距离度量找出训练集中与其最靠近的k个训练 ...
- 吴恩达机器学习笔记十三之推荐系统
本节目录 1 问题形式化 2 基于内容的推荐系统 3 协同过滤 4 向量化:低秩矩阵分解 5 推行工作上的细节:均值归一化 1 问题形式化 对机器学习来说,特征是很重要的,你所选择的特征,将对你学习算 ...
- [吴恩达机器学习笔记]14降维3-4PCA算法原理
14.降维 觉得有用的话,欢迎一起讨论相互学习~Follow Me 14.3主成分分析原理Proncipal Component Analysis Problem Formulation 主成分分析( ...
- 机器学习笔记十三:Ensemble思想(上)
从上面几篇的决策树开始,就可以开始进入到集成学习(ensemble learning)了,与其说集成学习是一种算法,倒不如说集成学习是一种思想. 集成学习的思想也是很自然很符合人类直观理解的. 用通俗 ...
- 机器学习笔记之——降维(二)主成分分析(PCA)
目录 主成分分析(PCA) 1. 坐标投影 2. 最近重构性 3. 最大可分性 4. 求解 主成分分析(PCA) 1. 坐标投影 主成分分析(PCA, Principal Component Anal ...
- 机器学习笔记(十三)半监督学习
13.半监督学习 这章介绍半监督学习方法. 13.1未标记样本 先说两个概念: 1)有标记样本(Labeled) 训练样本集Dl={(x1,y1), (x2,y2),-, (xl,yl)},这l个样本 ...
- 机器学习笔记十四:随机森林
在上一篇机器学习笔记十三:Ensemble思想(上)中,简要的提了一下集成学习的原理和两种主要的集成学习形式. 而在这部分要讲的随机森林,就算是其中属于bagging思路的一种学习方法.为了篇幅,b ...
- 李弘毅机器学习笔记:第十三章—CNN
李弘毅机器学习笔记:第十三章-CNN 为什么用CNN Small region Same Patterns Subsampling CNN架构 Convolution Propetry1 Propet ...
最新文章
- torch中tensor的普通索引以及index_select()
- jquery validation对隐藏的元素不进行验证
- GDCM:DICOM文件转储飞利浦ECHO的测试程序
- exsi vmfs 没了_它是“推粪机”,隔三差五吃一盘,口臭没了排出宿便,肠道变干净...
- 文件处理_月隐学python第21课
- ux和ui_糟糕的UI与UX番茄酱模因
- 暑期训练日志----2018.8.25
- dj鲜生-07-静态文件的成功加载-用户注册的页面
- SIFT特征检测算子和sift = cv2.xfeatures2d.SIFT_create出错的解决办法
- Windows 7 测试体验
- 基于树莓派的DLNA和Airplay无线音频传输
- J2Cache以RabbitMQ作为消息通知配置
- plot、plot,semilogx(x,y),semilogy(x,y),loglog(x,y), bar(x):hist(x): fplot
- 数据分析之RFM——用户模型分析(附案例数据和代码)
- PxCook 点击设计稿即可生成代码前端,高效智能的设计研发工具,智能标注软件。...
- 如何锻炼提高自己的逻辑思维?这里给你7个方法!
- 关于kali出现乱码问题
- ASP.NET通过流方式导出EXCEL并且单元格换行
- miui资源全集K60 K50 k40 k30 K20 小米14 小米13 小米12 小米11-小米6
- java根据提供word模板导出word文档
热门文章
- 计算机应用综合实践实验心得,综合实践活动培训心得体会范文(精选5篇)
- python 元组遍历_Python中的for循环:元组、列表、字典的遍历和相互转化
- win10切第二屏幕_Win10特有的31个快捷键,装逼利器,赶快收藏吧!学习电脑知识...
- html5本地存储论坛,Web Storage--HTML5本地存储
- iview 可以选择当天 禁用_人脸识别刚要普及,怎么就被禁用了?|人脸识别|人脸信息|世超|rekognition...
- python如何移动图片_python之详细图像仿射变换讲解(图像平移、旋转、缩放、翻转),一文就够了,赶紧码住...
- mysql-plus多数据库_Springboot+mybatisplus+mysql配置多数据源(注解版)
- mysql数据备份在哪里_mysql之数据备份与恢复
- js 多个定时器_JS中的同步/异步编程
- java高级mysql面试题_Java高级面试题