奇异值分解

奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,它不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域。是很多机器学习算法的基石。本文就对SVD的原理做一个总结,并讨论在在PCA降维算法中是如何运用运用SVD的。

1. 回顾特征值和特征向量

2. SVD的定义



3. SVD计算举例


4. SVD的一些性质

5. SVD用于PCA

SVD小结

SVD作为一个很基本的算法,在很多机器学习算法中都有它的身影,特别是在现在的大数据时代,由于SVD可以实现并行化,因此更是大展身手。SVD的原理不难,只要有基本的线性代数知识就可以理解,实现也很简单因此值得仔细的研究。当然,SVD的缺点是分解出的矩阵解释性往往不强,有点黑盒子的味道,不过这不影响它的使用。

数据的中心化和标准化

简介:
意义:数据中心化和标准化在回归分析中是取消由于量纲不同、自身变异或者数值相差较大所引起的误差。
原理:数据标准化:是指数值减去均值,再除以标准差;
数据中心化:是指变量减去它的均值。
目的:通过中心化和标准化处理,得到均值为0,标准差为1的服从标准正态分布的数据。

在回归问题和一些机器学习算法中,以及训练神经网络的过程中,还有PCA等通常需要对原始数据进行中心化(Zero-centered或者Mean-subtraction)处理和标准化(Standardization或Normalization)处理。

目的:通过中心化和标准化处理,得到均值为0,标准差为1的服从标准正态分布的数据。计算过程由下式表示:
原因:在一些实际问题中,我们得到的样本数据都是多个维度的,即一个样本是用多个特征来表征的。很显然,这些特征的量纲和数值得量级都是不一样的,而通过标准化处理,可以使得不同的特征具有相同的尺度(Scale)。这样,在学习参数的时候,不同特征对参数的影响程度就一样了。简言之,当原始数据不同维度上的特征的尺度(单位)不一致时,需要标准化步骤对数据进行预处理。
下图是二维的示例:

左图表示的是原始数据
中间的是中心化后的数据,可以看出就是一个平移的过程,平移后中心点是(0,0)。同时中心化后的数据对向量也容易描述,因为是以原点为基准的。
右图将中心化后的数据除以标准差,得到为标准化的数据,可以看出每个维度上的尺度是一致的(红色线段的长度表示尺度),而没有处理之前的数据是不同的尺度标准。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。
————————————————
本文部分为CSDN博主「lilong117194」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/lilong117194/article/details/78561013

(本文部分转载,转载请注明出处。欢迎沟通交流: liujianping-ok@163.com)

奇异值分解(SVD)原理与在降维中的应用相关推荐

  1. 二次型、特征值/向量、奇异值、特征值、奇异值分解、奇异值分解(SVD)原理与在降维中的应用

    一.二次型 通过矩阵来研究二次函数(方程),这就是线性代数中二次型的重点. 1 二次函数(方程)的特点 1.1 二次函数 最简单的一元二次函数就是: 给它增加一次项不会改变形状: 增加常数项就更不用说 ...

  2. 【机器学习】这次终于彻底理解了奇异值分解(SVD)原理及应用

    奇异值分解(Singular Value Decomposition,以下简称SVD)是在机器学习领域广泛应用的算法,有相当多的应用与奇异值都可以扯上关系,它不光可以用于降维算法中的特征分解,比如做f ...

  3. 奇异值分解(SVD)原理详解

    奇异值分解(SVD)原理详解 一.奇异值与特征值基础知识: 特征值分解和奇异值分解在机器学习领域都是属于满地可见的方法.两者有着很紧密的关系,我在接下来会谈到,特征值分解和奇异值分解的目的都是一样,就 ...

  4. 奇异值分解(SVD)原理详解及推导 (转)

    很不错的文章,适合入门. 转载出处http://blog.csdn.net/zhongkejingwang/article/details/43053513 在网上看到有很多文章介绍SVD的,讲的也都 ...

  5. 奇异值分解(SVD)原理详解及推导(转载)

    转载自:http://blog.csdn.net/zhongkejingwang/article/details/43053513 在网上看到有很多文章介绍SVD的,讲的也都不错,但是感觉还是有需要补 ...

  6. 奇异值分解(SVD)原理详解及推导

    转载于:http://blog.csdn.net/zhongkejingwang/article/details/43053513 在网上看到有很多文章介绍SVD的,讲的也都不错,但是感觉还是有需要补 ...

  7. 奇异值分解 (SVD)原理及python实现

    奇异值分解(Singular Value Decomposition,SVD)是一种矩阵分解(Matrix Decomposition)的方法.除此之外,矩阵分解还有很多方法,例如特征分解(Eigen ...

  8. 矩阵分解之特征值分解(EVD)、奇异值分解(SVD)、SVD++

    矩阵分解之: 特征值分解(EVD).奇异值分解(SVD).SVD++_人鱼线的博客-CSDN博客_evd分解 矩阵的特征分解和奇异值(SVD)分解--求法和意义_奔跑的Yancy的博客-CSDN博客_ ...

  9. 机器学习-降维之奇异值分解SVD算法原理及实战

    奇异值分解 简介 PCA是通过特征值分解来进行特征提取的,但它要求矩阵必须是方阵,但在实际应用场景中,经常遇到的矩阵都不是方阵,如N个学生,每个学生有M门课程,其中N!=M, 这就组成了一个M*N的非 ...

最新文章

  1. MySQL 高频面试题,都在这了
  2. 聚类之K-means均值聚类
  3. rman datafile恢复(归档模式)
  4. 进程间通信(4) 匿名管道
  5. Python中json模块的使用,以及json.loads()和json.dumps()的区别
  6. [转载] mac开发者,你不得不知道的环境变更设置方法(如Java的环境变更 source命令 )
  7. 水文特点是什么意思_自动气象站应建在什么地方?
  8. CGCS2000 VS WGS84
  9. C#基础知识梳理系列七:字符串
  10. ansa导入catia模型_CATIA模型导入ADAMS的经验
  11. P0 口输出级具有能带 8个 LSTTL 门负载能力(指每个端口线例如P0.0P0.1每条位线,而不是整个P0口反证P2地址高8位,如果只能带4个怎么用)这个是门电路的扇出系数也就扇出带门负载能力
  12. c# 中通快递对接_C# .net实现中通快递单号查询 快递鸟API接口
  13. 腾讯技术跨越2019
  14. 隆云通聚碳翻斗式雨量传感器
  15. 绿纹龙的森林游记——UPC
  16. 睡不着觉--安卓计数器给我数绵羊
  17. ZZULIOJ:1008美元和人民币
  18. 如何解决国产TongWeb中间件启动之后无法访问网站管理后台界面
  19. web项目获取webpp文件下的图片
  20. 渣土车识别检测系统-yolov5

热门文章

  1. 使用Maven和WebLogic 12c开发Java EE应用程序
  2. 将亚型多态性与通用多态性相关联的危险
  3. EasyCriteria 2.0 – JPA标准应该很容易
  4. Java EE CDI ConversationScoped示例
  5. 使用Java快速入门的Apache Thrift
  6. MySQL数据库的用户授权_查看权限
  7. vim 的寄存器/剪贴板
  8. Linux 命令之 ifconfig -- 配置和显示网卡的网络参数
  9. 3l如何使用_慢阻肺患者如何选购呼吸机和制氧机,需要注意哪些?
  10. 输入一个正整数求所有素数因子_一起来聊聊素数的两个性质