【数学和算法】协方差矩阵、方差
1.方差
方差是判断一个变量(如,身高)距离平均值的偏离程度的量,如,一个班的50个同学的身高方差。
方差只是一个维度,而协方差是多个维度之间的相关性。
方差的性质:
Var(x)=E(x2)−E2(x)\displaystyle\color{blue}Var(x) = E(x^2) - E^2(x)Var(x)=E(x2)−E2(x)
对于正态分布来说,期望为0,即:
E(x)=0\displaystyle\color{blue}E(x) = 0E(x)=0
那么,正态分布的方差为:
Var(x)=E(x2)\displaystyle\color{blue}Var(x) = E(x^2)Var(x)=E(x2)
-----------------------------------------------------------------------------
2.协方差与协方差矩阵:
协方差矩阵 的理解可以参考这篇博客:https://zhuanlan.zhihu.com/p/70644127
也可以去看B站的视频,讲的很透彻: https://www.bilibili.com/video/BV12D4y1S7fU/
如果要研究几个变量的相关性,如身高、体重、年龄这三个变量的两两之间
的相关性,那么协方差矩阵就是三行三列的矩阵,矩阵的对角线元素是各个变量自己的方差
,非对角线的每个元素是各个变量两两之间的协方差
。
所以,方差只能说所有人的身高的方差,不能说身高与体重之间的方差。而协方差矩阵的对角线上都是各变量的方差。所以,协方差矩阵包含了各个变量的方差。
-----------------------------------------------------------------------------
2.1 协方差:
注意上面的E[(X-Ux)(Y-Uy)]
是对(X-Ux)(Y-Uy)
的整体求期望,并不能分别对(X-Ux)
和(Y-Uy)
求期望,上面公式中(X-Ux)
是行向量,(Y-Uy)
是列向量。看看下面协方差的公式就明白了:
设X、Y分别表示身高和体重,那么上面的Cov(X,Y)
就是所有人的身高与体重
二者的协方差,只是一个数字,并不是协方差矩阵。身高与体重的协方差需要对每个人计算(自己身高 - 所有人身高均值)*(自己体重 - 所有人体重均值)
,然后再把他们相加求均值,得到的均值也叫期望E,就是身高和体重的协方差。
上面的Cov(X,X)
就只是所有人的身高方差,也只是一个数字。
协方差只是两个变量之间的相关性,如,身高与体重的协方差,并不存在身高、体重、年龄三者的协方差。
2.2 协方差矩阵:
为了更清晰明白,我们再增加一个维度,年龄Z,那么三维协方差矩阵
是由
Cov(X,Y)\displaystyle\color{blue}Cov(X,Y)Cov(X,Y)、Cov(Y,X)\displaystyle\color{blue}Cov(Y,X)Cov(Y,X)、Cov(X,Z)\displaystyle\color{blue}Cov(X,Z)Cov(X,Z)、Cov(Z,X)\displaystyle\color{blue}Cov(Z,X)Cov(Z,X)、Cov(Y,Z)\displaystyle\color{blue}Cov(Y,Z)Cov(Y,Z)、Cov(Z,Y)\displaystyle\color{blue}Cov(Z,Y)Cov(Z,Y)
这6个协方差,和Cov(X,X)\displaystyle\color{blue}Cov(X,X)Cov(X,X)、Cov(Y,Y)\displaystyle\color{blue}Cov(Y,Y)Cov(Y,Y)、Cov(Z,Z)\displaystyle\color{blue}Cov(Z,Z)Cov(Z,Z) 这3个方差组成。
很明显,他们有以下关系:
协方差:
Cov(X,Y)=Cov(Y,X)\displaystyle\color{blue}Cov(X,Y) = Cov(Y,X)Cov(X,Y)=Cov(Y,X)
Cov(X,Z)=Cov(Z,X)\displaystyle\color{blue}Cov(X,Z) = Cov(Z,X)Cov(X,Z)=Cov(Z,X)
Cov(Y,Z)=Cov(Z,Y)\displaystyle\color{blue}Cov(Y,Z) = Cov(Z,Y)Cov(Y,Z)=Cov(Z,Y)
方差:
Cov(X,X)=Var(X)\displaystyle\color{blue}Cov(X,X) = Var(X)Cov(X,X)=Var(X)
Cov(Y,Y)=Var(Y)\displaystyle\color{blue}Cov(Y,Y) = Var(Y)Cov(Y,Y)=Var(Y)
Cov(Z,Z)=Var(Z)\displaystyle\color{blue}Cov(Z,Z) = Var(Z)Cov(Z,Z)=Var(Z)
------------------------------------------------------
2.3 协方差矩阵是怎么计算得到的?
可以根据方差
的公式理解记忆协方差
的公式:
那么三维的协方差矩阵P(X,Y,Z)
就是下面这样:
-----------------------------------------------------------------------------
2.4 协方差矩阵推导过程:(可跳过,写的不那么好理解)
设有个三维的列向量W(年龄w1、身高w2、体重w3),
W⃗=[w1w2w3]\displaystyle\color{blue}\vec W = \begin{bmatrix} w1\\ w2\\ w3\end{bmatrix}W=⎣⎡w1w2w3⎦⎤
那么他们的协方差矩阵为:
P=E(W⃗W⃗T)\displaystyle\color{blue}P = E(\vec{W}\vec{W}^T)P=E(WWT)
注意,上面的协方差是对W⃗W⃗T\displaystyle\color{blue}\vec{W}\vec{W}^TWWT求期望
,并非协方差=W⃗W⃗T\displaystyle\color{blue}协方差=\vec{W}\vec{W}^T协方差=WWT。
为了方便书写,我们只取两维(年龄w1、身高w2)来证明:
很多个人,每个人都有各自的身高、体重、年龄属性。n个人抽象成n个点,每个点都有各自的3个维度(3个属性)。
协方差
是协方差
,协方差矩阵
是协方差矩阵
,协方差矩阵
是由协方差
组成。
两个变量之间的协方差
假设有n个人(n个点),下面的
w1
表示(年龄-年龄均值)
w2
表示(身高-身高均值)
w1*w2
表示(年龄-年龄均值)*(身高-身高均值)
,对他们所有人求期望E(w1*w2)
即身高与年龄的协方差。
注意:涉及到求方差和协方差,那必须是很多个人(很多个点),求期望也是对很多个人求期望(均值)。 下面第一个式子不是协方差矩阵,他是一个人的两个属性之间的运算(但是还是不能脱离所有人的均值),对第一个式子求期望,就是对所有的人求均值,之后才是协方差矩阵。
第一个式子不能独立存在,他表示每个人的通项:
想一下,身高的方差=[(学生1的身高-所有人的身高均值)的平方+ (学生2的身高-所有人的身高均值)的平方+ ... + (学生n的身高-所有人的身高均值)的平方] /n
。
由于方差和期望有以下关系:Var(x)=E(x2)−E2(x)\displaystyle\color{blue}Var(x) = E(x^2) - E^2(x)Var(x)=E(x2)−E2(x)
对于正态分布,他的期望E(x)=0\displaystyle\color{blue}E(x) = 0E(x)=0
所以E2(x)=0\displaystyle\color{blue}E^2(x) = 0E2(x)=0
所以方差就等于 Var(x)=E(x2)\displaystyle\color{blue}Var(x) = E(x^2)Var(x)=E(x2)
所以可以得到上面的协方差矩阵。
上面的协方差矩阵的书写方式会造成误解,因为X和Y协方差 并不等于 X的标准差乘以Y的标准差,而且可正可负,在这里是表示二者之间的协方差,并不是二者标准差相乘。这篇博客的最后介绍了相关系数:
【数学和算法】协方差矩阵、方差相关推荐
- 数学建模算法笔记(2)——主成分分析
数学建模算法笔记(2)–主成分分析 目的:主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变异,将我 们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量,实际上是一种降维方法. ...
- 【数学和算法】奇异值分解在【图像压缩】中的应用
图片压缩 这篇博客奇异值的物理意义是什么有例子分析使用奇异值分解来进行图像压缩与图像去噪,并且对于不是方阵的矩阵也可以分解. 下面这个图像压缩例子是以方阵图像为例,使用暴力分解得到特征值和特征向量.但 ...
- 数学建模算法:支持向量机_从零开始的算法:支持向量机
数学建模算法:支持向量机 从零开始的算法 (Algorithms From Scratch) A popular algorithm that is capable of performing lin ...
- 数学建模算法学习笔记
数学建模算法学习笔记 作为建模Man学习数学建模时做的笔记 参考文献: <数学建模姜启源第四版> 网上搜罗来的各种资料,侵删 1.线性预测 levinson durbin算法,自相关什么的 ...
- 数学期望(均值)、方差、协方差、相关系数和矩
文章目录 1 前言 2 数学期望(均值).方差,矩.协方差和相关系数 2.1 数学期望(均值) 2.2 方差 2.3 协方差 2.4 相关系数 2.5 矩 1 前言 随机变量的分布函数完整地描述了随机 ...
- LL1分析构造法_数学建模算法--最优赋权法(含代码)
数学建模算法--最优赋权法(含代码) 作者:郑铿城 本次介绍数学建模和科研写作的方法--最优赋权法最优赋权法经常用于分析评价类问题,从该算法的名称就可以看到,该算法首先要体现"最优" ...
- NLP技术路线详解:这是从数学到算法的艺术
自然语言处理路线图详解,从数学基础.语言基础到模型和算法,这是你该了解的知识领域. 自然语言处理很多时候都是一门综合性的学问,它远远不止机器学习算法.相比图像或语音,文本的变化更加复杂,例如从预处理来 ...
- 【数学与算法】牛顿法 及其一系列改进算法
本文转载自牛顿法,在有些概念不清晰的地方,我添加了一些自己的说明. 牛顿法及其变种方法:目录链接: (1) 牛顿法 (2) 拟牛顿条件 (3) DFP 算法 (4) BFGS 算法 (5) L-BFG ...
- python dendrogram_【聚类分析】《数学建模算法与应用》第十章 多元分析 第一节 聚类分析 python实现...
第十章 多元分析 第一节 聚类分析 介绍 这里是司守奎教授的<数学建模算法与应用>全书案例代码python实现,欢迎加入此项目将其案例代码用python实现 GitHub项目地址:Math ...
- 定义域图像用计算机怎么算,《计算机图像处理的数学和算法基础》.pdf
计算机图像处理的 数学和算法基础 刘 丹 编著 CIP 图书在版编目( )数据 / . - 计算机图像处理的数学和算法基础 刘丹编著 北 2005. 7 : , 京 国防工业出版社 ISBN 7-11 ...
最新文章
- C/C++ 编程规范(01 )— 排版
- 宏基因组公众号7月精选文章目录
- buildroot管理uboot+kernel+rootfs
- java多线程面试_面试之JAVA多线程
- ASP.NET中网站访问量统计方法
- cmi编码用c语言实现,CMI编码与解码
- C++ 易混淆的概念-sizeof和strlen、char* 和char[]、*p++和(*p)++
- 典型排序算法(C语言实现)
- java --微信支付2
- matlab:绘制box函数和高斯函数曲线并进行傅里叶变换
- sklearn 手写体识别
- 制作自己的Cydia发布源
- CryEngine 动态添加模型
- Web 应用程序安全检查表
- DTC品牌如何冷启动?
- js前端判断登录超时即清除登录状态
- Aurora8B10B IP使用 -02- IP功能设计技巧
- 【系统】【winget】从零开始配置一个开发用的 Windows 11 系统的电脑 - winget 代码终端安装软件
- 医院服务器虚拟化平台,医院虚拟化平台项目建设
- C语言:实现勾股定理的运算
热门文章
- 一种集各种优点于一身的技术面试方式--转
- Java 授权内幕--转载
- 【风险管理】风控决策系统
- 【科技金融】风控命门——第三届互联网金融风控大会会后复盘
- 百分点认知智能实验室:NLP模型开发平台在舆情分析中的设计和实践(下)
- uni-app 使用vue的语法+小程序的标签和API。
- 基于 Ubuntu 搭建微信小程序服务
- Facebook最新Libra币开发指南---接口服务器开发2
- Algorithms_二叉树的前序遍历、中序遍历、后续遍历(深度优先)
- 白话Elasticsearch53-深入聚合数据分析之Collect Model_bucket优化机制:深度优先、广度优先