协方差矩阵的实例与意义

在机器学习中经常需要计算协方差矩阵,本科时没学过这个概念,一直对此非常头疼。现在试图通过实例的计算、图形化的表示来梳理一下什么是协方差矩阵。

A numerical example

问题:

有一组数据(如下),分别为二维向量,这四个数据对应的协方差矩阵是多少?

解答:

由于数据是二维的,所以协方差矩阵是一个2*2的矩阵,矩阵的每个元素为:

元素(i,j) = (第 i 维所有元素 - 第 i 维的均值) * (第 j 维所有元素 - 第 j 维的均值) 。

其中「*」代表向量内积符号,即两个向量求内积,对应元素相乘之后再累加。

我们首先列出第一维:

D1: (1,3,4,5) 均值:3.25
D2: (2,6,2,2) 均值:3

下面计算协方差矩阵第(1,2)个元素:

元素(1,2)=(1-3.25,3-3.25,4-3.25,5-3.25)*(2-3,6-3,2-3,2-3)=-1

类似的,我们可以把2*2个元素都计算出来:

这个题目的最终结果就是:

An explanation

我们来分析一下上面的例子。首先看一下元素(1,1)的计算过程:

把所有数据的第一个维度拿出来,求出均值,之后的求解过程完全是我们熟悉的「方差」的求法。也就是说,这完完全全就是在求所有数据第一维元素(共4个)的方差(8.75)嘛。类似地,元素(2,2)求的是第二维(共4个)元素的方差(12)。

再来看元素(1,2),这分明就是我们高数里面学的求 x 和 y 的协方差,不再单独计算某一维度的分散程度,而是把两个维度的分散值结合起来,这里才真正体现了「协方差矩阵」中「协方差」的意味。从计算过程和计算结果都能看出,元素(2,1)与元素(1,2)是一样的。也就是说,所有协方差矩阵都是一个对称阵。

总结一下协方差矩阵的特点:

  • 对角线元素(i,i)为数据第 i 维的方差。
  • 非对角线元素(i,j)为第 i 维和第 j 维的协方差。
  • 协方差矩阵是对称阵。

现在只需要了解这些就够了。

A vivid reprensatation

这里借鉴一下模式识别课件中的五个图来形象地展示一下不同的协方差矩阵代表了什么。这几个都是二维的高斯分布(正态分布),每个例子中有三个分布,分别给出了均值和协方差矩阵。均值代表正态分布的中心点,方差代表其分布的形状(黑色的分割线请 ignore)。请欣赏:

1.三个协方差矩阵相同,都为对角阵,对角线元素相同

2.三个协方差矩阵相同,都为对角阵,对角线元素不同

3.三个协方差矩阵相同,不是对角阵,对角线元素不同

4.三个协方差矩阵不同,都是对角阵,对角线元素相同

5.三个协方差矩阵不同,不是对角阵,对角线元素不同

从这五个图可以看出:

  • 均值为分布的中心点位置。
  • 对角线元素决定了分布图形是圆还是扁。
  • 非对角线元素决定了分布图形的轴向(扁的方向)。

参考:http://blog.csdn.net/ybdesire/article/details/6270328

协方差矩阵的实例与意义相关推荐

  1. java编写计算协方差矩阵_协方差矩阵的实例与意义

    在机器学习中经常需要计算协方差矩阵,本科时没学过这个概念,一直对此非常头疼.现在试图通过实例的计算.图形化的表示来梳理一下什么是协方差矩阵. ###A numerical example 问题: 有一 ...

  2. C++:实现量化covariance协方差矩阵测试实例

    C++:实现量化covariance协方差矩阵测试实例 #include "covariance.hpp" #include "utilities.hpp" # ...

  3. 协方差矩阵的计算及意义

    声明:博文转自https://blog.csdn.net/mr_hhh/article/details/78490576 一.首先看一个比较简洁明了的协方差计算介绍: 1. 协方差定义 X.Y 是两个 ...

  4. 方差、协方差、协方差矩阵的概念及意义 的理解

    书到用时方恨少,不仅文科是这样,理科更是这样. 想想大学时候,我们学习数学的目的也就是为了考试,从来没有想过它们能解决什么实际问题.但是现在想想,我们真是错了.数学其实就是来自生活. 话题一转,如果是 ...

  5. 关于协方差矩阵的概念及意义

    在做幻觉脸时用PCA,好不容易搞明白了原理,却发现溜掉了为什么计算协方差矩阵前要去均值(其实很简单,不要笑我脑残哈),和同学讨论啊讨论啊,讨论结果只是证明了我们把曾经学过的概率之类的忘的不胜什么了,所 ...

  6. 关于方差、协方差、协方差矩阵的概念及意义

    期望 离散型随机变量的一切可能的取值xi与对应的概率Pi(=xi)之积的和称为该离散型随机变量的数学期望(设级数绝对收敛),记为 E(x).随机变量最基本的数学特征之一.它反映随机变量平均取值的大小, ...

  7. 马氏距离由浅入深的理解

    1. 简单理解协方差的物理意义 2. 协方差矩阵中的元素对分布的影响 3. 对马氏距离的理解 1. 简单理解协方差的物理意义 在概率论中,两个随机变量 X 与 Y 之间相互关系,大致有下列3种情况: ...

  8. 协方差、协方差矩阵的解释意义

    此文章转载自别人的博客,可是他的博客关闭了,缅怀一下吧: 统计里最基本的概念就是样本的均值,方差,或者再加个标准差.首先我们给你一个含有n个样本的集合 依次给出这些概念的公式描述,这些高中学过数学的孩 ...

  9. 协方差的意义和解释(目前为止我看到的最为通俗易懂的文章)

    十分感谢原作者的贡献,讲解通俗易懂,感觉有必要让更多人学习到,故转载了这篇博客,附上原文地址 http://blog.sina.com.cn/s/blog_672c5a470100miqq.html ...

最新文章

  1. 全城瘫痪!因韩国电信公司大火 首尔陷断网危机
  2. Fiddler之如何通过浏览器输入链接地址修改页面返回数据的内容
  3. 三子棋の胜负判断(洛谷P1838题题解,Java语言描述)
  4. 索引-css-第二版-pyhui
  5. android 抽屉侧滑冲突,利用DrawerLayout和触摸事件分发实现抽屉侧滑效果
  6. IOS开发 ios7适配
  7. centos下安装php-fpm,centos下怎么安装php-fpm
  8. 软件开发流程都是什么样的呢?
  9. 数学建模day1 层次分析法与TOPSIS方法
  10. 印度网民集体删除中国APP,网友评论亮了
  11. 2016年11月份各省市报考时间与报名链接 软考 系统集成项目管理工程师
  12. matlab里comb用法,comb_comb的意思和用法搭配
  13. 常用的正则表达式,复制粘贴,正则就这么简单
  14. 「游戏建模」3DMAX渲染慢的解决小技巧
  15. 计算机三级网络技术——综合题一IP地址计算等
  16. 用Windows电脑看epub小说,哪些阅读器软件更好用?
  17. 游戏编辑器制作(3)
  18. 高德地图交通态势爬取并存入MySQL数据库
  19. JSP实用教程——第二章JSP语法
  20. canal同步mysql数据到rocketmq集群

热门文章

  1. android 使用perl语言,在Android上用python(Perl、Lua、BeanShell等)编程
  2. c语言哈希表电子辞典_关于redis涉及的知识点,C语言如何操作redis
  3. 怀旧服湖畔镇服务器位置,《魔兽世界怀旧服》今天再开10组新服 47组服务器免费转服开启...
  4. unity 代码边缘发光_Shader案例之内发光和边缘泛光效果
  5. java连连看源代码在哪_连连看java源代码
  6. 基于python爬虫的岗位数据分析以拉勾网为例_Python拉勾爬虫——以深圳地区数据分析师为例...
  7. html插入不规则表格,如何构建HTML表格中的不规则形状?
  8. xp 远程计算机需要远程验证登陆,xp远程桌面登陆需要身份验证问题解决
  9. mysql 手工注入教程_mysql手工注入步骤
  10. java上传图片报404_ssm框架上传图片成功后跳转jsp页面显示却404访问不到图片