一、协方差的意义

学过概率统计的孩子都知道,统计里最基本的概念就是样本的均值,方差,或者再加个标准差。首先我们给你一个含有n个样本的集合,依次给出这些概念的公式描述,这些高中学过数学的孩子都应该知道吧,一带而过。

均值:


标准差:


方差:


很显然,均值描述的是样本集合的中间点,它告诉我们的信息是很有限的,

而标准差给我们描述的则是样本集合的各个样本点到均值的距离之平均。以这两个集合为例,[0,8,12,20]和[8,9,11,12],两个集合的均值都是10,但显然两个集合差别是很大的,计算两者的标准差,前者是8.3,后者是1.8,显然后者较为集中,故其标准差小一些,标准差描述的就是这种“散布度”。之所以除以n-1而不是除以n,是因为这样能使我们以较小的样本集更好的逼近总体的标准差,即统计上所谓的“无偏估计”。

而方差则仅仅是标准差的平方。

为什么需要协方差?

上面几个统计量看似已经描述的差不多了,但我们应该注意到,标准差和方差一般是用来描述一维数据的,但现实生活我们常常遇到含有多维数据的数据集,最简单的大家上学时免不了要统计多个学科的考试成绩。面对这样的数据集,我们当然可以按照每一维独立的计算其方差,但是通常我们还想了解更多,比如,一个男孩子的猥琐程度跟他受女孩子欢迎程度是否存在一些联系啊,嘿嘿~协方差就是这样一种用来度量两个随机变量关系的统计量,我们可以仿照方差的定义:

来度量各个维度偏离其均值的程度,标准差可以这么来定义:

协方差的结果有什么意义呢?如果结果为正值,则说明两者是正相关的(从协方差可以引出“相关系数”的定义),也就是说一个人越猥琐就越受女孩子欢迎,嘿嘿,那必须的~结果为负值就说明负相关的,越猥琐女孩子越讨厌,可能吗?如果为0,也是就是统计上说的“相互独立”。

从协方差的定义上我们也可以看出一些显而易见的性质,如:

二、相关系数通俗解释

相关系数的几何解释:如果空间想象能力稍好一些,很容易想想到这里的相关系数是什么意思?不就是两个向量夹角的余弦么,也即 是两个向量X和Y的夹角。这种解释不仅仅限于统计的定义,对于随机变量来说也可以有这样的解释,不过把随机变量看成向量的时候,对应的空间是随机变量在平移不变下的等价类组成的,而在这个空间中标准差是向量的模,而协方差是向量的内积。根据平面上的经验我们知道,两个向量的夹角余弦的绝对值越大表明两个向量越接近共线,这也解释了相关系数的含义:两组数据的相关系数绝对值越大,表明两者的线性关系越明显。

参考:

1.  http://blog.sina.com.cn/s/blog_79c1d4a90100y0n4.html

2.  http://blog.csdn.net/goodshot/article/details/8611178

协方差、相关系数---通俗解释相关推荐

  1. 循环神经网络(RNN)原理通俗解释

    循环神经网络(RNN)原理通俗解释 1.RNN怎么来的? 2.RNN的网络结构及原理 3.RNN的改进1:双向RNN 4.RNN的改进2:深层双向RNN 4.1 Pyramidal RNN 5.RNN ...

  2. Fleury (弗罗莱) 算法通俗解释

    Fleury (弗罗莱) 算法通俗解释 1.定义 2.举例说明 图2为连通图G,现利用Fleury算法求它的欧拉通路.(注意区分:欧拉通路.欧拉回路) 其中一种欧拉通路如下:4 5 8 7 6 8 9 ...

  3. 依赖注入通俗解释_我如何向团队解释依赖注入

    依赖注入通俗解释 最近,我们公司开始开发一个新的基于Java的Web应用程序,经过一些评估过程,我们决定使用Spring. 但是许多团队成员并不了解Spring和Dependency Injectio ...

  4. 关于性能测试的通俗解释

    关于性能测试的通俗解释: http://www.docin.com/p-645879730.html 转载于:https://www.cnblogs.com/preftest/archive/2013 ...

  5. Wasserstein metric的通俗解释

    Wasserstein metric的通俗解释 ​关注他 166 人赞同了该文章 本文收录在无痛的机器学习第二季目录. Wasserstein GAN可以算是GAN界的一大突破了,有关它的介绍和使用心 ...

  6. 1.通俗解释分布式系统

    1.通俗解释分布式系统 分布式–无非就是将一个系统拆分为多个子系统并散布到不同设备的过程而已 本质而言(拆分和连接):实现一个分布式系统,最核心的部分无非就是两点: 如何拆分:可以有很多方式,核心依据 ...

  7. java web中Jdbc访问数据库步骤通俗解释(吃饭),与MVC的通俗解释(做饭)

    一.Jdbc访问数据库步骤通俗解释(吃饭) 1)加载驱动 Class.forName("com.microsoft.jdbc.sqlserver.SQLServer"); 2) 与 ...

  8. 数据库设计的三大范式通俗解释

    一.三大范式通俗解释: (1)简单归纳: 第一范式(1NF):字段不可分: 第二范式(2NF):有主键,非主键字段依赖主键: 第三范式(3NF):非主键字段不能相互依赖. (2)解释: 1NF:原子性 ...

  9. 主成份(PCA)与奇异值分解(SVD)的通俗解释

    主成份(PCA)与奇异值分解(SVD)的通俗解释 1. 问题描述 在许多领域的研究与应用中,往往需要对反映事物的多个变量进行大量观测,收集大量数据以便进行分析,寻找规律.多变量大样本无疑会为研究和应用 ...

最新文章

  1. Flutter学习记录(三、Flutter项目学习navBar的使用)
  2. .Net Core小技巧 - Swagger适配虚拟目录及二级目录
  3. Exception from HRESULT: 0x800A03EC
  4. 解题:ZJOI 2006 书架
  5. java中使用switch case报错case expressions must be constant expres
  6. Python读取nc文件
  7. java中引用数据类型有哪些?
  8. 视频下载工具annie 安装与使用
  9. IDEA复制文件名快捷键设置
  10. 云更新服务器更新不了最新游戏,云更新游戏更新自动/手动更新游戏教程
  11. 【系统】ThrottleStop软件使用教程入门级,游戏+工作两种解决cpu过热方案
  12. scratch实现弹跳小球2
  13. linux文件编程 --- fflush函数
  14. 微信公众号开发功能大全
  15. 运维是不是IT行业里技术含量最低的岗位?
  16. 【hdu 1533】Going Home
  17. stm32——点亮LED
  18. isee 处理图片的好工具
  19. 【JqGrid】JqGrid本页合计+总合计(统计)
  20. 【项目实战】环境搭建

热门文章

  1. 这是一篇能让你升职加薪,赢娶白富美的文章
  2. 分析Linux内核5.0系统调用处理过程
  3. 流量银行与阿里联手放大招 1毛钱换1块钱
  4. SQL Server HA - 数据库镜像2 (Mirroring)(1418错误解决)
  5. PHP的autoload自动加载机制使用说明
  6. Shark集群搭建配置
  7. Win7x64中使用VS调试WEB项目报“ORA-06413: 连接未打开”错误解决方法
  8. PHP中header用法详解带范例(转)
  9. JAVA8 Optional新特性和使用详解
  10. docker logs 容器日志文件路径查看