除了数学期望外,方差、均方差、协方差也是重要的数字特征。

方差

  方差的代数意义很简单,两个数的方差就是两个数差值的平方,作为衡量实际问题的数字特征,方差有代表了问题的波动性。

方差的意义

  甲、乙二人是射击队最优秀的两名选手,教练组用每一枪的得分作为成绩,根据历史数据计算出二人的平均成绩,也就是数学期望,结果是二人的实力相当,平均成绩都是9.5。比赛的日子快要到了,但是本次比赛只有一个名额,派谁出战呢?

  一个简单的方法是让二人比赛一次,谁赢了选谁。但是二者实力相当,一场比赛无法评判孰强孰弱,这样做充满了随机性,丧失了考量的综合性,因此教练组不考虑这种方法。

  本次比赛夺金的政治意义重大,需要慎重考虑,稳定性成了教练组判断的另一指标。成绩稳定性是通过另一个数字特征判断的,这个特数字特征就是方差。

  下表示甲、乙二人在一次比赛中的成绩:

  甲是发挥型选手,成绩波动较大,可以打出“超级环”,也会打出大失水准的“低级环”;相反,乙的发挥比较稳定,总是与平均成绩接近。

  二者的平均成绩是已经提前计算出来的9.5,这个成绩已经与随机性无关,我们在这里也不去追究9.5是怎么算出来的,只需要借助这个数字特征给出一个供教练组参考指标,该指标描述了谁的波动大,谁更稳定。

  每一次射击的成绩均会产生波动,用每一次射击的得分减去平均成绩表示本次波动,得到了下面的数据:

  把每次波动累加起来就是整体的波动。由于有正有负,如果直接相加的话会正负抵消,最后二人的波动都是-0.1,得出二人同样稳定的结论,这显然是荒谬的。解决这个问题的一个方法是每次波动都取绝对值,另一个方法是取波动的平方,平方不用考虑符号的问题,因此比绝对值更简单。现在用(X-E(X))2表示波动,得到了下面的数据:

  现在可以计算出二人的总体波动了:

  可以看出,乙的波动远远小于甲的波动,说明乙的稳定性更高。

  至于具体选择谁出赛,从不同的方面考虑会得出不同的答案,我们的在这里仅仅是将方差作为一个指标给教练组参考。数学本身描述了问题的客观规律,但如何利用客观规律评判是人的事情。

方差与数学期望的关系

  在计算方差时,数学期望是必须的,用D(X)表示某个随机变量的方差:

  我们注意到E(X)已经是一个具体的数字,是加权平均值,已经事先通过计算去掉了随机性(比如选手的平均成绩,这是一个稳定的概念,不会因为输掉某场比赛就认为这名选手不行了);X是某个特定的随机变量,也是一个具体的数值,D(X)仅仅是将x=X放置在了一个函数里,最终也可以对得出定值。根据数学期望的特征,常数的数学期望仍是常数,因此:

  因此我们说,某一个随机变量的方差就是该随机变量函数的数学期望。我们可以利用数学期望的性质继续向下计算:

  所以说某一个变量的方差等于平方的期望减去期望的平方:

  虽然D(X)代表某个特定随机变量的方差,E(D(X)) = D(X),但E(X2) ≠X2,E(X2)表示的是随机变量函数g(X)=( X2)的数学期望。

  我们可以借助数学期望的计算公式计算随机变量的整体方差(参考上一章内容):

均方差(标准差)

  由于方差是数据的平方,与检测值本身相差太大,人们难以直观地衡量,所以常用均方差代替方差判断数据的波动。

  所有样本的方差之和除以样本的个数,再把所得值开根号,所得之数就是这组数据的均方差,也叫标准差,常见的离散型公式:

  其中r就是随机变量的数学期望,也就是加权平均值,N是样本空间中的一部分数据。

协方差

  当舞台转向了多维随机变量时,方差就变成了协方差,这里的“协”是指几个变量的协同相关性。

  如果(X, Y)是二维随机变量,且D(X)>0, D(Y)>0,则X,Y的协方差的定义是:

  和方差类似,E(X)E(Y)是确定的数学期望,对于某一组确定的变量x=X, y=Y来说,X和Y也是定值,因此协方差可进一步转换为:

  由于E(X)E(Y)是定值,因此可以根据数学期望的性质进一步计算:

  从直观上来看,协方差表示的是两个变量总体误差的期望。

  如果两个变量的变化趋势一致,也就是说如果两个变量都大于自身的期望值,那么两个变量之间的协方差就是正值;如果两个变量的变化趋势相反,即其中一个变量大于自身的期望值,另外一个却小于自身的期望值,那么两个变量之间的协方差就是负值。

  当两个变量完全一致时,协方差就变成了方差:

  这相当于同一个变量的协方差等于方差,自己与自己一定同步,无所谓协同。

  协方差的性质:

协方差矩阵

协方差只能处理二维问题,对于三维以上数据,就需要计算多个协方差,然后用矩阵将其组织起来,这就是协方差矩阵。

以三维随机变量(X,Y,Z)为例,其协方差矩阵用∑表示:

需要注意的是,协方差矩阵计算的是不同维度之间的协方差,而不是不同样本之间的。

简单来说,协方差矩阵就是两两计算各维度之间的协方差,看看每两个维度之间的相关情况。如果各个变量之间相互独立,那么两个不同维度变量的协方差是0,协方差矩阵就是一个对角矩阵,并且对角线上的每个元素都是该维度的方差:


  作者:我是8位的

  出处:http://www.cnblogs.com/bigmonkey

  本文以学习、研究和分享为主,如需转载,请联系本人,标明作者和出处,非商业用途!

  扫描二维码关注公众号“我是8位的”

概率笔记8——方差、均方差和协方差相关推荐

  1. numpy中方差var、协方差cov求法

    在PCA中涉及到了方差var和协方差cov,下面详细了解这两个函数的用法.numpy中var和cov函数求法和MATLAB中var和cov函数求法类似. 首先均值,样本方差,样本协方差公式分别为 其中 ...

  2. 期望E,方差D,协方差Cov,主成分分析PCA

    期望E,方差D,协方差Cov,主成分分析PCA,应用于图像分类识别 1.期望方差的理解 2.协方差与协方差矩阵 3.数据降维的需求背景 4.PCA就是从解决特征之间的相关性入手,剔除冗余特征 5.PC ...

  3. 均方误差、平方差、方差、均方差、协方差(重点)

    一,均方误差  作为机器学习中常常用于损失函数的方法,均方误差频繁的出现在机器学习的各种算法中,但是由于是舶来品,又和其他的几个概念特别像,所以常常在跟他人描述的时候说成其他方法的名字.  均方误差的 ...

  4. Matlab求方差,均值,均方差,协方差的函数

    转自:http://blog.sina.com.cn/s/blog_4936c31d01011v8j.html 1. 均值 数学定义: Matlab函数:mean >>X=[1,2,3] ...

  5. matlab计算斜方差_Matlab求方差,均值,均方差,协方差的函数

    1.均值 数学定义: Matlab函数:mean >>X=[1,2,3] >>mean(X)=2 如果X是一个矩阵,则其均值是一个向量组.mean(X,1)为列向量的均值,me ...

  6. oracle方差和协方差函数,[转载]方差var、协方差cov、协方差矩阵(浅谈)(三)_函数cov...

    废话不多说,这节都是干货 我们继续讲第二个函数cov,需要区分的还是两个概念:协方差和样本协方差无偏估计值,此部分参考了博客相关内容http://blog.csdn.net/raocong2010/a ...

  7. stata学习笔记|异方差问题

    异方差无法用OLS进行估计的根源问题:方差较大的数据包含的信息量较小,但OLS是对所有数据进行相同的处理.异方差的问题并不会影响估计量的无偏性.一致性.渐近正态性,只是效率较低使得t检验和F检验失效. ...

  8. 样本协差阵 matlab函数,方差var、协方差cov、协方差矩阵(浅谈)(三)_函数cov...

    废话不多说,这节都是干货 我们继续讲第二个函数cov,需要区分的还是两个概念:协方差和样本协方差无偏估计值,此部分参考了博客相关内容http://blog.csdn.net/raocong2010/a ...

  9. python-pandas 来计算多组样本的方差(无偏样本方差)、协方差和相关系数(模式识别与智能计算课后作业)

    1.前言 作业题目如下 我自己用matlab算的,但是有个同学和我对答案的时候,还没有装好matlab,我就用python给写了一下. 2.代码 import pandas as pda = pd.S ...

最新文章

  1. Linux socket TIME_WAIT 优化
  2. 在CentOS 6.3 64bit上安装libunwind库
  3. 128条形码计算,利用Code 128字体实现条码打印
  4. 人工智能开发语言排行榜:不死Java,不朽C/C++,新贵Python
  5. 北大OJ百练——4073:最长公共字符串后缀(C语言)
  6. Angular6错误 Service: No provider for Renderer2
  7. mysql 从备份_MySQL主从备份配置
  8. matlab 十字路口左转
  9. 基于Consul的数据库高可用架构【转】
  10. Mac利用PD虚拟机安装Centos7
  11. 请各位博友帮帮出出主意呀
  12. Python——python3的requests模块的导入
  13. 台式机双系统安装(windows10+ubuntu18.04)及ROS安装的坑点解决
  14. 单片机c语言 一小时,1小时单片机C语言入门..doc
  15. 毕业设计之 ---- 基于机器视觉的图像拼接算法
  16. flutter之: GetX 的 路由管理
  17. 黑产工具情报的分析方式浅析
  18. 用 matplotlib 绘制 3D 时间序列动态图
  19. 计算机网络实验华中科技大学,华中科技大学计算机网络实验报告.pdf
  20. [Pytorch函数].repeat()

热门文章

  1. 四叶草社交平台——十天冲刺(8)
  2. excel固定第一行
  3. 2016年01月25日
  4. SAP MII(SAP制造集成和智能)-灵活且可扩展
  5. Ettercap安装教程
  6. 一致性hash和redis中hash槽的区别
  7. 男人要记住的100句
  8. 索贝尔算子Sobel operator
  9. 无聊的QQ,无聊的360
  10. 卸载Oracle软件和数据库(deinstall)