#期望, 方差, 协方差,标准差

期望

概率论中描述一个随机事件中的随机变量的平均值的大小可以用数学期望这个概念,数学期望的定义是实验中可能的结果的概率乘以其结果的总和。

定义

设P(x) 是一个离散概率分布,自变量的取值范围为{x1,x2,...,xnx_1, x_2,..., x_nx1​,x2​,...,xn​}。其期望被定义为:
E(x)=∑k=1nxkP(xk)E(x) = \sum_{k=1}^{n}{x_kP(x_k)}E(x)=k=1∑n​xk​P(xk​)
设P(x) 是一个连续概率密度函数,其期望为:
E(x)=∫−∞+∞xp(x)dxE(x) = \int_{-\infty}^{+\infty}{xp(x) \,{\rm d}x}E(x)=∫−∞+∞​xp(x)dx

###性质

期望服从线性性质,因此线性运算的期望等于期望的线性运算。
E(ax+by+c)=aE(x)+bE(y)+cE(ax + by +c) = aE(x) + bE(y) + cE(ax+by+c)=aE(x)+bE(y)+c
这个性质可以推广:
E(∑k=1naixi+c)=∑k=1naiE(xi)+cE(\sum_{k=1}^{n}{a_ix_i +c})= \sum_{k=1}^n{a_iE(x_i)}+cE(k=1∑n​ai​xi​+c)=k=1∑n​ai​E(xi​)+c
函数的期望:
离散
E(f(x))=∑k=1nf(xk)P(xk)E(f(x)) = \sum_{k=1}^n{f(x_k)P(x_k)}E(f(x))=k=1∑n​f(xk​)P(xk​)
连续
E(f(x))=∫−∞+∞f(x)p(x)dxE(f(x))= \int_{-\infty}^{+\infty}{f(x)p(x){\rm d}x}E(f(x))=∫−∞+∞​f(x)p(x)dx

但是,函数的期望不等于期望的函数,即E(f(x))≠f(E(x)) 。

设C为常数: E©=C
设C为常数: E(CX)=CE(X)
加法:E(X+Y)=E(X)+E(Y)
当X和Y相互独立时,E(XY)=E(X)E(Y)
(注意,X和Y的相互独立性可以通过下面的“协方差”描述)

意义

数学期望可以用于预测一个随机事件的平均预期情况。

方差

方差是在概率论和统计方差衡量随机变量或一组数据时的离散程度的度量,换句化说如果想知道一组数据之间的分散程度的话就可以使用方差来表示。

统计学方差

定义: 在统计描述中,方差用来计算每一个变量与总体均值之间的差异。为避免出现离均差总和为0, 离均差平均和受样本含量的影响。统计学采用平均离均差平方来描述变量的变异程度。意思应该就是为了避免有的数据和均值的差值是正数,有的是负数,他们相加会相互抵消,所以用平方的形式来衡量。

###公式
σ2=∑i=1N(X−μ)2N\sigma^2 = \frac{\sum_{i=1}^N{(X-\mu)^2}}{N}σ2=N∑i=1N​(X−μ)2​
其中σ2\sigma^2σ2为总体方差, XXX为变量, μ\muμ为整体均值,NNN为总体例数。

样本方差

由于在实际环境中没有办法穷举所有例子, 所以只能找出部分样本数据,基于这部分样本进行测算。可以把公式转换为:
S2=∑i=1n(Xi−μ)2n−1S^2 = \frac{\sum_{i=1}^n{(X_i-\mu)^2}}{n-1}S2=n−1∑i=1n​(Xi​−μ)2​
其中S2S^2S2为样本的方差,μ\muμ为采集样本的均值, nnn为样本的个数.

###概率论方差
在概率论中, 设X是一个离散型随机变量。

  1. 定义: 在概率分布中, 设X是一个离散型的随机变量,若E((X−E(X))2)E((X-E(X))^2)E((X−E(X))2)存在,则称它为X的方差,记为D(X),Var(X)D(X),Var(X)D(X),Var(X). 其中E(X)E(X)E(X)是XXX的期望,XXX是变量值。
  2. 离散型随机变量方差计算公式:
    D(X)=E((X−E(X))2)=E(X2)−(E(X))2D(X)=E((X-E(X))^2)=E(X^2)-(E(X))^2D(X)=E((X−E(X))2)=E(X2)−(E(X))2
  3. 连续型变量X, 其定义域(a, b),概率密度函数为f(x), 连续型随机变量X方差计算公式:
    D(X)=∫ab(x−μ)2f(x)dxD(X)=\int_{a}^b(x-\mu)^2f(x)dxD(X)=∫ab​(x−μ)2f(x)dx

标准差(Standard Deviation)

定义

又叫均方差, 是离均差平方的算数平方根。标准差能体现一个数据集的离散程度,平均数相同的两组数,标准差未必相同。

公式

σ=方差=∑i=1N(X−μ)2N\sigma = \sqrt{方差}=\sqrt{\frac{\sum_{i=1}^N(X-\mu)^2}{N}}σ=方差​=N∑i=1N​(X−μ)2​​
###标准差的意义
标准差和方差都是用来衡量样本离散程度的量,那么为什么要有标准差呢? 因为方差和样本的量纲不一样。换句话说不在一个层次,怎么理解这个层次,从公式来看方差是样本和均值的平方和的平均。这里有一个平方运算,这是导致量纲不在一个层次的原因。而标准差和均值的量纲(单位)是一致的,在描述一个波动范围时标准差比方差更方便。

##协方差(Covariance)
方差/ 标准差描述的是一维数据集合的离散程度, 但世界上现象普遍是多维数据描述的,那么很自然就会想到现象和数据的相关程度,以及各维度间相关程度。
比如,一个产品卖的好不好有很多因素构成,比如产品质量,价格等。那么价格质量之间是否由相关性呢?这个问题就可以用协方差来解决。

###公式
期望值分别为E(X), E(Y)的两个变量X,Y的协方差
Conv(X,Y)=E[(X−E(X))(Y−E(Y))]Conv(X, Y)=E[(X-E(X))(Y-E(Y))]Conv(X,Y)=E[(X−E(X))(Y−E(Y))]
=E(XY)−2E(X)E(Y)+E(X)E(Y)=E(XY)-2E(X)E(Y)+E(X)E(Y)=E(XY)−2E(X)E(Y)+E(X)E(Y)
=E(X协方差表示两个变量的总体的误差。这和只表示一个变量误差的方差不同。如果两个变量变化的趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身期望值。那么两个变量之间的协方差就是正。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个小于自身期望值,那么这两个变量之间的协方差就是负值。如果X,Y之间是独立的,那么两者的协方差就是0。Y)−E(X)E(Y)=E(X协方差表示两个变量的总体的误差。这和只表示一个变量误差的方差不同。如果两个变量变化的趋势一致, 也就是说如果其中一个大于自身的期望值,另外一个也大于自身期望值。那么两个变量之间的协方差就是正。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个小于自身期望值,那么这两个变量之间的协方差就是负值。 如果X, Y之间是独立的,那么两者的协方差就是0。Y)-E(X)E(Y)=E(X协方差表示两个变量的总体的误差。这和只表示一个变量误差的方差不同。如果两个变量变化的趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身期望值。那么两个变量之间的协方差就是正。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个小于自身期望值,那么这两个变量之间的协方差就是负值。如果X,Y之间是独立的,那么两者的协方差就是0。Y)−E(X)E(Y)
###协方差性质

  1. 同一个变量的协方差等于其方差Con(X, X) = Var(X)
  2. Con(aX, bY) = abCon(X, Y) a, b 为常量
  3. Con(X1 + X2, Y) = Con(X1, y) + Con(X2, y)
    ###相关系数
    协方差作为描述X和Y相关程度的量,在同一物理量纲下有一定作用。但同样的两个量采用不同的量纲使他们的协方差在数值上表现很大的差异,故引入如下概念:
    η=Corr(X,Y)=Conv(X,Y)Var(X)Var(Y)\eta = Corr(X, Y) = \frac{Conv(X, Y)}{\sqrt{Var(X)Var(Y)}}η=Corr(X,Y)=Var(X)Var(Y)​Conv(X,Y)​
    ###相关关系
  4. 相关性是一个衡量线性独立的无量纲数, 其取值在[ -1, 1] 之间。
  5. 相关性 corr = 1 时称完全线性相关。
  6. 相关性 corr = -1 时称完全线性负相关。
  7. 相关性 corr = 0 时称不相关。

期望, 方差, 协方差,标准差相关推荐

  1. [统计学理论基础] 方差 协方差 标准差

    统计里最基本的概念就是样本的均值.方差和标准差. 通过一个含有n个样本的集合,依次给出这些概念的公式描述. 均值描述的是样本集合的中间点,它告诉我们的信息是很有限的, 标准差描述的则是样本集合的各个样 ...

  2. 随机变量的期望 方差 协方差 相关系数的性质

    期望性质:E(C)=C,C为任意常数 E(aX+bY)=aE(X)+bE(Y) E(aX+C)=aE(X)+C X,Y独立 E(XY)=E(X)E(Y) 方差:D(X)=E(X*X)-E(X)*E(X ...

  3. 概率统计极简入门:通俗理解微积分/期望方差/正态分布前世今生(23修订版)

    原标题:数据挖掘中所需的概率论与数理统计知识(12年首次发布,23年重编公式且反复改进) 修订背景 本文初稿发布于12年年底,十年后的22年底/23年初ChatGPT大火,在写ChatGPT通俗笔记的 ...

  4. 均值,期望,方差,标准差,协方差

    1.均值 均值,其实是针对实验观察到的特征样本而言的.比如我们实验结果得出了x1,x2,x3--xn这n个值,那么我们的均值计算是 1/N * (x_{1}+x_{2}+-x_{n}) 比如我们进行掷 ...

  5. 期望、方差、标准差、协方差、相关系数、协方差矩阵、残差、残差平方和(SSE)、标准化残差,残差分析

    通过学习,结合网络上搜索, 把相关概念整理了一下. 1.期望(均值.数学期望) 期望是 度量数据的集中趋势的一个重要指标,是研究随机变量的一个重要数字特征 离散型 随机变量Xi,其对因的概率P(Xi) ...

  6. 数学基础-均值、期望、方差、标准差、协方差

    均值: 统计学概念,根据实际试验结果计算得出的平均值 X ˉ = 1 N ( x 1 + x 2 + ⋯ + x n ) \bar X=\frac{1}{N}(x_1+x_2+\dots+x_n) X ...

  7. 回归标准差和残差平方和的关系_期望、方差、标准差、协方差、相关系数、协方差矩阵、残差、残差平方和(SSE)、标准化残差,残差分析...

    通过学习,结合网络上搜索, 把相关概念整理了一下. 1.期望(均值.数学期望) 期望是 度量数据的集中趋势的一个重要指标,是研究随机变量的一个重要数字特征 离散型 随机变量Xi,其对因的概率P(Xi) ...

  8. 数学期望、方差、标准差、协方差、残差、均方差、均方误差、均方根误差、均方根值对比分析及python实现

    内容较多,如有错误之处请评论区留言以便更正,内容仅供参考. 文章目录 期望(Expected value) 意义 定义 离散型 连续型 期望与平均值的区别 方差(Variance) 案例 概率论方差 ...

  9. 数据的离散趋势分析之EVSC——期望,方差,标准差,协方差,相关系数,变异系数

    期望(Expectation) 记做E(X),表示随机事件的平均预期. 大数定律(Law of Large Numbers):如果随机事件的出现次数(即频数Frequency)趋向于无穷大,则E(X) ...

  10. oracle数据库之统计分析(方差、标准差、协方差)

    1. 方差.标准差 引言:   样本中各数据与样本平均数的差的平方和的平均数叫做样本方差:样本方差的算术平方根叫做样本标准差.样本方差和样本标准差都是衡量一个样本波动大小的量,样本方差或样本标准差越大 ...

最新文章

  1. 【转帖】详解CSS网页布局中默认字体样式
  2. word经常用到的技巧
  3. c语言的变量,常量及作用域等
  4. 设置asp.net网站的信任等级
  5. 使用SharePoint Server 2007搜索对象模型编程创建搜索查询
  6. 一次CMS GC问题排查过程(理解原理+读懂GC日志)
  7. INF DestinationDirs Section
  8. MySQL普通索引与唯一索引__mysql中唯一索引和普通索引的用途及区别
  9. Huawei said, “Let every meeting room or coffee shop
  10. GitHub 上开源哪家强?| 原力计划
  11. 小程序 request:fail ssl hand shake error 问题解决方法
  12. 恩施软件开发人员每月多少钱_软件开发人员外包报价表
  13. UML——实现图(构件图与部署图)
  14. 传统机器学习和深度神经网络对比
  15. analogWrite怎么做PWM输出?改PWM频率(定时器相关)
  16. 非线性规划的拉格朗日乘子法python编程python包编程
  17. 计算机及统计学,统计学中及计算机视觉中的各种 距离 汇总。。。
  18. QT5.15.2__wind10 64 源码编译
  19. JavaScript 删除数组中为null的元素,过滤数组
  20. 华为 / 小米都看不惯,微信 iOS / 安卓 8.0.30 正式版终于修复转发文件多次保存问题

热门文章

  1. 含含乐代理为球场运动员提供吸烟替代解决方案
  2. Vue源码分析-手写Vue(简易版)
  3. jconsole介绍
  4. Essential C++学习笔记及源代码(第1章 C++编程基础)
  5. L---泰拉瑞亚---2023河南萌新联赛第(三)场:郑州大学
  6. linux中的grep命令用法
  7. 基于均衡优化算法的无线传感器网络三维覆盖优化
  8. IM即时通讯构建企业协同生态链
  9. 学习记录678@项目管理之合同管理案例
  10. 笔记整理--Http-Cookie