重要的统计量(期望、方差、协方差、相关系数、矩)的概念和性质
一、期望
1、定义
在概率论和统计学中,数学期望(mean)(或均值,亦简称期望)是试验中每次可能结果的概率乘以其结果的总和,是最基本的数学特征之一。它反映随机变量平均取值的大小。
- 离散型:
- 连续型
即:概率加权下的“平均值”。
2、无条件成立
3、X和Y相互独立
- 反正不成立。事实上,若,只能说明X和Y不相关。(不相关的定义来自下面协方差部分?)
关于相关和独立(摘自一只快乐小胖):
相关性是指两个随机变量之间的线性关系,不相关只是说明它们之间不具有线性关系,但是可以有别的关系,所以不一定相互独立。
如果两个随机变量独立,就是说它们之间没有任何关系,自然也不会有线性关系,所以它们不相关。反过来说如果两个随机变量相关,也就是说它们之间有线性关系,自然不独立。
- 独立:
- 互斥:,
二、方差
1、定义
方差是衡量源数据和期望值相差的度量值。概率论中方差用来度量随机变量和其数学期望(即均值)之间的偏离程度。
2、无条件成立
3、X和Y独立
方差的平方根称为标准差。
三、协方差
1、定义
在有限的二阶矩的情况下,两个共同分布的实值随机变量X和Y之间的协方差被定义为它们偏离各自期望值的期望乘积。但协方差的计算有多种形式,和定义的一般格式有所区别。
2、性质
3、协方差和独立、不相关
X和Y独立时,
而
从而,当X和Y独立时,
但X和Y独立这个前提太强,我们定义若,则称X和Y不相关。
4、协方差的意义
(1)协方差是两个随机变量具有相同方向变化趋势的度量:
- 若,它们的变化趋势相同;
- 若,它们的变化趋势相反;
- 若,称X和Y不相关。
对应到机器学习,可利用协方差来筛选特征(降维)。
(2)协方差有没有上界?
若
则
当且仅当X和Y之间有线性关系时,等号成立。
5、协方差矩阵
对于n个随机向量()任意两个元素和都可以得到一个协方差,从而形成n*n的矩阵,协方差矩阵是一个对称阵。
将随机向量写成列向量,则为n列矩阵,将X的列分别去均值后,得到矩阵,则协方差矩阵为:
所以,可基于协方差矩阵筛选特征。
四、Pearson相关系数
1、定义
也就是把上面的除过去。
2、性质
- 由协方差上界定理可知:
- 当且仅当X和Y之间有线性关系时,等号成立。
- 容易看到,相关系数是标准尺度下的协方差。上面关于协方差与XY相互关系的结论,完全适用于相关系数和XY的相互关系。
3、相关系数矩阵
类似于协方差矩阵,相关系数矩阵中每个元素的范围在[-1,1]之间,更方便进行比较。相关系数矩阵可以发现特征之间的相关性。如果两个特征之间比较接近或相反(数值在-1或1之间),说明这两个特征比较相似,所以可以剔除其中一个特征。
五、矩
对于随机变量X,X的k阶圆点矩为
X的k阶中心距为
六、统计参数总结
期望(一阶原点矩)
方差(标准差,二阶中心矩)
变异系数(Coefficient of Variation):标准差与均值的比值,记为C·V
偏度(Skewness) 三阶
峰度(Kurtosis)四阶
重要的统计量(期望、方差、协方差、相关系数、矩)的概念和性质相关推荐
- 随机变量的期望 方差 协方差 相关系数的性质
期望性质:E(C)=C,C为任意常数 E(aX+bY)=aE(X)+bE(Y) E(aX+C)=aE(X)+C X,Y独立 E(XY)=E(X)E(Y) 方差:D(X)=E(X*X)-E(X)*E(X ...
- 标准差 方差 协方差 相关系数
一.统计学的基本概念 统计学里最基本的概念就是样本的均值.方差.标准差.首先,我们给定一个含有n个样本的集合,下面给出这些概念的公式描述: 均值: 标准差: 方差: 均值描述的是样本集合的中间点,它告 ...
- 概率统计极简入门:通俗理解微积分/期望方差/正态分布前世今生(23修订版)
原标题:数据挖掘中所需的概率论与数理统计知识(12年首次发布,23年重编公式且反复改进) 修订背景 本文初稿发布于12年年底,十年后的22年底/23年初ChatGPT大火,在写ChatGPT通俗笔记的 ...
- 几何分布的期望和方差公式推导_算法数学基础-统计学最基础之均值、方差、协方差、矩...
我们天天都可以接触很多随机现象,比如每天的天气不一样气温是我们最直接的感受,我们很难预测明天的精确问题,但是这些随机现象又体现出了一定的规律性.比如上海7月份平均35度左右,冬天的平均温度在5度左右. ...
- python计算样本方差_Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算...
使用numpy可以做很多事情,在这篇文章中简单介绍一下如何使用numpy进行方差/标准方差/样本标准方差/协方差的计算. variance: 方差 方差(Variance)是概率论中最基础的概念之一, ...
- 一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差
一起啃PRML - 1.2.2 Expectations and covariances 期望和协方差 @copyright 转载请注明出处 http://www.cnblogs.com/chxer/ ...
- python方差的计算公式_Python计算库numpy进行方差/标准方差/样本标准方差/协方差的计算...
使用numpy可以做很多事情,在这篇文章中简单介绍一下如何使用numpy进行方差/标准方差/样本标准方差/协方差的计算. variance: 方差 方差(Variance)是概率论中最基础的概念之一, ...
- 协方差公式性质证明过程_论文推荐 | 刘志平:等价条件平差模型的方差-协方差分量最小二乘估计方法...
<测绘学报> 构建与学术的桥梁 拉近与权威的距离 等价条件平差模型的方差-协方差分量最小二乘估计方法 刘志平1, 朱丹彤1, 余航1, 张克非1,2 1. 中国矿业大学环境与测绘学院, 江 ...
- 利用级数求和推导泊松分布的期望方差
利用级数求和推导泊松分布的期望方差 @(概率论) 闲来无事,动手推导一个常见的泊松分布的表达式相关的数字特征: EX,DX.并通过这个过程思考级数求和的注意事项. 回顾泊松分布: 设变量X服从λ\la ...
- 二项分布的期望方差证明
二项分布的期望方差证明 P(X=k)=(nk)pkqn−k,k=0,1,2,..,n,q=1−pEX=∑k=0nk(nk)pkqn−k=∑k=1nk(nk)pkqn−k=∑k=1nkn!k!(n−k) ...
最新文章
- python dataframe数据类型_python-Pandas DataFrame,1、2、3和NaN值的默认数据类型
- kubernetes组件介绍
- 工业用微型计算机(10)-指令系统(7)
- 关于sencha touch 2的mvc问题的思考。
- java窗体线条切换消失_java – 如何更改apache poi生成的图表不使用平滑线条并将空单元格显示为间隙?...
- 曲线组合图 类型详情
- springboot session超时时间
- web html div javascript 实现踩黑块游戏
- Beyond Compare 提示“缺少评估信息或损坏”
- exchange服务器重装后,Exchange 服务器 2010 SP3 安装更新汇总 30补丁包后Exchange控制台初始化失败?...
- python struct pack unpack
- 不能错过的徒步欢乐:从秦皇岛到北戴河
- xdos攻击ac实验环境
- 2020到2021计算机试题,2020广东计算机一级考试试题和答案【2021年整理】-20210715002405.docx-原创力文档...
- 浏览器开发者模式Headers没有FormData
- 构建Lua解释器Part8:构建完整的语法分析器(下)
- Linux进程原理及系统调用
- 在网页中打开pdf、word、excel文件
- 编译error: no acceptable C compiler found in $PATH
- STM32调试FM24C04B-G心得及注意事项,解决不应答等