统计学习


前言

最近在做信号处理感觉理论掌握的不够扎实,开始了重新的补习,提高自己的知识水平。
在概率论和统计学中,协方差和相关性的数学概念非常相似。它们用近似的方式度量了两个随机变量或者一组随机变量偏离自己期望值的趋势的程度。


协方差和相关性

如果X和Y是两个随机变量,它们的均值(期望值)是μXμX\mu X ,μYμY\mu Y,同时它们的标准差是
σXσX\sigma X 以及 σYσY\sigma Y,分别地,它们的协方差和相关性可以通过以下式子计算:

covariancecovariancecovariance σXY=E[(X−μX)(Y−μY)]σXY=E[(X−μX)(Y−μY)] σ _{ X Y} = E [ ( X − μ_ X ) ( Y − μ_Y ) ]

correlationcorrelationcorrelation ρXY=E[(X−μX)(Y−μY)]/(σXσY)ρXY=E[(X−μX)(Y−μY)]/(σXσY)ρ_ {X Y} = E [ ( X − μ_X ) ( Y − μ_Y ) ] / ( σ _X σ_Y )

因此:

covXY=σXY=ρXYσXσYcovXY=σXY=ρXYσXσY{\displaystyle {\text{cov}}_{XY}=\sigma _{XY}=\rho _{XY}\sigma _{X}\sigma _{Y}}

其中E代表求期望,特别地,相关性是无量纲的,而协方差的单位是将两个变量的单位相乘。

如果Y的值和X的值一直都是相同的,我们将会得到一个变量自身的协方差
(i.e.σXX)(i.e.σXX) (i.e. {\displaystyle \sigma _{XX}} )也就是通常意义上讲的方差,一般简写为 σX2σX2σ X ^2,
也就是标准差的平方。
一个变量自身的相关性永远是1(除了在退化的情况下,这个情况下,X是一个常量,因此两个变量的方差都是0,也因此相关性计算中会涉及除数为0的情况,也因此相关性并不存在)。
更通俗地说,两个变量间的相关性会是1(或者-1),如果它们中的一个是另一个通过一个具有正斜率(或者负斜率)的线性函数得到的。

虽然从理论上协方差的值和相关性的值通过上述方式联系在了一起,但这些统计量的样本估计的概率分布并没有以任何简单的方式关联,因此它们通常需要分开处理。


多重随机变量

对于任意数量超过1的随机变量,可以将随机变量堆积成一个随机向量,其第i个元素是第i个随机变量。 然后,可以将方差和协方差放置在协方差矩阵中,其中(i,j)元素是第i个随机变量和第j个随机变量之间的协方差。 同样,相关性指标可以放置在相关矩阵中。


时间序列分析

对于一个满足宽平稳过程条件的时间序列,即它的均值和方差都是平稳的(不随着时间变化)
(E(Xn+m)=E(Xn)=μX和var(Xn+m)=var(Xn)并且这同样对于Y也成立).(E(Xn+m)=E(Xn)=μX和var(Xn+m)=var(Xn)并且这同样对于Y也成立). (E(Xn+m) = E(Xn) = μX 和 var(Xn+m) = var(Xn) 并且 这同样对于Y 也成立).

在这个情况下,互协方差和互相关性是随着时间变化的函数:
cross−covarianceσXY(m)=E[(Xn−μX)(Yn+m−μY)],cross−covarianceσXY(m)=E[(Xn−μX)(Yn+m−μY)],cross-covariance {\displaystyle \sigma _{XY}(m)=E[(X_{n}-\mu _{X})\,(Y_{n+m}-\mu _{Y})],}
cross−correlationρXY(m)=E[(Xn−μX)(Yn+m−μY)]/(σXσY).cross−correlationρXY(m)=E[(Xn−μX)(Yn+m−μY)]/(σXσY).cross-correlation {\displaystyle \rho _{XY}(m)=E[(X_{n}-\mu _{X})\,(Y_{n+m}-\mu _{Y})]/(\sigma _{X}\sigma _{Y}).}

如果Y和X是同一个随机过程,以上的表达式则被叫做自协方差和自相关性。

autocovariance σXX(m)=E[(Xn−μX)(Xn+m−μX)],σXX(m)=E[(Xn−μX)(Xn+m−μX)],σ X X ( m ) = E [ ( X n − μ X ) ( X n + m − μ X ) ] ,
σXX(m)=E[(Xn−μX)(Xn+m−μX)],σXX(m)=E[(Xn−μX)(Xn+m−μX)], {\displaystyle \sigma _{XX}(m)=E[(X_{n}-\mu _{X})\,(X_{n+m}-\mu _{X})],}
autocorrelation ρXX(m)=E[(Xn−μX)(Xn+m−μX)]/(σ2X).ρXX(m)=E[(Xn−μX)(Xn+m−μX)]/(σX2). {\displaystyle \rho _{XX}(m)=E[(X_{n}-\mu _{X})\,(X_{n+m}-\mu _{X})]/(\sigma _{X}^{2}).}


参考:
wikepedia

统计学习:协方差和相关性相关推荐

  1. 统计学习导论 Chapter8 -- Tree-Based Methods

    Book: An Introduction to Statistical Learning with Applications in R http://www-bcf.usc.edu/~gareth/ ...

  2. 统计学习导论 Chapter2--What Is Statistical Learning?

    Book: An Introduction to Statistical Learning with Applications in R http://www-bcf.usc.edu/~gareth/ ...

  3. 统计学习导论:基于R应用——第二章习题

    目前在看统计学习导论:基于R应用,觉得这本书非常适合入门,打算把课后习题全部做一遍,记录在此博客中. 第二章习题 1. (a) 当样本量n非常大,预测变量数p很小时,这样容易欠拟合,所以一个光滑度更高 ...

  4. UA MATH574M 统计学习II 高维数据的二元分类

    UA MATH574M 统计学习II 高维数据的二元分类 LDA的直观解释 NSC 上一讲提到了高维数据相比低维数据的特殊性,并介绍了处理高维数据二元分类最简单的一个模型independent rul ...

  5. UA MATH574M 统计学习II 二元分类例子与高维问题

    UA MATH574M 统计学习II 二元分类例子与高维问题 数值例子 高维数据的二分类问题 Independence Rule 数值例子 用模拟数值做一个二分类的例子. library(MASS)# ...

  6. UA MATH574M 统计学习II 二元分类

    UA MATH574M 统计学习II 二元分类基础 基础模型 Bayes分类器 均等成本 不等成本 线性概率模型 线性分类器 线性判别分析(LDA) Logistics回归 基础模型 假设一个二元分类 ...

  7. 【统计学习系列】多元线性回归模型(五)——参数与模型的显著性检验:t检验与F检验

    文章目录 1. 前文回顾 2. 单参数显著性检验--t检验 2.1 问题的提出 2.2 检验统计量--t统计量的构造 2.3 拒绝域的构造 2.4 浅谈p值 3. 回归方程显著性检验--F检验 3.1 ...

  8. 统计学习导论(ISLR)(三):线性回归(超详细介绍)

    统计学习导论(ISLR) 参考资料: The Elements of Statistical Learning An Introduction to Statistical Learning 统计学习 ...

  9. 机器学习和统计学习的区别:10个统计分析方法

    来源:THU数据派(ID:datapi) 无论你在数据科学中是何种立场,你都无法忽视数据的重要性,数据科学家的职责就是分析.组织和应用这些数据. 著名求职网站 Glassdoor 根据庞大的就业数据和 ...

最新文章

  1. sizeof计算类的大小
  2. c++不是类型安全的语言
  3. WIX(20121031) 应用设置默认变量
  4. Vue表单类的父子组件数据传递示例_vue.js_脚本之家
  5. python 数据结构包括三方面_python数据结构
  6. 收集Tomcat异常日志并发送邮件
  7. python win32api.sendmessage_Python win32api sendmasg
  8. Python生成器教程
  9. 惠普服务器bios修改ilo,HPE Gen10 Plus iLO5 BIOS设置固定IP地址
  10. 多线程同步有几种实现方法C语言,线程同步与并发
  11. NTL密码算法开源库——大整数ZZ类(四)
  12. 建筑工地人脸识别门禁通道闸机如何安装 1
  13. 鸿蒙系统运行内存为啥只有8g,为什么手机运存是8G的,但是可用却只有5G?
  14. ICPC 沈阳M - United in Stormwind SOSDP+FWT+容斥
  15. 26、网络丢包怎么办?这些解决办法不得不知
  16. git-cola安装与使用
  17. 2021年12月中国A股生物制品行业上市企业市值排行榜:百济神州-U位居第二,康希诺-U股价最高(附月榜TOP43详单)
  18. 拍卖理论 英式拍卖 和 荷兰式拍卖 是什么
  19. [译]从《孙子兵法》到软件开发
  20. 如何选择文件系统:EXT4、Btrfs 和 XFS

热门文章

  1. 理性预期学派(Rational Expectation School)
  2. 第一次二刷的电影:工作细胞
  3. 大四上学期的分数和分析感悟
  4. a high quality start up vc in uk
  5. 开源数学软件zzllrr Mather小乐数学简介Summary
  6. day22 Pythonpython 本文json模块
  7. CF467C George and Job
  8. unity节目素材ProceduralMaterial采用
  9. Scale-up(纵向扩展) vs Scale-out(横向扩展)
  10. DM365 dvsdk_2_10_01_18开发环境搭建