文章目录

  • 1 皮尔逊相关性
    • 1.1 定义
    • 1.2 性质
  • 2 协方差
  • 3 方差和协方差的关系

1 皮尔逊相关性

1.1 定义

给定两个随机变量,XXX 和 YYY,则 XXX 和 YYY 之间的(皮尔逊)相关性定义为:
Corr(X,Y)=Cov(X,Y)Var(X)⋅Var(Y),\text{Corr}(X, Y) = \frac{\text{Cov}(X, Y)}{\sqrt{\text{Var}(X)} \cdot \sqrt{\text{Var}(Y)}}, Corr(X,Y)=Var(X)​⋅Var(Y)​Cov(X,Y)​,
其中 X,Y∈RX, Y \in \mathcal{R}X,Y∈R。

1.2 性质

  • Corr(X,X)=1\text{Corr}(X, X) = 1Corr(X,X)=1。
  • Corr(X,Y)=Corr(Y,X)\text{Corr}(X, Y) = \text{Corr}(Y, X)Corr(X,Y)=Corr(Y,X)。
  • Corr(aX+b,Y)=sign(a)Corr(X,Y)\text{Corr}(aX+b, Y) = \text{sign}(a)\text{Corr}(X,Y)Corr(aX+b,Y)=sign(a)Corr(X,Y),对于任意的 a,b∈Ra,b \in \mathcal{R}a,b∈R。
  • −1≤Corr(X,Y)≤1-1 \leq \text{Corr}(X, Y) \leq 1−1≤Corr(X,Y)≤1,当 Corr(X,Y)>0\text{Corr}(X, Y) > 0Corr(X,Y)>0 时表示正(线性)关系,当 <0< 0<0 表示负(线性)关系。
  • ∣Corr(X,Y)∣=1\lvert \text{Corr}(X, Y) \rvert =1∣Corr(X,Y)∣=1 当且仅当 Y=aX+bY= aX+bY=aX+b 时,其中 a,b∈R,a≠0a,b \in \mathcal{R}, a \neq 0a,b∈R,a=0。
  • 如果 X,YX, YX,Y 互相独立,则 Corr(X,Y)=0\text{Corr}(X, Y) = 0Corr(X,Y)=0。
  • 如果 Corr(X,Y)=0\text{Corr}(X, Y) = 0Corr(X,Y)=0,不能得出 X,YX, YX,Y 互相独立。
  • 如果 (X,Y)(X, Y)(X,Y) 是双变量正态的且 Corr(X,Y)=0\text{Corr}(X, Y)=0Corr(X,Y)=0,则 X,YX,YX,Y 是相互独立的。

2 协方差

Cov(X,Y)=∑i=1n(Xi−Xˉ)(Yi−Yˉ)n=E[(X−E[X])(Y−E[Y])].\text{Cov}(X, Y) = \sum_{i=1}^n \frac{(X_i - \bar{X}) (Y_i - \bar{Y})}{n} = E\left[(X - E[X]) (Y - E[Y]) \right]. Cov(X,Y)=i=1∑n​n(Xi​−Xˉ)(Yi​−Yˉ)​=E[(X−E[X])(Y−E[Y])].

3 方差和协方差的关系

Var(X)=E[(X−E[X])2]=Cov(X,X).\text{Var}(X) = E \left[ (X - E[X])^2 \right] = \text{Cov}(X, X). Var(X)=E[(X−E[X])2]=Cov(X,X).

相关性(correlation)相关推荐

  1. R计算两列数据的相关系数_数据相关性分析 correlation - R实现

    相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度.相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析. 有时候多组数据需要分析其关联性(是否有正向 ...

  2. 因果关系和相关关系 大数据_数据科学中的相关性与因果关系

    因果关系和相关关系 大数据 Let's jump into it right away. 让我们马上进入. 相关性 (Correlation) Correlation means relationsh ...

  3. Series和DataFrame、相关性及NaN处理

    pandas核心数据结构 pandas是以numpy为基础的,还提供了一些额外的方法 Series series用来表示一维数据结构,与python内部的数组类似,但多了一些额外的功能. series ...

  4. 量化交易 实战第九课 多因子相关性分析

    量化交易 实战第九课 多因子相关性分析 概述 研报分析结果 代码实现 导包 总资产回报率 IC 资本回报率 IC 计算相关性 概述 相关性 (Correlation) 在统计中是与独立性 (Indep ...

  5. SBB:无机肥对土壤中固氮菌丰度和群落结构的影响

    文章目录 25年的无机施肥处理对华南酸性土壤中固氮菌丰度和群落结构的影响 写在前面 摘要 背景 结果 玉米生物量与土壤性质 图 1 25年(1990 - 2015)的长期施肥试验的玉米生物量 表 1 ...

  6. 50个ggplot2可视化案例

    什么类型的可视化用于什么类型的问题?本文可帮助您为特定分析目标选择正确的图表类型,以及如何使用ggplot2在R中实现它. 本文转载自"R友舍",已获授权,点我跳转原文链接 本文翻 ...

  7. 热力图和相关系数分析

    数据分析在机器学习中非常重要,它决定后续的特征值选取和数据处理的方向.热力图(heatmap)和相关性(correlation)分析则是常见的分析手段,本文主要介绍两者的使用方法,文中使用的演示代码放 ...

  8. 医学图像分类_全面梳理:图像配准综述

    内容导读: 1 定义 2 问题背景和应用 3 相关关键词 4 问题分类 4.1 基于问题特点的分类 4.2 根据算法本质的分类 5 图像配准通用流程 5.1 基于特征的图像配准通用流程 6 图像配准质 ...

  9. 【Machine Learning】机器学习の特征

    绘制了一张导图,有不对的地方欢迎指正: 下载地址 机器学习中,特征是很关键的.其中包括,特征的提取和特征的选择.他们是降维的两种方法,但又有所不同: 特征抽取(Feature Extraction): ...

  10. Python之Pandas库学习(一):简介

    官方文档 1. 安装Pandas windos下cmd:pip install pandas导入pandas包:import pandas as pd 2. Series对象 带索引的一维数组 创建: ...

最新文章

  1. 一天一个shell实例(3)定时备份文件(转)
  2. string.Empty 和 并不总是可以互换的
  3. 2019手把手教你Java面试通关BAT
  4. C语言版数据结构及算法_快速排序
  5. python pandas 日期格式_pandas 快速处理 date_time 日期格式方法
  6. Robot Framework(十二) javascript基础
  7. linux shell 变量命令,shell - 如何在Bash中将变量设置为命令的输出?
  8. 从Client应用场景介绍IdentityServer4(二)
  9. android长按非控件处,Android常用之Butterknife使用详解
  10. 201809-1—卖菜
  11. vmware之VMware Remote Console (VMRC) SDK(二)
  12. 教学质量分析系统 php,教学质量分析系统演示.ppt
  13. Mac 修改VIM中C语言函数高亮显示
  14. pcsx2 linux双显卡,PC模拟PS2游戏模拟器PCSX2使用教程
  15. ESP32超详细学习记录:获取B站粉丝数
  16. 线性MMSE检波和ZF检波
  17. 友盟统计使用及添加测试设备(设备ID及Mac地址识别)
  18. 【CSS】常见选择器用法
  19. 隐藏win10任务栏输入法M图标
  20. 2016中国移动办公论坛暨《2016中国移动办公男神报告》发布会成功举办

热门文章

  1. MMDetection实战:MMDetection训练与测试
  2. (Scala)java.lang.NoSuchMethodError 原因和处理方案
  3. 尚观ULE 文件属性
  4. 软件测试Homework1——印象最深刻的一次调bug经历
  5. 第九章 泛型和枚举-枚举
  6. 进步的奥秘:自下而上的演变 //转载
  7. 浏览器处理unload和onbeforeunload事件
  8. 小波变换原理与JPEG2000
  9. 2022-2028全球与中国宠物学校市场现状及未来发展趋势
  10. 女生学java怎么样?女孩子学java会不会很难?