pearson相关系数

研究变量之间 线性相关 程度的量,一般用r表示。
两个随机变量X,Y之间的pearson相关系数定义为:
ρX,Y=cov(X,Y)σXσY=E[(X−μX)(Y−μY)]σXσY,{\rm \rho}_{X,Y}=\frac{{\rm cov}(X,Y)}{\sigma_X \sigma_Y}=\frac{{\rm E}[(X-\mu_X)(Y-\mu_Y)]}{\sigma_X \sigma_Y},ρX,Y​=σX​σY​cov(X,Y)​=σX​σY​E[(X−μX​)(Y−μY​)]​,
值介于-1~1之间。

以上是总体相关系数,用样本估算的相关系数为:
r=∑i=1n(xi−xˉ)(yi−yˉ)∑i=1n(xi−xˉ)2∑i=1n(yi−yˉ)2r=\frac{\sum_{i=1}^n (x_i - \bar{x})(y_i-\bar{y})}{\sqrt{\sum_{i=1}^n (x_i-\bar{x})^2}\sqrt{\sum_{i=1}^n(y_i-\bar{y})^2}}r=∑i=1n​(xi​−xˉ)2​∑i=1n​(yi​−yˉ​)2​∑i=1n​(xi​−xˉ)(yi​−yˉ​)​

r>0时表示正相关,r<0时表示负相关。

相关系数强度判断(绝对值):
0.8~1.0极强相关
0.6~0.8强相关
0.4~0.6中等程度相关
0.2~0.4弱相关
0~0.2极弱或不相关

理解角度1: 两个向量的夹角余弦。
两个变量的样本向量x=(x1,x2,...,xn)x=(x_1,x_2,...,x_n)x=(x1​,x2​,...,xn​),y=(y1,y2,...,yn)y=(y_1,y_2,...,y_n)y=(y1​,y2​,...,yn​)。
Pearson相关系数可以看作这两个向量中心化后夹角余弦值
【显然,余弦值用来刻画两个向量的角度,角度越小,相关性越大;角度越大,相关性越小。余弦值为1时,夹角为0;余弦值为0时,互相垂直;余弦值为-1时,反方向。这与pearson相关系数描述相关程度一致。】

★理解角度2: pearson相关系数无非就是协方差做标准化。
观察协方差的式子Cov(X,Y)=E[(X−μx)(Y−μy)]Cov(X,Y) = E[(X-\mu_x)(Y-\mu_y)]Cov(X,Y)=E[(X−μx​)(Y−μy​)],翻译一下就是:每个时刻X与其均值之差 乘以 Y值与其均值之差,将所有时刻的乘积相加 然后求 均值。
如果乘积是正的,说明同向变化;乘积是负的说明反向变化。正的项越多,说明同向变化的次数越多;反之,亦然。
总结: 协方差越大,同向程度越高;协方差越小,反向程度越高。如果接近0,说明同向次数与反向次数差不多,没有规律。

注意: 1. 这里的相关性指的是两个变量子啊变化过程中,同向变化,还是反向变化。
横轴是时间,纵轴是两个变量,画出来大概是:

2. 如果画两个变量的散点图,它们强相关,那么散点应该围绕一条直线。因此,也说Pearson系数描述的是线性相关。

具体可以看这一篇文章,目前看过讲的最清楚,最通俗的:https://www.zhihu.com/question/20852004/answer/134902061

spearman秩相关系数

学习链接:link

spearman秩相关系数是一种非参数统计相关性检验,一般用ρ\rhoρ表示。
它表示的是两个变量有多大程度可以用单调函数描绘在单调关系中,变量趋于一起变化,但是不一定以恒定速率变化 两个变量单调相关时,spearman相关系数为+1或-1。
两个变量单调相关时,spearman相关系数为+1或者-1.

Spearman相关系数定义为两个变量的秩统计量之间的pearson相关系数。设有n组观测样本Xi,Yi,i=1,2,...,nX_i,Y_i, i=1,2,...,nXi​,Yi​,i=1,2,...,n. 对这组样本进行排序,得到秩统计量xi,yix_i,y_ixi​,yi​,那么ρ\rhoρ的计算公式为:
ρ=1−6∑di2n(n2−1)\rho = 1-\frac{6\sum d_i^2}{n(n^2-1)}ρ=1−n(n2−1)6∑di2​​
这里di=xi−yid_i=x_i-y_idi​=xi​−yi​,表示两个秩的差。【就是对两个变量的秩统计量求pearson相关系数,以上公式是化简后的结果。】

pearson相关系数和spearman相关系数的区别

学习链接:link

pearson相关系数为+1时,意味着,一个变量增加时,另一个变量增加一致的量。

如果一个变量在另一个变量增加时增加,但是增量不一致,则Pearson系数小于+1,但是spearman系数仍然等于1.

非线性相关时,或关系为随机时,两个相关系数都几乎为0.

如果一个变量在另一个变量减少时减少,但是增量不一致,则Pearson系数大于-1,但是spearman系数仍然等于-1.

注意:1. pearson相关系数仅评估线性关系;spearman相关系数仅评估单调关系。但是,即使两种相关系数为0,两个变量之间也有可能存在其他非单调关系!!

2. spearman相关系数对于数据错误和极端值的反应不敏感

举例:
y=x^3 ,x和y的pearson相关系数不是1,但spearman相关系数是1. 【使用pandas中的相关系数计算函数】

x = pd.Series(np.arange(1, 100))
y = pd.Series(x ** 4)
D = pd.concat([x, y], axis=1)
print(D.corr(method='pearson'))
print(D.corr(method='spearman'))
          0         1
0  1.000000  0.867294
1  0.867294  1.0000000    1
0  1.0  1.0
1  1.0  1.0

pearson相关系数与spearman相关系数相关推荐

  1. 特征选择 | MATLAB实现特征变量相关性分析(Pearson相关系数,Kendall相关系数和Spearman相关系数)

    特征选择 | MATLAB实现特征变量相关性分析(Pearson相关系数,Kendall相关系数和Spearman相关系数) 目录 特征选择 | MATLAB实现特征变量相关性分析(Pearson相关 ...

  2. 【7.0】 数学建模 | 相关系数详解 | Person相关系数、Spearman相关系数

    总体Person相关系数 如果两组数据X:{X1,X2,⋯,Xn}和Y:{Y1,Y2,⋯,Yn}是总体数据(例如普查结果)那么总体均值:E(X)=∑i=1nXin,E(Y)=∑i=1nYin总体协方差 ...

  3. 皮尔逊(Pearson)相关系数与spearman相关系数(Python实现)

    概念介绍 相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度. 相关系数大小解释 相关性 绝对值 无相关 0 - 0.09 弱相关 0.1 - 0.3 中相关 0.3 - 0.5 强相关 ...

  4. [学习笔记] [机器学习] 8. 聚类算法(聚类算法:K-means、K-means++;聚类算法评估;特征降维:特征选择(Pearson相关系数、Spearman相关系数)、PCA主成分分析)

    视频链接 数据集下载地址:无需下载 1. 聚类算法简介 学习目标: 掌握聚类算法实现过程 知道 K-means 算法原理 知道聚类算法中的评估模型 说明 K-means 的优缺点 了解聚类中的算法优化 ...

  5. Pearson相关系数和Spearman相关系数的区别

    前言 相关系数是用以反映变量之间的相关关系程度的统计指标.其取值范围是[-1,1],当取值为0时表示不相关,取值为[-1,0)表示负相关,取值为(0,-1],表示负相关. 目前常用的两种相关性系数为皮 ...

  6. 皮尔森 统计学相关性分析_pearson相关系数和spearman相关系数的区别

    展开全部 区别: 1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有62616964757a686964616fe78988e69d83 ...

  7. python spearman相关系数_Python spearman相关系数不匹配 .

    所以我有一个数据集,它是分子丰度作为物理参数的函数,我想确定两者之间的相互关系 . 这两个参数都跨越了几个数量级 . 因为两者不是线性相关的,所以我选择使用 scipy.stats.spearmanr ...

  8. ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient)、Spearman相关系数的简介、案例应用之详细攻略

    ML之PPMCC:PPMCC皮尔逊相关系数(Pearson correlation coefficient).Spearman相关系数的简介.案例应用之详细攻略 目录 PPMCC皮尔逊相关系数的简介 ...

  9. ML之FE:PCC皮尔逊相关系数(Pearson correlation coefficient)的简介、案例应用(与spearman相关系数对比及其代码实现)之详细攻略

    ML之FE:PCC皮尔逊相关系数(Pearson correlation coefficient)的简介.案例应用(与spearman相关系数对比及其代码实现)之详细攻略 目录 PCC/PPMCC皮尔 ...

最新文章

  1. Linux-find命令应用举例-按时间筛选和删除文件
  2. 哈哈,我的博客开通啦,欢迎光临~~~~~~~~~~~~
  3. 8则实用的Linux Shell命令
  4. 如何在Unity中播放影片
  5. 动作分析 姿态估计_关于大片人物特效少不了的人体姿态估计,这里有一份综述文章...
  6. c语言可以通过malloc在栈上,C语言内部静态成员陷阱
  7. windows服务器下的ftp server搭建
  8. 【PAT - 甲级 - 1018】Public Bike Management (带权最短路,多条最短路中加条件,DFS)
  9. 混口饭吃,谈不上喜欢
  10. 实战课堂:系统CPU高消耗的SQL筛选和最佳索引优化
  11. page compaction原理
  12. 深度学习中的激活函数
  13. 鸽巢排序(Pigeonhole sort)
  14. PHP 对接美团大众点评团购券(门票)
  15. Knowledge Graph Embedding: A Survey of Approaches and Applications (2)
  16. 不一定是黑客,也可以是守护神《运用Python成为顶级黑客》
  17. WOW技术---2, 骨骼动画
  18. 有一群海盗(不多于20人),在船上比拼酒量。过程如下:打开一瓶酒, 所有在场的人平分喝下,有几个人倒下了。再打开一瓶酒平分,又有倒下的, 再次重复...... 直到开了第4瓶酒,坐着的
  19. Windows安装Mysql并配置(安装版)
  20. 在线教育平台开发:线上教育前景预测

热门文章

  1. 获取日期(阴历,阳历,星期)js
  2. 如果AIGC继续发展,你相信哪个世界?
  3. 《少女战争》1.19上线链游玩家|不肝不氪、少女相伴
  4. STAGE1能不能直接引导放在文件系统中的STAGE2.txt
  5. 忘尘如羡 计算机乐谱,忘尘如羡钢琴简谱-数字双手-Assen捷 老虎欧巴
  6. 计算机李维,李维(南京工业大学名师——李维)_百度百科
  7. 基于Windows server 2003的DHCP服务配置
  8. VS Code 代码格式化(4个空格)(Vue)
  9. python rgb转hsv_Python colors.hsv_to_rgb方法代码示例
  10. WordPress启用network多用户版本-WPMU(转)