斯皮尔曼相关性系数,通常也叫斯皮尔曼秩相关系数。“秩”,可以理解成就是一种顺序或者排序,那么它就是根据原始数据的排序位置进行求解,这种表征形式就没有了求皮尔森相关性系数时那些限制。下面来看一下它的计算公式:


计算过程就是:首先对两个变量(X, Y)的数据进行排序,然后记下排序以后的位置(X’, Y’),(X’, Y’)的值就称为秩次,秩次的差值就是上面公式中的di,n就是变量中数据的个数,最后带入公式就可求解结果。举个例子吧,假设我们实验的数据如下:


带入公式,求得斯皮尔曼相关性系数:ρs= 1-6*(1+1+1+9)/6*35=0.657

而且,即便在变量值没有变化的情况下,也不会出现像皮尔森系数那样分母为0而无法计算的情况。另外,即使出现异常值,由于异常值的秩次通常不会有明显的变化(比如过大或者过小,那要么排第一,要么排最后),所以对斯皮尔曼相关性系数的影响也非常小!

python代码实现:

import pandas as pd
df = pd.DataFrame({'A':[5,91,3],'B':[90,15,66],'C':[93,27,3]})
print(df.corr())
print(df.corr('spearman'))
print(df.corr('kendall'))
df2 = pd.DataFrame({'A':[7,93,5],'B':[88,13,64],'C':[93,27,3]})
print(df2.corr())
print(df2.corr('spearman'))
print(df2.corr('kendall'))

spearman相关系数和pearson相关系数选择:

1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,
  就是效率没有pearson相关系数高。
2.上述任一条件不满足,就用spearman相关系数,不能用pearson相关系数。
3.两个定序测量数据之间也用spearman相关系数,不能用pearson相关系数。

参考:https://blog.csdn.net/qq_30138291/article/details/79801777

http://blog.sina.com.cn/s/blog_69e75efd0102wmd2.html

统计学三大相关系数之斯皮尔曼(spearman)相关系数相关推荐

  1. 数学建模——皮尔逊person相关系数VS斯皮尔曼spearman相关系数学习笔记

    皮尔逊 person相关系数和斯皮尔曼spearman等级相关系数,它们可用来衡量两个变量之间的相关性的大小,根据 数据满足的不同条件,我们要选择不同的相关系数进行计算和分析(建模论文中最容易用错的方 ...

  2. 相关系数(皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数)

    目录 总体皮尔逊Person相关系数: 样本皮尔逊Person相关系数: 两点总结: 假设检验:(可结合概率论课本假设检验部分) 皮尔逊相关系数假设检验: 更好的方法:p值判断方法 皮尔逊相关系数假设 ...

  3. 模型5.4——斯皮尔曼spearman相关系数

    目录 1.解决问题 2.条件 3.定义 4.步骤 4.1 计算斯皮尔曼相关系数 4.2 两种相关系数的对比 4.3 斯皮尔曼相关系数的假设检验 4.3.1 小样本的情况(< 30) 4.3.2 ...

  4. 相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第一部分)

    0.前言 一开始学这里的时候我感觉真的完犊子了,因为这部分的内容涉及到了概率论和数理统计的东西,概率论和数理统计虽然我现在在学,但我学的一团糟,翻书也毫无头绪,完了,现在就写一写自己怎么学的这两个系数 ...

  5. 数学建模-斯皮尔曼spearman相关系数

  6. 皮尔森 统计学相关性分析_pearson相关系数和spearman相关系数的区别

    展开全部 区别: 1.连续数据,正态分布,线性关系,用pearson相关系数是最恰当,当然用spearman相关系数也可以,效率没有62616964757a686964616fe78988e69d83 ...

  7. pearson和spearman相关系数

    文章目录 一.pearson相关系数 二.spearman相关系数 三.两者区别 一.pearson相关系数 评估两个连续变量之间的***相关关系,计算公式如下 二.spearman相关系数 斯皮尔曼 ...

  8. 斯皮尔曼spearman相关系

    斯皮尔曼spearman相关系数 用SPSS计算

  9. 统计学三大相关系数---Pearson、Spearman、kendall / RMSE与实现(附代码)

    算法实现:这里直接调库 from scipy import stats import numpy as np val_PLCC = stats.pearsonr(y_pred, y_val)[0] v ...

  10. 皮尔森(Pearson correlation coefficient)相关系数—统计学三大相关系数之一

    概述 皮尔森相关系数也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数,是最常用的一种相关系数.记为r,用来反 ...

最新文章

  1. Scrapy学习篇(九)之文件与图片下载
  2. HTTP请求头中各字段解释
  3. linux之head命令
  4. 逃跑吧少年服务器临时维护中,逃跑吧少年—逃跑吧少年5月30日更新 主动技能解锁...
  5. Android Studio、 补充知识以及主要组件
  6. 从块结构谈表的存储参数与性能之间的关系
  7. MySQL-数据类型 整理总结
  8. 海量文件或数据 导致高并发,高流量处理方案
  9. 牛逼!Python分析5万多场英雄联盟比赛,教你轻松预测胜负!
  10. 机械专业与计算机专业哪个专业更好,机械类哪个专业好
  11. 什么是区块链? 区块链的入门教程~
  12. 怎么进入本地组策略编辑器
  13. android studio代理设置
  14. 基督里一切的丰盛_司布真
  15. html自动生成拼音五笔,如何根据单元格汉字自动生成拼音码和五笔码
  16. cpu平均负载高的几种情况
  17. SPRD Camera sensor
  18. Android使用SharedPreferences存储数据
  19. Excel的图表:组成元素、图表类型与用途、图表可视化大全
  20. 估值11亿美元新独角兽诞生,网易有道CEO周枫:宁愿十年挖一口井

热门文章

  1. Xilinx VIVADO 中 DDR3(AXI4)的使用(3)模块封装
  2. c# 毕设计算机毕设
  3. 桑拿锁技术升级:桑拿手牌复制休矣!
  4. thinkphp mysql order_ThinkPHP中order()使用方法详解
  5. MSET key value [key value ...]
  6. idea-插件开发 Dialogs
  7. ppm11521*5761
  8. 开关电源—Buck电路原理及其仿真
  9. 2018 阿里 声学模型 语言模型
  10. ASP.NET学习(一)