斯皮尔曼相关系数是统计学中三大相关系数之一
具有非常好的使用场景,对于解决我们生活中的排名类的问题时使用的比较多,其实大家更多的知道的相关系数是皮尔逊(person)相关系数,这个相关系数我们也会在后面的文章中介绍。
一、斯皮尔曼相关系数的使用场景:
斯皮尔曼等级相关(Spearman’s correlation coefficient for ranked data)主要用于解决名称数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。由英国心理学家、统计学家斯皮尔曼根据积差相关的概念推导而来,一些人把斯皮尔曼等级相关看做积差相关的特殊形式。
二、斯皮尔曼(spearman)相关系数的理解
斯皮尔曼相关性系数,通常也叫斯皮尔曼秩相关系数。“秩”,可以理解成就是一种顺序或者排序,那么它就是根据原始数据的排序位置进行求解
(1)公式
首先对两个变量(X, Y)的数据进行排序,然后记下排序以后的位置(X’, Y’),(X’, Y’)的值就称为秩次,秩次的差值就是上面公式中的di,n就是变量中数据的个数,最后带入公式就可求解结果。

(2)数据要求
因为是定序,所以我们不用管X和Y这两个变量具体的值到底差了多少,只需要算一下它们每个值所处的排列位置的差值,就可以求出相关性系数了

三、斯皮尔曼(spearman)相关系数的python代码实现

import pandas as pd
import numpy as np
X1=pd.Series([1, 2, 3, 4, 5, 6])
Y1=pd.Series([0.3, 0.9, 2.7, 2, 3.5, 5])
#处理数据删除Nan
x1=X1.dropna()
y1=Y1.dropna()
n=x1.count()
x1.index=np.arange(n)
y1.index=np.arange(n)
#分部计算
d=(x1.sort_values().index-y1.sort_values().index)**2#就是排序后的排名方差
dd=d.to_series().sum()
p=1-n*dd/(n*(n**2-1))



其实在pandas中已经有人给你写好了相关系数的函数我们只需要直接使用就可以了,corr()函数中有method参数就是可以选择使用相关系数的种类,我们只需要method='spearman’就可以了

#s.corr()函数计算
r=x1.corr(y1,method='spearman')#pandas自带函数corr
print(r,p)

结果对比
#0.942857142857143 0.9428571428571428

在这边我写了大量的斯皮尔曼相关系数是为了让自己和大家都记住这个名称,不管是以后跟人装逼来满足自己的优越感或者是让自己更趋近于专业都需要技术这个专业名字,主要是在面试中,一般的面试官是不会的,你说出他会感觉你好牛逼,说不定多了1k的工资呢,积少成多,加油吧,少年~

-----------------------------分享结束线------------------------------

喜欢可以关注【小猪课堂】公众号了解更多编程小技巧

【统计学】三大相关系数之斯皮尔曼相关系数(spearman correlation coefficient)相关推荐

  1. 数学建模:相关性分析学习——皮尔逊(pearson)相关系数与斯皮尔曼(spearman)相关系数

    目录 前言 一.基本概念及二者适用范围比较 1.什么是相关性分析 2.什么是相关系数 3.适用范围比较 二.相关系数 1.皮尔逊相关系数(Pearson correlation) 1.线性检验 2.正 ...

  2. 皮尔森(Pearson correlation coefficient)相关系数—统计学三大相关系数之一

    概述 皮尔森相关系数也称皮尔森积矩相关系数(Pearson product-moment correlation coefficient) ,是一种线性相关系数,是最常用的一种相关系数.记为r,用来反 ...

  3. 三大统计相关系数:Pearson、Spearman秩相关系数、kendall等级相关系数

    统计相关系数简介 由于使用的统计相关系数比较频繁,所以这里就利用几篇文章简单介绍一下这些系数. 相关系数:考察两个事物(在数据里我们称之为变量)之间的相关程度. 如果有两个变量:X.Y,最终计算出的相 ...

  4. 相关系数(皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数)

    目录 总体皮尔逊Person相关系数: 样本皮尔逊Person相关系数: 两点总结: 假设检验:(可结合概率论课本假设检验部分) 皮尔逊相关系数假设检验: 更好的方法:p值判断方法 皮尔逊相关系数假设 ...

  5. 相关系数之皮尔逊pearson相关系数和斯皮尔曼spearman等级相关系数(评价线性关系的相关系数)(第一部分)

    0.前言 一开始学这里的时候我感觉真的完犊子了,因为这部分的内容涉及到了概率论和数理统计的东西,概率论和数理统计虽然我现在在学,但我学的一团糟,翻书也毫无头绪,完了,现在就写一写自己怎么学的这两个系数 ...

  6. 机器学习——统计学三大相关性系数(pearson、spearman、kendall)

    应用场景 当想要比较变量间变化趋势时,可以先做出散点图从视觉上判断是否存在相关性(趋势一致).然后再采用相关性分析从统计角度衡量. 1. pearson correlation coefficient ...

  7. 统计学三大相关性系数:pearson,spearman,kendall

    目录 person correlation coefficient(皮尔森相关性系数-r) spearman correlation coefficient(斯皮尔曼相关性系数-p) kendall ...

  8. 浅尝辄止_数学建模(笔记_斯皮尔曼相关系数)

    文章目录 一.斯皮尔曼spearman相关系数 1.定义(1) 2.定义(2) 3.Matlab中计算斯皮尔曼相关系数 4.斯皮尔曼相关系数的假设检验 小样本情况,即n≤30n≤30n≤30 大样本情 ...

  9. 斯皮尔 皮尔森 肯德尔_统计学-三大相关性系数 | 生物统计学基础系列课

    原标题:统计学-三大相关性系数 | 生物统计学基础系列课 什么是生物统计学 生物统计学是一种很有用的工具,正确使用这一工具可以使科学研究更加有效,使科学研究可以更加高效的开展.因此,它是每位生物科学工 ...

  10. 机器学习中的度量——协方差、相关系数(Pearson 相关系数)

    一.相关系数第一次理解 概念:Pearson相关系数 (Pearson CorrelationCoefficient)是用来衡量两个数据集合是否在一条线上面,它用来衡量定距变量间的线性关系.[1] 注 ...

最新文章

  1. 【CF应用开发大赛】制造过程能力Cpk计算器
  2. 微信小程序-当用户拒绝了位置信息的请求时,提醒用户去设置地理位置授权
  3. Android控件的继承关系图
  4. VS2015配置freegult
  5. 【写作技巧】绪论写作要点
  6. linux 清空进程recv q,Linux中ss命令Recv-Q和Send-Q详解
  7. androidstudio打包apk 文件_Android 缩小apk体积过程记录
  8. 如何避免循环中丑陋的break和continue
  9. mysql读mdf_mdf文件导入mysql,mysql怎么导入mdf文件 | 帮助信息-动天数据
  10. FTP,HTTP各种端口号
  11. ftl模板导出excel_ftl方式导出excel
  12. mysql视图代码_mysql创建视图的实例代码
  13. 用 BusyBox 构建根文件系统
  14. 密码学,有限域GF(2^8)乘法计算,不可约多项式为P(x)=x^8+x^4+x^3+x+1
  15. srand((unsigned int)time(NULL))的理解(C语言)
  16. TcaplusDBx 黎明觉醒|一路相伴,不负期待
  17. CUMT-CTF第二次双月赛Writeup
  18. 转载之-中值滤波均值滤波
  19. 【新手学习】Excel操作指南 之一
  20. Rasa课程、Rasa培训、Rasa面试、Rasa实战系列之Understanding Rasa Deployments Premade Rasa Containers

热门文章

  1. 导入项目运行报错:Error starting ApplicationContext. To display the conditions report re-run your application
  2. Qt视频直播软件--项目实战(Day1)
  3. AD9 设置网络标号作用域
  4. 瑞萨RH850开发环境搭建
  5. 适合财务人员的财务报表分析软件有哪些?
  6. **冠图DWG图纸加密个人版**
  7. [linux]LINUX程序设计cc1--入门
  8. VSTO程序基本知识(二)
  9. 浅谈大数据时代的电子招投标
  10. Windows 7 7601.24291(2019版) 全补丁集成版ISO映像,编译于2018年11月10日