【Python】pandas计算DataFrame各列相关系数以及显著性检验
这篇分享Python中计算pandas的DataFrame各列相关系数方法,以及介绍如何检验DataFrame两列之间相关系数的显著性。
eg:
>>>df.head()Guba XQ BCI Count Value
0 0.021 0.098 0.175 0.077 0.057
1 0.031 0.097 0.192 0.087 0.069
2 0.018 0.101 0.193 0.075 0.069
3 0.017 0.112 0.203 0.077 0.063
4 0.042 0.158 0.222 0.335 0.567
1.pearson相关系数
>>>df.corr()Guba XQ BCI Count Value
Guba 1.000000 0.175604 -0.014611 0.200896 0.256166
XQ 0.175604 1.000000 -0.390358 0.654250 0.482809
BCI -0.014611 -0.390358 1.000000 -0.259319 -0.156440
Count 0.200896 0.654250 -0.259319 1.000000 0.832961
Value 0.256166 0.482809 -0.156440 0.832961 1.000000
2.Kendall Tau相关系数
>>>df.corr('kendall')Guba XQ BCI Count Value
Guba 1.000000 0.153904 -0.012438 0.133122 0.090707
XQ 0.153904 1.000000 -0.244304 0.374908 0.255377
BCI -0.012438 -0.244304 1.000000 -0.157442 -0.091950
Count 0.133122 0.374908 -0.157442 1.000000 0.720916
Value 0.090707 0.255377 -0.091950 0.720916 1.000000
3.spearman秩相关
>>>df.corr('spearman')Guba XQ BCI Count Value
Guba 1.000000 0.219124 -0.017204 0.189752 0.143163
XQ 0.219124 1.000000 -0.358981 0.563938 0.427756
BCI -0.017204 -0.358981 1.000000 -0.241880 -0.140010
Count 0.189752 0.563938 -0.241880 1.000000 0.877732
Value 0.143163 0.427756 -0.140010 0.877732 1.000000
4.显著性检验
>>>import scipy.stats as stats
>>>#输出结果第一个值为pearsonr相关系数,
>>>#第二个为p-value,所以这里Guba列和Value值是显著相关的
>>>stats.pearsonr(df['Guba'],df['Value'])
(0.256165703418037, 8.10519823509109e-07)
我们下次再见,如果还有下次的话!!!
欢迎关注微信公众号:516数据工作室
【Python】pandas计算DataFrame各列相关系数以及显著性检验相关推荐
- pandas计算dataframe两列数据值相等的行号、取出DataFrame中两列值相等的行号
pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号 目录 pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号
- python使用pandas计算dataframe中每个分组的分位数极差、分组数据的分位数极差(range)、使用groupby函数和agg函数计算分组的两个分位数
python使用pandas计算dataframe中每个分组的分位数极差.分组数据的分位数极差(range).使用groupby函数和agg函数计算分组的两个分位数 目录
- python使用pandas计算dataframe中每个分组的极差、分组数据的极差(range)、使用groupby函数和agg函数计算分组的最大值和最小值
python使用pandas计算dataframe中每个分组的极差.分组数据的极差(range).使用groupby函数和agg函数计算分组的最大值和最小值 目录
- R语言计算dataframe数据列中各分类的计数(类似pandas value_counts函数功能)
R语言计算dataframe数据列中各分类的计数(类似pandas value_counts函数功能) 目录 R语言计算dataframe数据列中各分类的计数(类似pandas value
- Python Pandas的DataFrame对象中轴的意义,axis=0 或者axis=1代表什么意思?
Python Pandas的DataFrame对象中轴的意义,axis=0 或者axis=1代表什么意义? 通常来说:axis = 0代表行, axis=1代表列. 一.从删除操作来看axis: 举个 ...
- python pandas 遍历 DataFrame
python pandas 遍历 DataFrame df = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', ...
- python pandas 分割DataFrame中的字符串及元组
python pandas 分割DataFrame中的字符串类型数据的方法 文章目录 1.使用str.split()方法 2.使用join()与split()方法结合 3. 使用apply方法分割元组 ...
- pandas获取dataframe数据列的数据类型、获取dataframe每类数据类型数据列的个数、使用select_dtypes函数、include参数以及exclude参数按照数据类型筛选数据
pandas获取dataframe数据列的数据类型.获取dataframe每类数据类型数据列的个数.使用select_dtypes函数.include参数以及exclude参数按照数据类型筛选数据 目 ...
- pandas将dataframe数据列中的年、月、日列组合成单一的日期数据列实战
pandas将dataframe数据列中的年.月.日列组合成单一的日期数据列实战 目录 pandas将dataframe数据列中的年.月.日列组合成单一的日期数据列实战
- R语言自定义函数计算dataframe每列中的缺失值NA的个数、缺失值问题及其填充示例
R语言自定义函数计算dataframe每列中的缺失值NA的个数.缺失值问题及其填充示例 目录
最新文章
- Java中的多线程编程(超详细总结)
- 当向后台插入或读取JSON数据遇见回车时
- 安卓布局工具---Hierarchy Viewer
- HDU - 6601 Keen On Everything But Triangle(主席树)
- 学计算机的用哪种笔记本写字,平面设计笔记本电脑,学平面设计用什么电脑好...
- ktv服务器操作系统,开源ktv客户端服务器系统
- 帆软动态分页之嵌套自定义参数据选择行数分页
- 一文7个步骤教你搭建测试web测试项目实战环境,
- cad2019菜单栏怎么调出来_AutoCAD2019工具栏没了找不到解决方法 AutoCAD2019工具栏怎么调出来...
- 解决布局点击事件穿透的问题
- led大屏按实际尺寸设计画面_微间距LED大屏幕拼接显示系统设计方案
- winrar破解注册
- Day06(上)C++继承和派生
- 【火炉炼AI】机器学习008-简单线性分类器解决二分类问题
- Linux系统或服务器运行Fastqc
- 2. 一元函数微分学
- 高通平台开发系列讲解(USB篇)Linux Android USB软件架构
- mysql sysvar int_MySQL:如何编写daemon plugin
- matlab计算π,如何计算π的值(MATLAB)
- 电子技术课程设计-正弦波发生及频率显示电路-电子线路CAD原理图