【Python】pandas计算DataFrame各列相关系数以及显著性检验

这篇分享Python中计算pandas的DataFrame各列相关系数方法，以及介绍如何检验DataFrame两列之间相关系数的显著性。

eg:
>>>df.head()Guba   XQ      BCI     Count   Value
0   0.021   0.098   0.175   0.077   0.057
1   0.031   0.097   0.192   0.087   0.069
2   0.018   0.101   0.193   0.075   0.069
3   0.017   0.112   0.203   0.077   0.063
4   0.042   0.158   0.222   0.335   0.567

1.pearson相关系数

>>>df.corr()Guba        XQ          BCI         Count       Value
Guba    1.000000    0.175604    -0.014611   0.200896    0.256166
XQ      0.175604    1.000000    -0.390358   0.654250    0.482809
BCI     -0.014611   -0.390358   1.000000    -0.259319   -0.156440
Count   0.200896    0.654250    -0.259319   1.000000    0.832961
Value   0.256166    0.482809    -0.156440   0.832961    1.000000

2.Kendall Tau相关系数

>>>df.corr('kendall')Guba     XQ          BCI         Count       Value
Guba    1.000000    0.153904    -0.012438   0.133122    0.090707
XQ      0.153904    1.000000    -0.244304   0.374908    0.255377
BCI     -0.012438   -0.244304   1.000000    -0.157442   -0.091950
Count   0.133122    0.374908    -0.157442   1.000000    0.720916
Value   0.090707    0.255377    -0.091950   0.720916    1.000000

3.spearman秩相关

>>>df.corr('spearman')Guba        XQ          BCI         Count       Value
Guba    1.000000    0.219124    -0.017204   0.189752    0.143163
XQ      0.219124    1.000000    -0.358981   0.563938    0.427756
BCI     -0.017204   -0.358981   1.000000    -0.241880   -0.140010
Count   0.189752    0.563938    -0.241880   1.000000    0.877732
Value   0.143163    0.427756    -0.140010   0.877732    1.000000

4.显著性检验

>>>import scipy.stats as stats
>>>#输出结果第一个值为pearsonr相关系数，
>>>#第二个为p-value，所以这里Guba列和Value值是显著相关的
>>>stats.pearsonr(df['Guba'],df['Value'])
(0.256165703418037, 8.10519823509109e-07)

我们下次再见，如果还有下次的话！！！
欢迎关注微信公众号：516数据工作室

【Python】pandas计算DataFrame各列相关系数以及显著性检验相关推荐

pandas计算dataframe两列数据值相等的行号、取出DataFrame中两列值相等的行号
pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号目录 pandas计算dataframe两列数据值相等的行号.取出DataFrame中两列值相等的行号
python使用pandas计算dataframe中每个分组的分位数极差、分组数据的分位数极差（range）、使用groupby函数和agg函数计算分组的两个分位数
python使用pandas计算dataframe中每个分组的分位数极差.分组数据的分位数极差(range).使用groupby函数和agg函数计算分组的两个分位数目录
python使用pandas计算dataframe中每个分组的极差、分组数据的极差（range）、使用groupby函数和agg函数计算分组的最大值和最小值
python使用pandas计算dataframe中每个分组的极差.分组数据的极差(range).使用groupby函数和agg函数计算分组的最大值和最小值目录
R语言计算dataframe数据列中各分类的计数（类似pandas value_counts函数功能）
R语言计算dataframe数据列中各分类的计数(类似pandas value_counts函数功能) 目录 R语言计算dataframe数据列中各分类的计数(类似pandas value
Python Pandas的DataFrame对象中轴的意义，axis=0 或者axis=1代表什么意思？
Python Pandas的DataFrame对象中轴的意义,axis=0 或者axis=1代表什么意义? 通常来说:axis = 0代表行, axis=1代表列. 一.从删除操作来看axis: 举个 ...
python pandas 遍历 DataFrame
python pandas 遍历 DataFrame df = pd.DataFrame({'A': ['A0', 'A1', 'A2', 'A3'],'B': ['B0', 'B1', 'B2', ...
python pandas 分割DataFrame中的字符串及元组
python pandas 分割DataFrame中的字符串类型数据的方法文章目录 1.使用str.split()方法 2.使用join()与split()方法结合 3. 使用apply方法分割元组 ...
pandas获取dataframe数据列的数据类型、获取dataframe每类数据类型数据列的个数、使用select_dtypes函数、include参数以及exclude参数按照数据类型筛选数据
pandas获取dataframe数据列的数据类型.获取dataframe每类数据类型数据列的个数.使用select_dtypes函数.include参数以及exclude参数按照数据类型筛选数据目 ...
pandas将dataframe数据列中的年、月、日列组合成单一的日期数据列实战
pandas将dataframe数据列中的年.月.日列组合成单一的日期数据列实战目录 pandas将dataframe数据列中的年.月.日列组合成单一的日期数据列实战
R语言自定义函数计算dataframe每列中的缺失值NA的个数、缺失值问题及其填充示例
R语言自定义函数计算dataframe每列中的缺失值NA的个数.缺失值问题及其填充示例目录

【Python】pandas计算DataFrame各列相关系数以及显著性检验

【Python】pandas计算DataFrame各列相关系数以及显著性检验相关推荐

最新文章

热门文章