【Pandas】计算相关性系数corr()
相关:数据之间有关联,相互有影响
如:A和B 存在一定的相关性,A对B存在一定程度的影响,A变化,B也会有一定的变化
如果A和B相等 或者 B可以由A经过计算得到---->完全相关
如果B是由 A和C计算得到 ---->并且 A可以计算出B的大
部分 -----> A和B 强度相关
如果B是由 A和C计算得到 ---->并且 A可以计算出B的小
部分 -----> A和B 弱度相关
如果 A和B 毫无关系 ----> 不相关
如果B和 A相关:
A的增大导致B的减小 —> 负相关
A的增大导致B的增大 —> 正相关
相关性系数:衡量相关性强弱的
其范围是[-1,1],绝对值越靠近0,表示不相关,绝对值越靠近1,表示相关性越强
小于 0 表示负相关;大于 0 表示正相关。
构造如下数据:
import pandas as pddata = pd.DataFrame(data={'age': [2,7,10,16,20],'height': [70,90,143,166,178],'score': [98,37,103,76,53]}
)
使用corr()方法计算相关性系数:
# 计算相关性系数的列 必须都是数值型的数据!
corr = data.loc[:, ["age","height"]].corr() # 会计算两两列之间的相关性系数
print("corr\n", corr)
"""
corrage height
age 1.00000 0.96043
height 0.96043 1.00000
"""
自身与自身的相关性系数为 1
计算多列相关性系数:
corr = data.loc[:, ["age","height","score"]].corr()
print("corr\n", corr)
"""
corrage height score
age 1.000000 0.960430 -0.340053
height 0.960430 1.000000 -0.096782
score -0.340053 -0.096782 1.000000
"""
【Pandas】计算相关性系数corr()相关推荐
- 【天池基础知识】 - 查看特征变量的相关性(计算相关性系数+画出热力图+筛选特征变量+Box-Cox变换)
文章目录 1.计算相关性系数 2.画出热力图 3.筛选特征变量 4.Box-Cox变换 1.计算相关性系数 使用函数corr() 代码展示: train_corr = train_data.corr( ...
- R语言检验相关性系数的显著性:使用cor.test函数计算相关性系数的值和置信区间及其统计显著性(如果变量来自正态分布总体使用皮尔森方法pearson)
R语言检验相关性系数的显著性:使用cor.test函数计算相关性系数的值和置信区间及其统计显著性(如果变量来自正态分布总体使用皮尔森方法pearson) 目录
- python计算相关性系数
在这里说的相关性系数指的是皮尔逊相关系数https://baike.baidu.com/item/%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/3109424?fr=ala ...
- python 计算相关性系数np.corrcoef()
计算相关性是分析连续型与连续型双变量的常用方法,散点图只能直观的显示双变量(特征)之间的关系,但并不能说明关系的强弱,而相关性可以对变量之间的关系进行量化分析. 相关性系数的公式如下: 相关性系数 ...
- pandas计算皮尔逊相关系数
前置说明: 本文中使用的数据在文末提供下载,本文使用IH和IC主力合约的数据为例 目录 1. 概念 2. 计算过程 1. 概念 皮尔逊(pearson)相关系数:用于判断数据是否线性相关的方法 皮尔逊 ...
- pandas中使用rolling.corr函数计算两个时间序列数据列之间的滚动相关性(Rolling correlations)、例如,计算两种商品销售额之间的3个月的滚动相关性
pandas中使用rolling.corr函数计算两个时间序列数据列之间的滚动相关性(Rolling correlations).例如,计算两种商品销售额之间的3个月的滚动相关性 目录
- 皮尔森相关性系数的计算python代码(四)(热力图版)
部分代码: import numpy import pandas as pd import numpy as np from matplotlib.font_manager import FontPr ...
- 皮尔森相关性系数的计算python代码(三)
部分代码 import os import pandas as pd import numpy as np from scipy.stats import pearsonrdef Pearson(da ...
- 皮尔森相关性系数的计算python代码(一)
部分代码 from math import sqrt import numpy as np import pandas as pddef excel_one_line_to_list():def mu ...
最新文章
- 考研加油!考研的兄弟姐妹们!
- python使用matplotlib可视化、自定义Y轴轴标签刻度旋转的角度(customize degree rotating axis tick labels in matplotlib)
- 示范园谋定小农户-丰收节交易会·万祥军:衔接现代农业
- 项目遇到的问题以及解决
- iview日期控件 双向绑定日期
- 学习笔记之C / C++
- linux下添加新硬盘的方法
- 微信带翅膀昵称ʚɞ,这也太可了吧
- plsql突然无法连接数据库,原来是tnsnames.ora文件出了问题
- bzoj 1641: [Usaco2007 Nov]Cow Hurdles 奶牛跨栏(floyd)
- 怎样定义函数,调用函数
- bzoj1692 [Usaco2007 Dec]队列变换
- pads 2007 安装完成后, 出现 no license 的解决方法
- android版wifi管家下载安装,腾讯WiFi管家最新版下载安装
- 病毒木马查杀实战第022篇:txt病毒研究
- php-ftm,FTM/MTF的激素种类
- 基于jsp+mysql+ssm乐轩公司订餐系统-计算机毕业设计
- C语言,有一个已排好序的数组,要求输入一个数后,按原来排序的规律将它插入数组中
- Win10移动热点无法打开,手机无法连接电脑热点
- 《C陷阱与缺陷》书评兼感想