相关:数据之间有关联,相互有影响

如:A和B 存在一定的相关性,A对B存在一定程度的影响,A变化,B也会有一定的变化

如果A和B相等 或者 B可以由A经过计算得到---->完全相关
如果B是由 A和C计算得到 ---->并且 A可以计算出B的部分 -----> A和B 强度相关
如果B是由 A和C计算得到 ---->并且 A可以计算出B的部分 -----> A和B 弱度相关
如果 A和B 毫无关系 ----> 不相关


如果B和 A相关:
A的增大导致B的减小 —> 负相关
A的增大导致B的增大 —> 正相关

相关性系数:衡量相关性强弱的

其范围是[-1,1],绝对值越靠近0,表示不相关,绝对值越靠近1,表示相关性越强
小于 0 表示负相关;大于 0 表示正相关。

构造如下数据:

import pandas as pddata = pd.DataFrame(data={'age': [2,7,10,16,20],'height': [70,90,143,166,178],'score': [98,37,103,76,53]}
)

使用corr()方法计算相关性系数:

# 计算相关性系数的列 必须都是数值型的数据!
corr = data.loc[:, ["age","height"]].corr()        # 会计算两两列之间的相关性系数
print("corr\n", corr)
"""
corrage   height
age     1.00000  0.96043
height  0.96043  1.00000
"""

自身与自身的相关性系数为 1

计算多列相关性系数:

corr = data.loc[:, ["age","height","score"]].corr()
print("corr\n", corr)
"""
corrage    height     score
age     1.000000  0.960430 -0.340053
height  0.960430  1.000000 -0.096782
score  -0.340053 -0.096782  1.000000
"""

【Pandas】计算相关性系数corr()相关推荐

  1. 【天池基础知识】 - 查看特征变量的相关性(计算相关性系数+画出热力图+筛选特征变量+Box-Cox变换)

    文章目录 1.计算相关性系数 2.画出热力图 3.筛选特征变量 4.Box-Cox变换 1.计算相关性系数 使用函数corr() 代码展示: train_corr = train_data.corr( ...

  2. R语言检验相关性系数的显著性:使用cor.test函数计算相关性系数的值和置信区间及其统计显著性(如果变量来自正态分布总体使用皮尔森方法pearson)

    R语言检验相关性系数的显著性:使用cor.test函数计算相关性系数的值和置信区间及其统计显著性(如果变量来自正态分布总体使用皮尔森方法pearson) 目录

  3. python计算相关性系数

    在这里说的相关性系数指的是皮尔逊相关系数https://baike.baidu.com/item/%E7%9B%B8%E5%85%B3%E7%B3%BB%E6%95%B0/3109424?fr=ala ...

  4. python 计算相关性系数np.corrcoef()

    计算相关性是分析连续型与连续型双变量的常用方法,散点图只能直观的显示双变量(特征)之间的关系,但并不能说明关系的强弱,而相关性可以对变量之间的关系进行量化分析.   相关性系数的公式如下: 相关性系数 ...

  5. pandas计算皮尔逊相关系数

    前置说明: 本文中使用的数据在文末提供下载,本文使用IH和IC主力合约的数据为例 目录 1. 概念 2. 计算过程 1. 概念 皮尔逊(pearson)相关系数:用于判断数据是否线性相关的方法 皮尔逊 ...

  6. pandas中使用rolling.corr函数计算两个时间序列数据列之间的滚动相关性(Rolling correlations)、例如,计算两种商品销售额之间的3个月的滚动相关性

    pandas中使用rolling.corr函数计算两个时间序列数据列之间的滚动相关性(Rolling correlations).例如,计算两种商品销售额之间的3个月的滚动相关性 目录

  7. 皮尔森相关性系数的计算python代码(四)(热力图版)

    部分代码: import numpy import pandas as pd import numpy as np from matplotlib.font_manager import FontPr ...

  8. 皮尔森相关性系数的计算python代码(三)

    部分代码 import os import pandas as pd import numpy as np from scipy.stats import pearsonrdef Pearson(da ...

  9. 皮尔森相关性系数的计算python代码(一)

    部分代码 from math import sqrt import numpy as np import pandas as pddef excel_one_line_to_list():def mu ...

最新文章

  1. 考研加油!考研的兄弟姐妹们!
  2. python使用matplotlib可视化、自定义Y轴轴标签刻度旋转的角度(customize degree rotating axis tick labels in matplotlib)
  3. 示范园谋定小农户-丰收节交易会·万祥军:衔接现代农业
  4. 项目遇到的问题以及解决
  5. iview日期控件 双向绑定日期
  6. 学习笔记之C / C++
  7. linux下添加新硬盘的方法
  8. 微信带翅膀昵称ʚɞ,这也太可了吧
  9. plsql突然无法连接数据库,原来是tnsnames.ora文件出了问题
  10. bzoj 1641: [Usaco2007 Nov]Cow Hurdles 奶牛跨栏(floyd)
  11. 怎样定义函数,调用函数
  12. bzoj1692 [Usaco2007 Dec]队列变换
  13. pads 2007 安装完成后, 出现 no license 的解决方法
  14. android版wifi管家下载安装,腾讯WiFi管家最新版下载安装
  15. 病毒木马查杀实战第022篇:txt病毒研究
  16. php-ftm,FTM/MTF的激素种类
  17. 基于jsp+mysql+ssm乐轩公司订餐系统-计算机毕业设计
  18. C语言,有一个已排好序的数组,要求输入一个数后,按原来排序的规律将它插入数组中
  19. Win10移动热点无法打开,手机无法连接电脑热点
  20. 《C陷阱与缺陷》书评兼感想

热门文章

  1. MOSFET, MOS管, 开关管笔记
  2. 华为 A800-9000 服务器 离线安装MindX DL 可视化环境+监控
  3. 如何在低代码开发平台上,实施表单设计流程
  4. 基于海思平台与QT框架的高效视频显示
  5. 一文带你了解Room数据库
  6. 桌面远程控制计算机名字和,Win7系统远程控制其他计算机桌面教程
  7. 截面数据 缺少行业风险
  8. 双十一的“后方战场”,闲鱼和转转吃饱了吗?
  9. 摩托罗拉的新一代智能家庭和婴儿监护亮相香港电子产品展
  10. 基于51单片机数码管显示