什么是相关性

相关性分析是指对两个或多个具备相关性的变量元素进行分析,从而衡量两个变量因素的相关密切程度。相关性的元素之间需要存在一定的联系或者概率才可以进行相关性分析。

相关性的三种方法

皮尔逊相关系数(pearson):pearson相关系数连续性变量才可采用
肯达相关系数(kendall):Kendall相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。
斯皮尔曼相关系数(spearman):spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。

两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关
分析的适用条件时,使用Spearman秩相关系数来描述,当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用spearman或kendall相关。

数据

pandas.DataFrame.corr(method='pearson')
'参数'
"""
method= pearson,kendall,spearman 对应着三种方法
默认meathod = pearson
"""
import pandas as pd
data = pd.read_excel("D:\sheet\corr.xlsx")
df = data.iloc[:20,:] # 相关性分析的时候不需要用到 均值和标准差
print(df.corr())# 这组数据采用默认Pearson进行相关性分析
体重       腰围      脉搏      单杠      弯曲     跳高
体重  1.000000    0.870243    -0.365762   -0.389694   -0.493084   -0.226296
腰围  0.870243    1.000000    -0.352892   -0.552232   -0.645598   -0.191499
脉搏  -0.365762   -0.352892   1.000000    0.150648    0.225038    0.034933
单杠  -0.389694   -0.552232   0.150648    1.000000    0.695727    0.495760
弯曲  -0.493084   -0.645598   0.225038    0.695727    1.000000    0.669206
跳高  -0.226296   -0.191499   0.034933    0.495760    0.669206    1.000000

相关关系不等因果关系

相关性表示两个变量同时变化,而因果关系是一个变量导致另一个变量变化,例如,一项统计显示,游泳时溺水人数越多,冰淇淋销售就越多,也就是游泳溺水人数和冰淇淋销售量之间呈线性正相关关系。由此可以得出吃冰淇淋就会增加游泳溺水的风险的结论吗?
显然不能得出这样的结论,这两个事件都受到了夏天气温升高的影响,是否吃冰淇淋跟溺水不存在任何因果关系。

python相关性分析相关推荐

  1. python 相关性分析_数据分析---用Python进行相关性分析(兼谈假设检验)

    一.相关关系和相关系数 世上除了因果关系,还有相关关系. 有一个叫"相关系数"的指标来量化两个事物之间的相关程度. 其中相关系数用"r"表示,取值范围介于-1和 ...

  2. python 相关性分析原理及代码详细介绍

    一.相关性分析简介 相关性分析(correlation analysis)是指对两个或多个具备相关关系的变量进行线性相关分析,从而衡量变量间的相关程度或密切程度.相关性程度即为相关性系数R,R的取值范 ...

  3. python相关性分析_python实践统计学中的三大相关性系数,并绘制相关性分析的热力图...

    本文首发地址: https://yishuihancheng.blog.csdn.net/article/details/83547648 欢迎关注我的博客[Together_CZ],我是沂水寒城! ...

  4. python相关性分析后怎样删除特征_震惊!数据分析还能这样做?

    原标题:震惊!数据分析还能这样做? 数据分析概述 数据分析完整工作流程 关于数据分析的大体流程这里以图形的形式展现给大家,就不做过多的讲述. 数据探索与相关性分析 这一部分是直接从数据分析工作流程中的 ...

  5. [Python] 相关性分析

    餐饮销量数据相关性分析 分析菜品销售量之间的相关性得到不同菜品之间的关系,比如是替补菜品.互补菜品或者没有关系,为原材料采购提供参考. 数据源示例: #-*- coding: utf-8 -*- #餐 ...

  6. python相关性分析_Python:相关性分析

    一.相关关系:相关分析与回归分析在实际应用中有密切关系.然而在回归分析中,所关心的是一个随机变量Y对另一个(或一组)随机变量X的依赖关系的函数形式.而在相关分析中 ,所讨论的变量的地位一样,分析侧重于 ...

  7. python相关性分析特征过滤_特征选择-Filter过滤法后续(相关,互信息法)

    3.1.2 相关性过滤 方差挑选完毕之后,我们就要考虑下一个问题:相关性了.我们希望选出与标签相关且有意义的特征,因为这样的 特征能够为我们提供大量信息.如果特征与标签无关,那只会白白浪费我们的计算内 ...

  8. python相关性分析特征过滤_Python相关性分析

    导言机器学习的步骤 1)提出问题 :一切的机器学习目标都是为了解决生活或工作的实际问题 2)理解数据 : 采集数据(根据研究问题采集相关数据) 导入数据(数据从Excel.数据库.网络中导入到Phyt ...

  9. python相关性分析及画图_数据分析Python手绘图形库有哪些?

    数据分析Python手绘图形库有哪些,今天,给大家介绍一个很酷的 Python 手绘风格可视化神包:cutecharts. 和 Matplotlib .pyecharts 等常见的图表不同,使用这个包 ...

  10. python相关性分析的散点图怎么做_Python:matplotlib 和 Seaborn 之散点图和相关性 (三十二)...

    散点图 如果我们想研究两个数字变量之间的关系,通常会选择散点图.在散点图中,每个数据点都单独表示为一个点,x 轴对应一个特征值,y 轴对应另一个特征值.创建散点图的一个基本方式是利用 Matplotl ...

最新文章

  1. 前后端分离的探索(二)
  2. (zhuan) Recurrent Neural Network
  3. JS中IE与W3C不同的地方
  4. 按键精灵脚本 php,HTML_按键精灵 脚本-学习VBS的一个不错的教程,今天我就从总体上对VBS进行介 - phpStudy...
  5. python不同层级模块的导入和文件的读写
  6. 独角兽公司 Sprinklr 获 1.05 亿美元 F 轮融资,估值 18 亿美元
  7. 2019人工智能实战 第六次作业 段峙宇
  8. 主机关机后第二天就无法开机_iphone没电自动关机后无法充电和开机的解决办法!(亲身经历)...
  9. iTunes 安装ipa文件到iPhone上
  10. mysql delete|删除 命令的注意点
  11. 现代化蔬菜大棚采用什么和计算机自动控制,温室大棚自动控制系统存在的意义以及未来的发展...
  12. NFS==network file system
  13. 键盘按下某键 停止运行java_Java:按下“Q”键后终止while循环
  14. android电力监控平台,基于Android和电力载波智能楼宇监控系统的制作方法
  15. 小程序组件传值方法调用
  16. java list逆序_Java使用ListIterator逆序ArrayList
  17. 在Vue中使用高德地图
  18. Android开发类似苹果iOS 7的沉浸式状态栏
  19. fio模拟mysql写入速度_fio 测试工具
  20. 日本诞生世界首个机器人农场,取代人工劳作

热门文章

  1. virtualBox报错 0x80004005
  2. javascript 字符串的排列与组合
  3. uni-app 创建新页面和页面的配置
  4. 内核编译报错: warning: the frame size of 1072 bytes is larger than 1024 bytes
  5. 经典数字电路 设计案例
  6. Idea标记(或书签)功能
  7. 用Python验证指数基金定投策略
  8. Android CameraX 仿一甜相机(录像、拍照、可调节尺寸、聚焦、照明、网格线),最全的CameraX教程
  9. 原生JS实现图片爆炸特效
  10. 香港、英国、南非...中国!区块链将迎来又一波高潮?