问题:

  • 给定成分数据,使用Pandas计算各成分之间的相关系数

代码

  • 调用函数:pandas.corr()

1、单个文件的情况

import pandas as pd# 指定文件名称,这里假设数据文件data.csv与此文件位于相同的目录
file_name = './data.csv'# 读取数据文件
data = pd.read_csv(file_name)# 可以通过打印数据表的行、列信息以级前几行来简单的了解数据
# print(data.shape)
# print(data.head())# 调用corr()函数计算数据列之间的相关系数
corr = data.corr();# 把相关系数结果存储到新的文件中,路径默认为当前文件夹
corr.to_csv('correlation.csv')

2、多个文件的情况

import pandas as pd# 指定数据文件的路径
file_name_1 = '../dic1/dic2/name1.csv'
file_name_2 = '../dic1/dic2/name2.csv'
file_name_3 = '../dic1/dic2/name3.csv'
file_name_4 = '../dic1/dic2/name4.csv'# 将数据文件的路径统一到列表中
lists = {file_name_1, file_name_2, file_name_3, file_name_4}# 使用循环来对数据文件逐个操作
for file_name in lists:# 读取数据文件data = pd.read_csv(file_name)# 计算数据列之间的相关系数corr = data.corr();# 为了区分不同的文件计算得到的相关系数,此处通过数据文件名做区分,用split()函数截取原始的数据文件名out_name = file_name.split('/')[3]# 将每个数据文件的相关系数计算结果存储到当前路径下,文件名以“correlation与文件名”做拼接corr.to_csv('./correlation_' + out_name)

Python使用Pandas计算相关系数相关推荐

  1. python使用pandas计算dataframe中每个分组的分位数极差、分组数据的分位数极差(range)、使用groupby函数和agg函数计算分组的两个分位数

    python使用pandas计算dataframe中每个分组的分位数极差.分组数据的分位数极差(range).使用groupby函数和agg函数计算分组的两个分位数 目录

  2. python使用pandas计算dataframe中每个分组的极差、分组数据的极差(range)、使用groupby函数和agg函数计算分组的最大值和最小值

    python使用pandas计算dataframe中每个分组的极差.分组数据的极差(range).使用groupby函数和agg函数计算分组的最大值和最小值 目录

  3. python求相关系数_python pandas 计算相关系数

    pandas 中df 对象自带相关性计算方法corr() , 可以用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数.Kendall Tau相关系数和spearman秩相 ...

  4. python的pandas计算5天滑动平均气温,并批量计算春季起始日

    近期有个计算春天的需求,网上搜了下大多是用MATLAB中的smooth函数的思路写的.正好学到pandas几个强大的数据处理方法,想着自己试试. pandas提供了大量能使我们快速便捷地处理数据的函数 ...

  5. python,pandas计算布林带(Bollinger Band)

    import pandas as pd import numpy as np import pandas_datareader.data as webdef boll_bands(data, nday ...

  6. python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例

    功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...

  7. python pandas 条件求和_python 使用pandas计算累积求和的方法

    python 使用pandas计算累积求和的方法 使用pandas下的cumsum函数 cumsum:计算轴向元素累积加和,返回由中间结果组成的数组.重点就是返回值是"由中间结果组成的数组& ...

  8. python计算线性相关系数_Python+pandas计算数据相关系数(person、Kendall、spearman)

    pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数.Kendall Tau相关系数和spearman秩相 ...

  9. Python+pandas计算数据相关系数

    本文主要演示pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数.Kendall Tau相关系数和spea ...

最新文章

  1. 39个超实用jQuery实例应用特效
  2. Linux必知必会的目录与启动过程
  3. iOS开发CocoaPods使用
  4. 数据类型,运算符和表达式03 - 零基础入门学习C语言04
  5. oracle的schema的基本概念及与User的区别
  6. 【项目管理】上线切割计划实践
  7. java写入文件编码格式为ansi_Windows10 bat批处理删除 快速打开文件夹 固定到开始菜单或任务栏...
  8. 金蝶云系统服务器,金蝶系统云服务器已离线
  9. Matlab标准语音库 Timit Database
  10. python语言写九九乘法表_怎么使用Python语言写一个九九乘法表?
  11. nlp基础—6.EM算法
  12. Linux netstat命令详解
  13. 计算机文字录入ppt,计算机基础——文字录入.ppt
  14. Android扫描wifi二维码自动连接wifi
  15. 现在完成进行时和现在完成时的区别
  16. Nmap的下载与基本命令运用
  17. python程序改变图像的分辨率
  18. 同步时序逻辑电路功能分析之同步六进制减法计数器
  19. C程序设计语言 特别版 pdf
  20. 华为鸿蒙8g运存够用吗,华为是最强的国产安卓手机,6G和8G运存的区别是什么?...

热门文章

  1. Windows 系统优化大全(完整)
  2. SYD88811新DTM测试
  3. 截图工具因为计算机无法使用,win7系统电脑自带截图工具不能用失灵了的解决方法...
  4. 慧据价值 链接未来丨第八届数据技术嘉年华大会全议程呈现
  5. HDU 5336 XYZ and Drops(模拟十滴水游戏 BFS)
  6. Python自动检查哪位学生未提交作业
  7. 神州数码交换机CS6200命令学习(三)
  8. 由浅入深玩转华为WLAN—11 安全认证配置(4)AC内置Portal认证(网页认证)
  9. mybatis 实现动态数据源连接
  10. Windows 取证之$MFT