Python使用Pandas计算相关系数
问题:
- 给定成分数据,使用Pandas计算各成分之间的相关系数
代码
- 调用函数:pandas.corr()
1、单个文件的情况
import pandas as pd# 指定文件名称,这里假设数据文件data.csv与此文件位于相同的目录
file_name = './data.csv'# 读取数据文件
data = pd.read_csv(file_name)# 可以通过打印数据表的行、列信息以级前几行来简单的了解数据
# print(data.shape)
# print(data.head())# 调用corr()函数计算数据列之间的相关系数
corr = data.corr();# 把相关系数结果存储到新的文件中,路径默认为当前文件夹
corr.to_csv('correlation.csv')
2、多个文件的情况
import pandas as pd# 指定数据文件的路径
file_name_1 = '../dic1/dic2/name1.csv'
file_name_2 = '../dic1/dic2/name2.csv'
file_name_3 = '../dic1/dic2/name3.csv'
file_name_4 = '../dic1/dic2/name4.csv'# 将数据文件的路径统一到列表中
lists = {file_name_1, file_name_2, file_name_3, file_name_4}# 使用循环来对数据文件逐个操作
for file_name in lists:# 读取数据文件data = pd.read_csv(file_name)# 计算数据列之间的相关系数corr = data.corr();# 为了区分不同的文件计算得到的相关系数,此处通过数据文件名做区分,用split()函数截取原始的数据文件名out_name = file_name.split('/')[3]# 将每个数据文件的相关系数计算结果存储到当前路径下,文件名以“correlation与文件名”做拼接corr.to_csv('./correlation_' + out_name)
Python使用Pandas计算相关系数相关推荐
- python使用pandas计算dataframe中每个分组的分位数极差、分组数据的分位数极差(range)、使用groupby函数和agg函数计算分组的两个分位数
python使用pandas计算dataframe中每个分组的分位数极差.分组数据的分位数极差(range).使用groupby函数和agg函数计算分组的两个分位数 目录
- python使用pandas计算dataframe中每个分组的极差、分组数据的极差(range)、使用groupby函数和agg函数计算分组的最大值和最小值
python使用pandas计算dataframe中每个分组的极差.分组数据的极差(range).使用groupby函数和agg函数计算分组的最大值和最小值 目录
- python求相关系数_python pandas 计算相关系数
pandas 中df 对象自带相关性计算方法corr() , 可以用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数.Kendall Tau相关系数和spearman秩相 ...
- python的pandas计算5天滑动平均气温,并批量计算春季起始日
近期有个计算春天的需求,网上搜了下大多是用MATLAB中的smooth函数的思路写的.正好学到pandas几个强大的数据处理方法,想着自己试试. pandas提供了大量能使我们快速便捷地处理数据的函数 ...
- python,pandas计算布林带(Bollinger Band)
import pandas as pd import numpy as np import pandas_datareader.data as webdef boll_bands(data, nday ...
- python计算csv文件内的数据_Python利用pandas计算多个CSV文件数据值的实例
功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件 pip install pandas import pandas as pd import glob,os,sys in ...
- python pandas 条件求和_python 使用pandas计算累积求和的方法
python 使用pandas计算累积求和的方法 使用pandas下的cumsum函数 cumsum:计算轴向元素累积加和,返回由中间结果组成的数组.重点就是返回值是"由中间结果组成的数组& ...
- python计算线性相关系数_Python+pandas计算数据相关系数(person、Kendall、spearman)
pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数.Kendall Tau相关系数和spearman秩相 ...
- Python+pandas计算数据相关系数
本文主要演示pandas中DataFrame对象corr()方法的用法,该方法用来计算DataFrame对象中所有列之间的相关系数(包括pearson相关系数.Kendall Tau相关系数和spea ...
最新文章
- 39个超实用jQuery实例应用特效
- Linux必知必会的目录与启动过程
- iOS开发CocoaPods使用
- 数据类型,运算符和表达式03 - 零基础入门学习C语言04
- oracle的schema的基本概念及与User的区别
- 【项目管理】上线切割计划实践
- java写入文件编码格式为ansi_Windows10 bat批处理删除 快速打开文件夹 固定到开始菜单或任务栏...
- 金蝶云系统服务器,金蝶系统云服务器已离线
- Matlab标准语音库 Timit Database
- python语言写九九乘法表_怎么使用Python语言写一个九九乘法表?
- nlp基础—6.EM算法
- Linux netstat命令详解
- 计算机文字录入ppt,计算机基础——文字录入.ppt
- Android扫描wifi二维码自动连接wifi
- 现在完成进行时和现在完成时的区别
- Nmap的下载与基本命令运用
- python程序改变图像的分辨率
- 同步时序逻辑电路功能分析之同步六进制减法计数器
- C程序设计语言 特别版 pdf
- 华为鸿蒙8g运存够用吗,华为是最强的国产安卓手机,6G和8G运存的区别是什么?...
热门文章
- Windows 系统优化大全(完整)
- SYD88811新DTM测试
- 截图工具因为计算机无法使用,win7系统电脑自带截图工具不能用失灵了的解决方法...
- 慧据价值 链接未来丨第八届数据技术嘉年华大会全议程呈现
- HDU 5336 XYZ and Drops(模拟十滴水游戏 BFS)
- Python自动检查哪位学生未提交作业
- 神州数码交换机CS6200命令学习(三)
- 由浅入深玩转华为WLAN—11 安全认证配置(4)AC内置Portal认证(网页认证)
- mybatis 实现动态数据源连接
- Windows 取证之$MFT