我正在处理一个大文本文件(500k行),格式如下:

S1_A16

0.141,0.009340221649748676

0.141,4.192618196894668E-5

0.11,0.014122135626540204

S1_A17

0.188,2.3292323316081486E-6

0.469,0.007928706856794138

0.172,3.726771730573038E-5

我正在使用下面的代码返回每个系列的相关系数,例如小号_A16!

import numpy as np

import pandas as pd

import csv

pd.options.display.max_rows = None

fileName = 'wordUnigramPauseTEST.data'

df = pd.read_csv(fileName, names=['pause', 'probability'])

mask = df['pause'].str.match('^S\d+_A\d+')

df['S/A'] = (df['pause']

.where(mask, np.nan)

.fillna(method='ffill'))

df = df.loc[~mask]

result = df.groupby(['S/A']).apply(lambda grp: grp['pause'].corr(grp['probability']))

print(result)

但是,在某些大文件上,这会返回错误:

Traceback (most recent call last):

File "/Users/adamg/PycharmProjects/Subj_AnswerCorrCoef/GetCorrCoef.py", line 15, in

print(result)

File "/Users/adamg/anaconda/lib/python2.7/site-packages/pandas/core/base.py", line 35, in __str__

return self.__bytes__()

File "/Users/adamg/anaconda/lib/python2.7/site-packages/pandas/core/base.py", line 47, in __bytes__

return self.__unicode__().encode(encoding, 'replace')

File "/Users/adamg/anaconda/lib/python2.7/site-packages/pandas/core/series.py", line 857, in __unicode__

result = self._tidy_repr(min(30, max_rows - 4))

TypeError: unsupported operand type(s) for -: 'NoneType' and 'int'

我知道这与print语句有关,但我该如何解决呢?

编辑:

这与最大行数有关.有谁知道如何容纳更多的行?

python pandas 行数_Python Pandas:增加最大行数相关推荐

  1. python查看dataframe数据类型_python pandas中DataFrame类型数据操作函数的方法

    python数据分析工具pandas中DataFrame和Series作为主要的数据结构. 本文主要是介绍如何对DataFrame数据进行操作并结合一个实例测试操作函数. 1)查看DataFrame数 ...

  2. python文件关键行数_Python计算大文件行数方法及性能比较

    如何使用Python快速高效地统计出大文件的总行数, 下面是一些实现方法和性能的比较. 1.readline读所有行 使用readlines方法读取所有行: def readline_count(fi ...

  3. python datetime timedelta函数_Python Pandas DatetimeIndex.to_perioddelta()用法及代码示例

    Python是进行数据分析的一种出色语言,主要是因为以数据为中心的python软件包具有奇妙的生态系统. Pandas是其中的一种,使导入和分析数据更加容易. Pandas DatetimeIndex ...

  4. python pandas 日期格式_python+pandas+时间、日期以及时间序列处理方法

    先简单的了解下日期和时间数据类型及工具 python标准库包含于日期(date)和时间(time)数据的数据类型,datetime.time以及calendar模块会被经常用到. datetime以毫 ...

  5. python项目代码量_python统计项目代码行数

    stat.py #!/usr/bin/env python3 # -*- coding: utf-8 -*- import chardet import os import sys # 定义注释的格式 ...

  6. python的describe参数_Python Pandas Series.describe()用法及代码示例

    Pandas 系列是带有轴标签的一维ndarray.标签不必是唯一的,但必须是可哈希的类型.该对象同时支持基于整数和基于标签的索引,并提供了许多方法来执行涉及索引的操作. Pandas Series. ...

  7. python代码300行程序_python小工具,15行代码秒出工资条

    公司工资条经常使用Excel制作,但是每个月都要做一遍,能不能用python写个程序自动化完成这想工作?当然可以,而且只是分分钟的事! 先来看看原始数据是什么样子: 最后做成的效果: 使用Excel每 ...

  8. python判断回文数_Python练习题---判断回文数

    设n是一个任意自然数,如果n的各位数字反向排序所得的自然数与n相等,则n被称为回文数,从键盘输入一个5位数字 ,请编写程序判断这个数字是不是回文数. 思路:先获取一个字符串,再判断该字符串是否满足是自 ...

  9. python递归判断回文数_Python实现判断回文数算法

    回文数的定义:回文数是指正序(从左向右)和倒序(从右向左)读都是一样的整数. 示例1: 输入:121 输出:True 示例2: 输入:-121 输出:False 解释: 从左向右读, 为 -121 . ...

最新文章

  1. VBScript 之文件 IO 篇
  2. Web 开发中很实用的10个效果【附源码下载】
  3. JavaScript实现网页元素的拖拽效果
  4. first-child伪类选择器没有效果(不起作用)
  5. java sendmessage_SendMessage()复制/剪切/粘贴WM_COPYDATA 0x004A
  6. node:express:error---填坑之路
  7. CSS---内外边距
  8. 吴恩达 coursera AI 第三课总结+作业答案
  9. 使用DataSet对象添加记录
  10. OneNote代码高亮插件(NoteHighLight)
  11. Hadoop中通过ToolRunner和Configured实现直接读取命令行动态出入reduce task数量,jar文件等
  12. PS5独占游戏RETURNAL:华丽的黑暗电子声音是如何制作的(新 3D 音频引擎)下
  13. Servlet 与 CGI 的比较
  14. [Mac OSX技巧] 通过命令行开启安全性与隐私中的任何来源
  15. python定时导出已发送文件_python定时发送数据库备份文件到邮箱
  16. Android网络对讲机的实现
  17. linux 运维安全,运维安全有哪些分类呢?linux学习线路图
  18. 机房动力环境监测解决方案
  19. Mybatis入门笔记
  20. 区块链的命和血汗工厂的病

热门文章

  1. oracle配置的监听文件,配置oracle监听文件
  2. Educational Codeforces Round 88 (Rated for Div. 2)(AB)
  3. [蓝桥杯][2017年第八届真题]正则问题(DFS)
  4. numpy 最大值_使用 NumPy 让你的 Python 科学计算更高效
  5. 并发请求数_nginx如何限制并发连接和请求数?
  6. python电子病历数据挖掘_数据挖掘技术在基于XML的电子病历中的应用研究
  7. PHP使用Switch语句判断星座,PHP的switch判断语句的“高级”用法详解 用switch语句怎样判断成绩的等级...
  8. 深度学习之循环神经网络(2)循环神经网络原理
  9. python中item是什么类型的游戏_文本冒险游戏(Python)中的Item类
  10. 【图像超分辨率】遥感数据的高斯金字塔尺度上推方法研究