本文要点刚要:

(一)读文本文件格式的数据函数:read_csv,read_table

1.读不同分隔符的文本文件,用参数sep

2.读无字段名(表头)的文本文件 ,用参数names

3.为文本文件制定索引,用index_col

4.跳行读取文本文件,用skiprows

5.数据太大时需要逐块读取文本数据用chunksize进行分块。

(二)将数据写成文本文件格式函数:to_csv

范例如下:

(一)读取文本文件格式的数据集

1.read_csv和read_table的区别:

#read_csv默认读取用逗号分隔符的文件,不需要用sep来指定分隔符

import pandas as pd

pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.csv')

#read_csv如果读的是用非逗号分隔符的文件,必须要用sep指定分割符,不然读出来的是原文件的样子,数据没被分割开

import pandas as pd

pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt')

#与上面的例子可以对比一下区别

import pandas as pd

pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')

#read_table读取文件时必须要用sep来指定分隔符,否则读出来的数据是原始文件,没有分割开。

import pandas as pd

pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.csv')

#read_table读取数据必须指定分隔符

import pandas as pd

pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')

2.读取文本文件时不用header和names指定表头时,默认第一行为表头

#用header=None表示数据集没有表头,会默认用阿拉伯数字填充表头和索引

pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|',header=None)

#用names可以自定义表头

pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|',

names=['x1','x2','x3','x4','x5'])

3.默认用阿拉伯数字指定索引;用index_col指定某一列作为索引

names=['x1','x2','x3','x4','x0']

pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|',

names=names,index_col='x0')

4.以下示例是用skiprows将hello对应的行跳过后读取其他行数据,不管首行是否作为表头,都是将表头作为第0行开始数

可以对比一下三个例子的区别进行理解

pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt')

names=['x1','x2','x3','x4','x0']

pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',names=names,

skiprows=[0,3,6])

pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',

skiprows=[0,3,6])

pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',header=None,

skiprows=[0,3,6])

5.分块读取,data1.txt中总共8行数据,按照每块3行来分,会读3次,第一次3行,第二次3行,第三次1行数据进行读取。

注意这里在分块的时候跟跳行读取不同的是,表头没作为第一行进行分块读取,可通过一下两个例子对比进行理解。

chunker = pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',chunksize=3)

for m in chunker:

print(len(m))

print m

chunker = pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',header=None,

chunksize=3)

for m in chunker:

print(len(m))

print m

(二)将数据写入文本格式用to_csv

以data.txt为例,注意写出文件时,将索引也写入了

data=pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')

print data

#可以用index=False禁止索引的写入。

data=pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')

data.to_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\outdata.txt',sep='!',index=False)

#可以用columns指定写入的列

data=pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')

data.to_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\outdata2.txt',sep=',',index=False,

columns=['a','c','d'])

python读取txt文件第一行-python读取文本文件数据相关推荐

  1. Java读取UTF-8格式txt文件第一行出现乱码及解决;Java读带有BOM的UTF-8文件乱码原因及解决方法(转载)...

    原文地址:http://blog.csdn.net/jackpk/article/details/5702964/ Java读取UTF-8的txt文件第一行出现乱码"?"及解决 t ...

  2. python读取txt文件的行数_python读取txt文件符合条件的行数-女性时尚流行美容健康娱乐mv-ida网...

    女性时尚流行美容健康娱乐mv-ida网 mvida时尚娱乐网 首页 美容 护肤 化妆技巧 发型 服饰 健康 情感 美体 美食 娱乐 明星八卦 首页 > 高级搜索 python 关系网图 pyth ...

  3. python导入txt文件并绘图-Python实现读取txt文件中的数据并绘制出图形操作示例

    本文实例讲述了Python实现读取txt文件中的数据并绘制出图形操作.分享给大家供大家参考,具体如下: 下面的是某一文本文件中的数据. 6.1101,17.592 5.5277,9.1302 8.51 ...

  4. python读取txt文件为dataframe,python批量读取txt文件为DataFrame

    我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...

  5. python导入txt文件并绘图-Python实现读取txt文件并画三维图简单代码示例

    记忆力差的孩子得勤做笔记! 刚接触python,最近又需要画一个三维图,然后就找了一大堆资料,看的人头昏脑胀的,今天终于解决了!好了,废话不多说,直接上代码! #由三个一维坐标画三维散点 #codin ...

  6. linux编写脚本读取txt文件,用bash脚本或者批处理 bat脚本 读取一个目录下.txt文件第一行内容存放到新文件a.txt...

    起因:我把cmd 控制台说成了dos! 发展:人类生气了,跟我扯了一堆 dos 还有什么玩意儿,在我第二次还说那个是dos界面以后:( 后续:人类要我写 批处理bat 还有linux bash 脚本去 ...

  7. python读取txt文件并求和,Python读取txt文件数据的方法(用于接口自动化参数化数据)...

    小试牛刀: 1.需要python如何读取文件 2.需要python操作list 3.需要使用split()对字符串进行分割 代码运行截图 : 代码(copy) #encoding=utf-8 #1.r ...

  8. pandas读取txt文件第一行列名困扰我许久的'点'

    使用pandas读取txt文件,如果是有列名的,第一列每次都会有个不明符号,如下图: 困扰了很久不知道原因,今天终于知道原因(看了廖雪峰网站的git教程): "千万不要使用Windows自带 ...

  9. python将txt文件按行数分成多个txt文件

    当一个txt文件太大了打不开,想到的这个方法,分成多个文件方便打开 如果文档中有中文打开时,加上  encoding='UTF-8'  具体见代码块中注释 代码运行工具:jupyter noteboo ...

  10. python创建txt文件并写入-python如何将数据写入本地txt文本文件

    一.读写txt文件 1.打开txt文件file_handle=open('1.txt',mode='w') 上述函数参数有(1.文件名,mode模式) mode模式有以下几种:#w 只能操作写入 r ...

最新文章

  1. nginx源码编译、负载均衡及模块的扩展
  2. n阶乘的c语言代码,求10000的阶乘(c语言代码实现)
  3. python自定义异常类时、可以继承的类是_Python异常类型及处理、自定义异常类型、断言...
  4. 【渝粤教育】广东开放大学 数据采集技术 形成性考核 (29)
  5. Linux 的 Shell 变量
  6. 火狐浏览器手机版_火狐浏览器第三方编译版:tete009 Firefox
  7. 洛谷3004 [USACO10DEC]宝箱Treasure Chest
  8. JAVA核心技术36讲教程
  9. 2020年中国林业有害生物发生及防治面积统计情况,林业有害生物防控措施工作的开展刻不容缓「图」
  10. (机器人学导论--运动学)(三)DH表达法顺向运动学
  11. Matlab_textscan用法教程1_从指定行读取数据
  12. 计算机出现全部英文如何解决,电脑开机蓝屏出现一堆英文怎么解决,教你一招三分钟解决...
  13. R包安装,devtools及其依赖包
  14. 计算机网上培训6,wordexcel计算机基础培训6.pptx
  15. 七夕撒狗粮,结婚五周年,mysql学习教程
  16. Error: The apk for your currently selected variant (app-release-unsigned.apk) is not signed. Please
  17. 奶块服务器显示维护是什么意思,奶块的维护是什么意思 | 手游网游页游攻略大全...
  18. Linux | 本地Yum源 | 网络Yum源(阿里云Yum源)
  19. linux删除dat文件内容,使用python删除.dat文件中的行和列
  20. 快速接入小爱音箱,操作电脑动动嘴

热门文章

  1. 杰奇为什么只能用php5.2,杰奇2.2修改系统定义后,网站报错问题解决
  2. 最近ES遇到discover老是失败问题,ping主节点和node节点正常,抓包发现了大量的retransmission、tcp out of order、dup ack问题。...
  3. 如何学习——为什么不想听课
  4. 玩.采草莓_2018
  5. Scrapy 模拟登陆知乎--抓取热点话题
  6. MongodDB数据库安装和简单使用
  7. 【行为型模式】《大话设计模式》——读后感 (16)加薪非要老板批?——职责链模式...
  8. css 找到隐藏元素个数
  9. (并查集 带关系)Find them, Catch them -- poj -- 1703
  10. npm获取配置,设置代理