python读取txt文件第一行-python读取文本文件数据
本文要点刚要:
(一)读文本文件格式的数据函数:read_csv,read_table
1.读不同分隔符的文本文件,用参数sep
2.读无字段名(表头)的文本文件 ,用参数names
3.为文本文件制定索引,用index_col
4.跳行读取文本文件,用skiprows
5.数据太大时需要逐块读取文本数据用chunksize进行分块。
(二)将数据写成文本文件格式函数:to_csv
范例如下:
(一)读取文本文件格式的数据集
1.read_csv和read_table的区别:
#read_csv默认读取用逗号分隔符的文件,不需要用sep来指定分隔符
import pandas as pd
pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.csv')
#read_csv如果读的是用非逗号分隔符的文件,必须要用sep指定分割符,不然读出来的是原文件的样子,数据没被分割开
import pandas as pd
pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt')
#与上面的例子可以对比一下区别
import pandas as pd
pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')
#read_table读取文件时必须要用sep来指定分隔符,否则读出来的数据是原始文件,没有分割开。
import pandas as pd
pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.csv')
#read_table读取数据必须指定分隔符
import pandas as pd
pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')
2.读取文本文件时不用header和names指定表头时,默认第一行为表头
#用header=None表示数据集没有表头,会默认用阿拉伯数字填充表头和索引
pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|',header=None)
#用names可以自定义表头
pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|',
names=['x1','x2','x3','x4','x5'])
3.默认用阿拉伯数字指定索引;用index_col指定某一列作为索引
names=['x1','x2','x3','x4','x0']
pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|',
names=names,index_col='x0')
4.以下示例是用skiprows将hello对应的行跳过后读取其他行数据,不管首行是否作为表头,都是将表头作为第0行开始数
可以对比一下三个例子的区别进行理解
pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt')
names=['x1','x2','x3','x4','x0']
pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',names=names,
skiprows=[0,3,6])
pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',
skiprows=[0,3,6])
pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',header=None,
skiprows=[0,3,6])
5.分块读取,data1.txt中总共8行数据,按照每块3行来分,会读3次,第一次3行,第二次3行,第三次1行数据进行读取。
注意这里在分块的时候跟跳行读取不同的是,表头没作为第一行进行分块读取,可通过一下两个例子对比进行理解。
chunker = pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',chunksize=3)
for m in chunker:
print(len(m))
print m
chunker = pd.read_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data1.txt',header=None,
chunksize=3)
for m in chunker:
print(len(m))
print m
(二)将数据写入文本格式用to_csv
以data.txt为例,注意写出文件时,将索引也写入了
data=pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')
print data
#可以用index=False禁止索引的写入。
data=pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')
data.to_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\outdata.txt',sep='!',index=False)
#可以用columns指定写入的列
data=pd.read_table('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\data.txt',sep='|')
data.to_csv('C:\Users\xiaoxiaodexiao\pythonlianxi\test0424\outdata2.txt',sep=',',index=False,
columns=['a','c','d'])
python读取txt文件第一行-python读取文本文件数据相关推荐
- Java读取UTF-8格式txt文件第一行出现乱码及解决;Java读带有BOM的UTF-8文件乱码原因及解决方法(转载)...
原文地址:http://blog.csdn.net/jackpk/article/details/5702964/ Java读取UTF-8的txt文件第一行出现乱码"?"及解决 t ...
- python读取txt文件的行数_python读取txt文件符合条件的行数-女性时尚流行美容健康娱乐mv-ida网...
女性时尚流行美容健康娱乐mv-ida网 mvida时尚娱乐网 首页 美容 护肤 化妆技巧 发型 服饰 健康 情感 美体 美食 娱乐 明星八卦 首页 > 高级搜索 python 关系网图 pyth ...
- python导入txt文件并绘图-Python实现读取txt文件中的数据并绘制出图形操作示例
本文实例讲述了Python实现读取txt文件中的数据并绘制出图形操作.分享给大家供大家参考,具体如下: 下面的是某一文本文件中的数据. 6.1101,17.592 5.5277,9.1302 8.51 ...
- python读取txt文件为dataframe,python批量读取txt文件为DataFrame
我们有时候会批量处理同一个文件夹下的文件,并且希望读取到一个文件里面便于我们计算操作.比方我有下图一系列的txt文件,我该如何把它们写入一个txt文件中并且读取为DataFrame格式呢? 首先我们要 ...
- python导入txt文件并绘图-Python实现读取txt文件并画三维图简单代码示例
记忆力差的孩子得勤做笔记! 刚接触python,最近又需要画一个三维图,然后就找了一大堆资料,看的人头昏脑胀的,今天终于解决了!好了,废话不多说,直接上代码! #由三个一维坐标画三维散点 #codin ...
- linux编写脚本读取txt文件,用bash脚本或者批处理 bat脚本 读取一个目录下.txt文件第一行内容存放到新文件a.txt...
起因:我把cmd 控制台说成了dos! 发展:人类生气了,跟我扯了一堆 dos 还有什么玩意儿,在我第二次还说那个是dos界面以后:( 后续:人类要我写 批处理bat 还有linux bash 脚本去 ...
- python读取txt文件并求和,Python读取txt文件数据的方法(用于接口自动化参数化数据)...
小试牛刀: 1.需要python如何读取文件 2.需要python操作list 3.需要使用split()对字符串进行分割 代码运行截图 : 代码(copy) #encoding=utf-8 #1.r ...
- pandas读取txt文件第一行列名困扰我许久的'点'
使用pandas读取txt文件,如果是有列名的,第一列每次都会有个不明符号,如下图: 困扰了很久不知道原因,今天终于知道原因(看了廖雪峰网站的git教程): "千万不要使用Windows自带 ...
- python将txt文件按行数分成多个txt文件
当一个txt文件太大了打不开,想到的这个方法,分成多个文件方便打开 如果文档中有中文打开时,加上 encoding='UTF-8' 具体见代码块中注释 代码运行工具:jupyter noteboo ...
- python创建txt文件并写入-python如何将数据写入本地txt文本文件
一.读写txt文件 1.打开txt文件file_handle=open('1.txt',mode='w') 上述函数参数有(1.文件名,mode模式) mode模式有以下几种:#w 只能操作写入 r ...
最新文章
- nginx源码编译、负载均衡及模块的扩展
- n阶乘的c语言代码,求10000的阶乘(c语言代码实现)
- python自定义异常类时、可以继承的类是_Python异常类型及处理、自定义异常类型、断言...
- 【渝粤教育】广东开放大学 数据采集技术 形成性考核 (29)
- Linux 的 Shell 变量
- 火狐浏览器手机版_火狐浏览器第三方编译版:tete009 Firefox
- 洛谷3004 [USACO10DEC]宝箱Treasure Chest
- JAVA核心技术36讲教程
- 2020年中国林业有害生物发生及防治面积统计情况,林业有害生物防控措施工作的开展刻不容缓「图」
- (机器人学导论--运动学)(三)DH表达法顺向运动学
- Matlab_textscan用法教程1_从指定行读取数据
- 计算机出现全部英文如何解决,电脑开机蓝屏出现一堆英文怎么解决,教你一招三分钟解决...
- R包安装,devtools及其依赖包
- 计算机网上培训6,wordexcel计算机基础培训6.pptx
- 七夕撒狗粮,结婚五周年,mysql学习教程
- Error: The apk for your currently selected variant (app-release-unsigned.apk) is not signed. Please
- 奶块服务器显示维护是什么意思,奶块的维护是什么意思 | 手游网游页游攻略大全...
- Linux | 本地Yum源 | 网络Yum源(阿里云Yum源)
- linux删除dat文件内容,使用python删除.dat文件中的行和列
- 快速接入小爱音箱,操作电脑动动嘴
热门文章
- 杰奇为什么只能用php5.2,杰奇2.2修改系统定义后,网站报错问题解决
- 最近ES遇到discover老是失败问题,ping主节点和node节点正常,抓包发现了大量的retransmission、tcp out of order、dup ack问题。...
- 如何学习——为什么不想听课
- 玩.采草莓_2018
- Scrapy 模拟登陆知乎--抓取热点话题
- MongodDB数据库安装和简单使用
- 【行为型模式】《大话设计模式》——读后感 (16)加薪非要老板批?——职责链模式...
- css 找到隐藏元素个数
- (并查集 带关系)Find them, Catch them -- poj -- 1703
- npm获取配置,设置代理