一、文本文件读取

文本文件是一种由若干行字符构成的计算机文件,它是一种典型的顺序文件。

csv是一种逗号分隔的文件格式,因为其分隔符不一定是逗号,又被称为字符分隔文件,文件以纯文本形式存储表格数据(数字和文本)。

1、使用read_table来读取文本文件:

格式:pandas.read_table(数据文件名, sep=’\t’, header=’infer’, names=None,index_col=None, dtype=None, engine=None, nrows=None)

sep=’\t’:表示文件的是以制表符\t为分隔(即用Tab键来分隔)

2、使用read_csv函数来读取csv、tsv、txt文件:

格式:pandas.read_csv(数据文件名, sep=’,’, header=’infer’, names=None, index_col=None,dtype=None, engine=None, nrows=None)

3、read_table和read_csv常用参数及其说明:

补充理解:

(1)read_table和read_csv函数中的sep参数是指定文本的分隔符的,如果分隔符指定错误,在读取数据的时候,每一行数据将连成一片。

(2)header参数是用来指定列名的,如果是None则会添加一个默认的列名。

(3)encoding代表文件的编码格式,常用的编码有utf-8、utf-16、gbk、gb2312、gb18030等。如果编码指定错误数据将无法读取,IPython解释器会报解析错误。

代码:

importpandas as pdprint("----------用pd.read_table()获取dat文件数据----------")#获取外部电影txt文件数据

users = pd.read_table('users.dat',

header=None, #表示不要导入原文件内的表头

names=['UserID','Gender','Age','Occupation','Zip-code'], #自定义列名

sep='::', #原文件的分隔符是'::',此处是按此分隔符将数据导入

engine= 'python')print(users.head())print("------用pd.read_csv()获取csv、tsv、txt文件数据--------")print("------案例1-------")

csv=pd.read_csv('iris.csv',

header=None, #表示不要导入原文件内的表头

names=['width','height','category']) #自定义列名:width,height,category

print(csv.head())

csv.iloc[0,2]=1csv.to_csv('iris233333.csv') #将数据保存为csv格式,并存放在本地

print("------案例2--------")

students1= pd.read_csv('Students.csv', index_col='ID') #index_col表示设置原csv文件里的ID列的值作为index索引值(index默认从0开始序列)

students2 = pd.read_csv('Students.tsv', sep='\t', index_col='ID')

students3= pd.read_csv('Students.txt', sep='|', index_col='ID')print(students1.head())print(students2.head())print(students3.head())

结果图:

二、Excel文件读取

1、pandas提供了read_excel函数来读取“xls”“xlsx”两种Excel文件:

2、格式:pandas.read_excel(文件名, sheetname=0, header=0, index_col=None, names=None, dtype=None)

3、read_excel常用参数及其说明:

代码:

print("-------------pd.read_excel()获取excel文件-------------")importpandas as pd#获取excel表格文件

excel=pd.read_excel('data.xlsx')print(excel)

结果图:

三、文本文件存储

1、文本文件的存储和读取类似,结构化数据可以通过pandas中的to_csv函数实现以csv文件格式存储文件。

2、格式:DataFrame.to_csv(path_or_buf=None, sep=’,’, na_rep=”, columns=None, header=True,index=True,index_label=None,mode=’w’,encoding=None)

3、常用参数及其说明:

四、Excel文件储存

1、将文件存储为Excel文件,可以使用to_excel方法。

2、格式:DataFrame.to_excel(excel_writer=None, sheetname=None'’, na_rep=”, header=True,index=True, index_label=None, mode=’w’, encoding=None)

3、.to_excel和 to_csv方法的常用参数基本一致,区别之处在于指定存储文件的文件路径参数名称为excel_writer,并且没有sep参数,增加了一个sheetnames参数用来指定存储的Excel sheet的名称,默认为sheet1。

python读取dat文件写入表格_Pandas:外部文件数据导入/ 读取 (如 :csv、txt、tsv、dat、excel文件)、文件存储(to_csv、to_excel)...相关推荐

  1. python文件写入字典格式输出_Python把对应格式的csv文件转换成字典类型存储脚本的方法...

    该脚本是为了结合之前的编写的脚本,来实现数据的比对模块,实现数据的自动化!由于数据格式是定死的,该代码只做参考,有什么问题可以私信我! CSV的数据格式截图如下: readDataToDic.py源代 ...

  2. python爬取小说写入txt_python 爬取网络小说 清洗 并下载至txt文件

    什么是爬虫 网络爬虫,也叫网络蜘蛛(spider),是一种用来自动浏览万维网的网络机器人.其目的一般为编纂网络索引. 网络搜索引擎等站点通过爬虫软件更新自身的网站内容或其对其他网站的索引.网络爬虫可以 ...

  3. 【python量化交易学习】从tushare获取股票交易数据,存入后再从mysql或excel读取数据,筛选股票,用pyecharts画出K线图。

    选定日期,筛选涨幅达到10%的股票,并画出K线图.观察涨停后股票走势. 由于创业板涨停板为20%,科创板20%,北交所30%.因此筛选出的涨停股票不完全准确.考虑到目前市场打板主要集中在10%的主板股 ...

  4. bin文件怎么转换成文本文档_Python脚本4:根据txt文本,批量创建文件夹

    背景:深度学习图像分类的时候,有许多的标签类.1000个标签就需要创建1000个文件夹,文件夹里面放入对应的图像.不可能一个一个右击创建文件夹,所以有了今天的脚本.根据txt文本每一行的类别,创建文件 ...

  5. poiExcel表格所有操作以及数据导入导出

    这个是本人在学习中记录的笔记以供大家参考 Poi简介: 1.1什么是poi Apache POI [1]  是用Java编写的免费开源的跨平台的 Java API,Apache POI提供API给Ja ...

  6. oracle pg 文件级迁移,Ora2pg 把oracle数据导入到postgres

    1 Ora2pg特性 1.导出整个数据库模式(表.视图.序列.索引),以及唯一性,主键.外键和检查约束. 2.导出用户和组的授权/权限. 3.导出筛选的表(通过制定表明). 4.导出Oracle模式到 ...

  7. python csv/txt转换成excel

    参考 https://www.jianshu.com/p/4e39444d5ebc 环境: pip install xlwt python3.6 将csv/txt文本通过程序转换成excel文件,自定 ...

  8. oracle录入excel无sql,Excel数据导入到oracle(待上传的Excel表格;oracle的数据表;PLSQL)...

    一.打开pl/sql,如图所示界面,点击菜单栏中的T00LS ODBC Imtorper,打开ODBC Importer选项框​ T00LS ODBC Imtorper 二.在Data fromODB ...

  9. python读取dat文件写入表格_在python中从.dat文件读取和执行计算

    我需要用python读取一个.dat文件,它总共有12列,数百万行.我需要把第2.3和4栏和第1栏分开计算.所以在加载.dat文件之前,是否需要删除所有其他不需要的列?如果没有,如何有选择地声明列并要 ...

最新文章

  1. d3.json php,使用d3.json从PHP进行JSON输出
  2. 高并发编程-通过volatile重新认识CPU缓存 和 Java内存模型(JMM)
  3. python 查看 .npy文件 和 .pkl 文件的方法
  4. php text留言本,PHP+TEXT留言本(五)
  5. awk用法小结(作者总结)
  6. SQL-6查找所有员工入职时候的薪水情况,给出emp_no以及salary, 并按照emp_no进行逆序...
  7. android pcm数据格式,android 实时PCM数据编码成AAC
  8. 2个dataframe,df1的每一列分别乘以df2的某一列
  9. window环境mysql卸载不干净
  10. Material Design(二)--色彩样式
  11. 以下sum函数用来求a,b两数的和,在主函数中输入两个数并调用sum函数求其和。
  12. Python中过滤列表中全部奇数
  13. 如何万网域名解析亚马逊服务器,关于aws亚马逊dns域名解析route53的使用
  14. 大规模知识图谱数据存储实战解析
  15. 记录微信分享图标不显示的问题
  16. os系统服务器防火墙怎么关闭,mac防火墙如何关闭
  17. 需求分析岗的一般工作流程
  18. SwiftUI学习(一)
  19. 资金安全责任险对个人账户负责?
  20. [Cu (L) (Phen )]·1/4H2O配合物

热门文章

  1. JavaWeb应用项目部署到云ubuntu
  2. 河南oracle客户端,解决Oracle监听服务报错
  3. js substring和substr的区别实例,一目了然
  4. Python pip 用法大全
  5. mysql表 spid program_oracle 解锁某张表 和编译存储过程卡死问题处理
  6. /dev/shm目录下产生大量的ora_$ORACLE_SID的二进制文件
  7. mysql install语句_MySQL入门学习(一)安装与基本操作
  8. vsftpd中文目录乱码的解决办法
  9. flash制作文字笔顺_flash动画课件制作有什么优点
  10. 2020-01-14 转载【dpdk】使用libpcap-PMD驱动收发包