文件数据读写

读写文件,本质上是请求操作系统打开一个文件对象,然后,通过操作系统提供的接口从这个文件对象中读取数据(读文件),或者把数据写入这个文件对象(写文件)。

文件读取

使用 Python 内置 open() 函数,以 rt 的模式读取文件,如下示例:

>>> f = open('some.txt', 'rt')

这行代码就表示打开一个文件,若是文件不存在,会抛出 IOError 的异常,并给出详细的信息提示:

>>> f = open('undefined.txt', 'rt')

Traceback (most recent call last):

File "", line 1, in

FileNotFoundError: [Errno 2] No such file or directory: 'undefined.txt'

当成功打开文件时,可使用 read() 函数读取文件的内容:

>>> f.read()

'Hello world!'

当数据读取完毕后,需要调用 close() 关闭文件。因为文件对象会占用资源,使用完毕后需要及时关闭释放资源。

>>> f.close()

还有一种方法就是使用 with 语句,给被使用的文件创建一个上下文环境,这样文件对象就能够自动关闭。

>>> with open('some.txt', 'rt') as f:

... data = f.read()

...

调用 read() 时一次性读取全部内容,若是文件内容过大,可以使用 read(size) 固定大小循环读取,每次最多读取 size 字节的内容。readline() 函数,每次读取一行内容,readlines() 读取所有内容,但是按行返回 list。三者的使用,可根据实际的需求进行选择。

二进制文件

读取二进制的文件,需要使用 rb 的模式打开:

>>> f = open('image.jpg', 'rb')

>>> f.read()

b'\xff\xd8\xff\xe0\x00\x10JFIF\x00...'

从文件中读取数据,需要注意编码的问题。当编码错误时,会抛出 UnicodeDecodeError 异常。比如:

>>> f = open('some.txt', 'rt', encoding='ascii')

>>> f.read()

Traceback (most recent call last):

File "", line 1, in

File "/usr/local/lib/python3.6/encodings/ascii.py", line 26, in decode

return codecs.ascii_decode(input, self.errors)[0]

UnicodeDecodeError: 'ascii' codec can't decode byte 0xcc in position 2: ordinal not in range(128)

这种情况下,通常为读取文本指定的编码不正确,需要确认文件编码是否正确。如果编码错误还是存在的话,可以给 open() 函数传递一个可选的 errors 参数来处理这些错误。比如:

>>> f = open('some.txt', 'rt', encoding='ascii', errors='replace')

>>> f.read()

'Un��ic��o��de��'

>>> f = open('some.txt', 'rt', encoding='ascii', errors='ignore')

>>> f.read()

'Unicode'

使用参数 errors 能够处理编码错误的问题,但是过程会觉得非常糟糕。这里提倡的是确保使用的是正确的编码。模棱两可的时候,使用默认的设置(通常是 UTF-8)。

压缩文件

读取 gzip 和 bz2 格式的压缩文件时,可以使用 gzip 和 bz2 模块。两个模块都为 open() 提供了另外的实现来解决读取 gzip 和 bz2 两个格式的压缩文件的问题。例如读取压缩文件,示例如下:

>>> import gzip

>>> with gzip.open('some.gz', 'rt') as f:

... text=f.read()

>>> import bz2

>>> with bz2.open('some.bz2', 'rt') as f:

... text=f.read()

文件写入

文件写入,同样需要调用 open() 参数,但是指定的模式为 wt 或者 wb,用以表示写文本文件或是二进制文件:

>>> f = open('some.txt', 'wt')

>>> f.write('Hello, world!')

13

>>> f.close()

数据写入完毕,同样需要调用 close() 关闭文件对象。也可以 with 语句创建上下文,用以正常关闭文件对象。

类似的,写入压缩数据时,导入 gzip 或者 bz2 模块:

>>> import gzip

>>> with gzip.open('some.gz', 'wt') as f:

... f.write(text)

>>> import bz2

>>> with bz2.open('some.bz2', 'wt') as f:

... f.write(text)

写入压缩数据时,可选参数 compresslevel 可以指定一个压缩等级。例如:

>>> with gzip.open('some.gz', 'wt', compresslevel=6) as f:

... f.write(text)

compresslevel 参数默认值为 9,表示最高的压缩等级。等级越低性能越好,但是压缩程度也就越低。

使用 w 模式的 open() 函数,若打开的文件在写入前有数据内容,则会被清除覆盖。如果是要在已经存在的文件中添加内容的话,使用模式为 at 的 open() 函数。

涉及读写文件模式的定义及含义,内容如下:

模式

含义

'r'

读取数据(默认)

'w'

写入数据

'x'

文件存在抛出异常,不存在则创建

'a'

追加写入数据

'b'

二进制模式

't'

文本模式(默认)

'+'

更新文件(读写)

具体更详细的内容可以参考 Python 官方文档。

参考资料

来源

David M. Beazley;Brian K. Jones.Python Cookbook, 3rd Edtioni.O'Reilly Media.2013.

Luciano Ramalho.Fluent Python.O'Reilly Media.2015.

“2. Built-in Functions”.docs.python.org.Retrieved 20 January 2020.

"gzip — Support for gzip files".docs.python.org.Retrieved 22 January 2020.

"bz2 — Support for bzip2 compression".docs.python.org.Retrieved 22 January 2020.

廖雪峰.“Python 教程”.liaoxuefeng.com.[2020-01-18].

以上为本篇的主要内容。希望对大家的学习有所帮助,也希望大家多多支持python博客。

python写入数据的一种措施_Python 文件数据读写的具体实现相关推荐

  1. python写入excel怎么跨列居中_python文件读写(三)-Excel表格三剑客xlwt,xlrd,xlutils...

    1.写xlwt import xlwt f = xlwt.Workbook() sheet1 = f.add_sheet(u'sheet1', cell_overwrite_ok=True) styl ...

  2. Spark读取Hive数据的两种方式与保存数据到HDFS

    Spark读取Hive数据的两种方式与保存数据到HDFS Spark读取Hive数据的方式主要有两种 1. 通过访问hive metastore的方式,这种方式通过访问hive的metastore元数 ...

  3. [数据可视化]使用matplotlib对CSV文件数据进行绘图

    [数据可视化]使用matplotlib对CSV文件数据进行绘图 使用CSV格式的锡特卡天气数据 绘制2018年1月1日的天气数据,先放成果: 代码部分包括以下内容: 分析CSV文件头 打印文件头及其位 ...

  4. python写入excel公式有哪些库_Python读写Excel文件第三方库汇总,你想要的都在这儿!...

    常见库简介 xlrd xlrd是一个从Excel文件读取数据和格式化信息的库,支持.xls以及.xlsx文件. http://xlrd.readthedocs.io/en/latest/ 1.xlrd ...

  5. python文件读取写入元组_python文件的读写

    1.使用open内置函数打开一个文件 file:相对路径或者绝对路径 mode:文件的模式. r 只读   w只写  b:二进制  t:以文本形式打开等等 encoding:编码方式,windows下 ...

  6. python不支持以下哪种数据类型_Python 不支持以下哪种数据类型?

    Python 不支持以下哪种数据类型? 答:char 中国大学MOOC: 为了充分利用学习时间,下列方法可行的是: 答:尽量选择理想的固定场所学习\n充分利用等候和其它碎片时间\n把握一天中的最佳状态 ...

  7. python文件读写_python文件操作-读写删除复制总结

    1. read三种不同的方式 f = open('hello.txt') #'hello.txt'指的是文件的名称 while True: text = f.readline() #读取文件指针指向的 ...

  8. 【Java基础】IO流概述分类、字节流写数据、字节流写数据的三种方式及写数据的两个小问题

    目录 一.IO流概述和分类 二.字节流写数据 三.字节流写数据的三种方式 四.字节流写数据的两个小问题 一.IO流概述和分类 IO流介绍: ● IO:输入/输出(Input/Output) ● 流:是 ...

  9. 插值法补齐缺失数据_一种挽救你缺失数据的好方法——多重补插

    原标题:一种挽救你缺失数据的好方法--多重补插 缺失数据--研究中的绊脚石 在医学研究中,我们经常会碰到缺失数据.无论是因为实验设计的问题,或是检测手段精度,又或是医学实验中的不可抗力因素.一旦数据没 ...

最新文章

  1. .net web部署(IIS Express Nancy Self-Hosting)
  2. php+mysql分库分表的哈希(hash)算法
  3. 技巧:在Silverlight 2应用程序中切换用户控件
  4. 新一代来袭︱不只是舒适,简直是享受,Google公司用的腰靠,到底有什么秘密?...
  5. oracle19c方言,JFinal框架操作oracle数据库
  6. iphone双卡_辟谣!iPhone12双卡模式下不支持5G?国行可正常使用
  7. 列出IIS上的虚拟目录和网站信息。
  8. Gitbook中有序列表不能正常显示的解决办法
  9. 微信公众号开发中的用户账号绑定
  10. 深入浅出H桥驱动电路
  11. linux 键盘描述符,USB HID Report Descriptor 报告描述符详解
  12. 塞班系统是如何没落的
  13. C++获取、设置鼠标坐标并移动鼠标
  14. 【Python】经典问题创建一个矩形类,定义方法 属性 初始化
  15. 创新型中小企业认定条件有哪些?
  16. YTU 3413: 小姬小姬小姬
  17. 视频转换格式,用DOS命令
  18. 最近知识的总结与复习
  19. 推荐10款设计软件,全是设计大牛收藏夹里的
  20. 黑苹果安装 戴尔灵越3568 驱动篇

热门文章

  1. android 地图放大缩小按钮,Android 百度最新地图隐藏 放大缩小按钮、指南针、缩放比例的方法...
  2. 3G-SDI光端机产品技术参数规格及产品应用领域
  3. 【渝粤题库】广东开放大学 外贸会计 形成性考核
  4. python3 ftp.mlsd,python3中的ftp目录
  5. mysql group原理_MySQL Group By 实现原理分析
  6. 分布式光伏补贴_光伏发电上网电价政策综述
  7. java多条件组合查询6_elasticsearch组合多条件查询实现restful api以及java代码实现
  8. linux 取消混杂模式,Linux下网卡混杂模式设置和取消
  9. 有没有查计算机组成的答案得,计算机组成答案.doc
  10. drf 解析器,响应器,路由控制