@Author: Runsen

任何语言都离不开对文件的操作,那么Python语言是如何来操作和管理文件的。

文章目录

  • 编码方式
  • 文件操作的API
  • 打开文件
  • mode
  • 读取文件
  • 写入文件
  • 指针操作
  • 上下文管理
  • 如何批量读取多个文件
  • 练习

编码方式

编码方式的历史大致为ASCII ->gb2312->unicode->utf-8,期间具体详细信息可以百度

来个编码解码的小例子先,记住中文可以进行GBKutf-8编码,在GBk一个中文字符对应两个字节,在utf-8一个中文字符对应三个字节,中文不能进行ASCII编码。

>>> '刘润森'.encode('GBK')
b'\xc1\xf5\xc8\xf3\xc9\xad'
>>> '刘润森'.encode('ascii')
Traceback (most recent call last):File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-2: ordinal not in range(128)
>>> 'Runsen'.encode('ascii')
b'Runsen'
>>> "刘润森".encode('utf-8')
b'\xe5\x88\x98\xe6\xb6\xa6\xe6\xa3\xae'
>>> '刘润森'.encode('GBK').decode('GBK')
'刘润森'
>>> '刘润森'.encode('GBK').decode('utf-8')
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xc1 in position 0: invalid start byte

如果编码解码格式不一致可能会出现乱码,encode表示编码,decode表示解码。

文件操作的API

下面是Python文件操作的具体的API。

方法 含义
open 打开
read 读取
write 写入
close 关闭
readline 单行读取
readlines 多行读取
seek 文件指针操作
tell 读取当前指针位置

打开文件

Python的open()函数打开一个文件时,有若干个参数可用。然而,最常用的参数只有前两个。

open(file, mode='r', buffering=-1, encoding=None, errors=None, newline=None, closefd=True, opener=None)

注意,第一个是强制性的,其余的是可选的。如果不添加mode参数,文件将在Python中以只读模式打开。

encoding:可以不写。不写参数,默认的编码本是操作系统默认的编码本。windows默认gbk,linux默认utf-8,mac默认utf-8。

f=open('test.txt',encoding='utf-8')   #打开文件
data=f.read()  #读取文件
print(data)
f.close() #关闭文件

mode

mode 含义
r 文本模式,读取
rb 二进制模式,读取
w 文本模式,写入
wb 二进制模式,写入
a 文本模式,追加
ab 二进制模式,追加
+ 可读可写

读取文件

代码中用到的文件文件操作的1.txt 文件内容如下:

关注《Python之王》公众号
作者:Runsen

readline(),使用该方法时,需要指定打开文件的模式为r或者r+;

readlines(),读取全部行.返回一个列表,列表中的每个元素是原文件的每一行。如果文件很大,占内存,容易崩盘。

# 打开文件进行读取
f = open("1.txt","r",encoding='utf-8')
# 根据大小读取文件内容
print('输出来自 read() 方法\n',f.read(2048))
# 关闭文件
f.close()
# 打开文件进行读写
f = open("1.txt","r+",encoding='utf-8')
# 读取第2个字和第2行行的文件内容
print('输出来自 readline() 方法\n',f.readline(2))
print('输出来自 readlines() 方法\n',f.readlines(2))
# 关闭文件
f.close()
# 打开文件进行读取和附加
f = open("1.txt","r",encoding='utf-8')
# 打开文件进行读取和附加
print('输出来自 readlines() 方法\n',f.readlines())
# 关闭文件
f.close()# 输出如下
输出来自 read() 方法关注《Python之王》公众号
作者:Runsen
输出来自 readline() 方法关注
输出来自 readlines() 方法['《Python之王》公众号\n']
输出来自 readlines() 方法['关注《Python之王》公众号\n', '作者:Runsen']

写入文件

下面只介绍清除写 w追加写 a

案例:将关注《Python之王》公众号写入 test.txt 文件中

# mode=w 没有文件就创建,有就清除内容,小心使用
with open('test.txt', 'w', encoding='utf-8') as fb:fb.write('关注《Python之王》公众号\n')

下面再将作者:Runsen写入test.txt 文件中

with open('test.txt', 'w', encoding='utf-8') as fb:fb.write('作者:Runsen\n')

运行后会发现之前写的关注《Python之王》公众号内容修改为作者:Runsen,因为 w模式会清除原文件内容,所以小心使用。只要使用了w,就要一次性写完。

追加写 a

案例:将作者:Runsen追加到 test.txt 文件中

# mode=a 追加到文件的最后
with open('test.txt', 'a', encoding='utf-8') as fb:fb.write('关注《Python之王》公众号\n')
with open('test.txt', 'a'encoding='utf-8') as fb:fb.write('作者:Runsen\n')

指针操作

事物或资源都是以文件的形式存在,比如消息、共享内存、连接等,句柄可以理解为指向这些文件的指针。

句柄(handle)是一个来自编译原理的术语,指的是一个句子中最先被规约的部分,所以带有一个「句」字。

句柄的作用就是定位,两个APi还是tell和seek。

tell返回文件对象在文件中的当前位置,seek将文件对象移动到指定的位置,传入的参数是offset ,表示移动的偏移量。

下面通过示例对上述函数作进一步了解,如下所示:

with open('test.txt', 'rb+') as f:f.write(b'Runsen')# 文件对象位置print(f.tell())# 移动到文件的第四个字节f.seek(3)# 读取一个字节,文件对象向后移动一位print(f.read(1))print(f.tell())# whence 为可选参数,值为 0 表示从文件开头起算(默认值)、值为 1 表示使用当前文件位置、值为 2 表示使用文件末尾作为参考点# 移动到倒数第二个字节f.seek(-2, 2)print(f.tell())print(f.read(1))#输出如下
6
b's'
4
50
b'\r'

上下文管理

我们会进行这样的操作:打开文件,读写,关闭文件。程序员经常会忘记关闭文件。上下文管理器可以在不需要文件的时候,自动关闭文件,使用with open即可。

# with context manager
with open("new.txt", "w") as f:print(f.closed)f.write("Hello World!")
print(f.closed)#输出如下
False
True

如何批量读取多个文件

下面,批量读取某文件夹下的txt文件

file_list = ['1.txt', '2.txt', '3.txt','4.txt']
for path in file_list:with open(path, encoding='utf-8') as f:for line in f:print(line)

下面将批量读取文件夹下的txt文件的内容,合并内容到一个新文件5.txt中,具体实现的代码如下。

import os
#获取目标文件夹的路径
filedir = os.getcwd()+'\\'+'\\txt'
#获取当前文件夹中的文件名称列表
filenames = []
for i in os.listdir(filedir):if i.split(".")[-1] == 'txt':filenames.append(i)
#打开当前目录下的5.txt文件,如果没有则创建
f = open('5.txt','w')
#先遍历文件名
for filename in filenames:filepath = filedir+'\\'+filename#遍历单个文件,读取行数for line in open(filepath,encoding='utf-8'):f.writelines(line)f.write('\n')
#关闭文件
f.close()

其实在Window中只需要cd 至目标文件夹,即你需要将所有想要合并的txt文件添加至目标文件夹中,执行如下DOS命令 type *.txt > C:\目标路径\合并后的文件名.txt

练习

题目:创建文件data.txt,文件共100000行,每行存放一个1~100之间的整数,题目来源:牛客

import randomf = open(‘data.txt’,‘w+’)
for i in range(100000):f.write(str(random.randint(1,100)) + ‘\n’)f.seek(0)print(f.read())f.close()

题目:生成100个MAC地址并写入文件中,MAC地址前6位(16进制)为01-AF-3B,题目来源:牛客

import random
import stringdef create_mac():MAC='01-AF-3B'hex_num =string.hexdigits #0123456789abcdefABCDEFfor i in range(3):n = random.sample(hex_num,2)sn = '-' + ''.join(n).upper()MAC += snreturn MACdef main():with open('mac.txt','w') as f:for i in range(100):mac = create_mac()print(mac)f.write(mac+'\n')main()

本文已收录 GitHub,传送门~ ,里面更有大厂面试完整考点,欢迎 Star。

三十二、深入Python中的文件操作相关推荐

  1. python 如何判断一个函数执行完成_三步搞定 Python 中的文件操作

    当程序运行时,变量是保存数据的好方法,但变量.序列以及对象中存储的数据是暂时的,程序结束后就会丢失,如果希望程序结束后数据仍然保持,就需要将数据保存到文件中. Python 提供了内置的文件对象,以及 ...

  2. 【Python】【入门篇】十二、Python中协程

    目录 十二.Python中协程 12.1 协程的定义 12.2 协程 12.3 协程池 12.4 总结 十二.Python中协程 12.1 协程的定义 协程(Coroutine):是一种比线程更加轻量 ...

  3. Python中的文件操作和异常

    Python中的文件操作和异常 文章目录 Python中的文件操作和异常 一.文件 01. 文件的概念 1.1 文件的概念和作用 1.2 文件的存储方式 文本文件和二进制文件 02. 文件的基本操作 ...

  4. JavaScript学习(三十九)—对象中内容的操作

    JavaScript学习(三十九)-对象中内容的操作 一.对象中内容的操作:增.删.改.查 (一).增:给对象添加属性或者方法 1)方式1:对象名称.属性名=属性值: 2)方式2:对象名称['属性名' ...

  5. python中二进制文件_Python学习基础篇 -6: Python中的文件操作

    前言:本专栏以Python为主题,并尽可能保持每星期两到三更,直到将Python的基础知识浅析和讲解完毕,同时,有一定基础的同学可以移步 Python实战专栏 . 文件有有什么用 文件可以看作一个仓库 ...

  6. python中文件操作中不同的文件操作有何差异_Python学习基础篇 -6: Python中的文件操作...

    前言:本专栏以Python为主题,并尽可能保持每星期两到三更,直到将Python的基础知识浅析和讲解完毕,同时,有一定基础的同学可以移步 Python实战专栏 .文件有有什么用 文件可以看作一个仓库, ...

  7. python使用循环结构计算10_十二、 python中的循环结构

    我们要计算1+2+3的时候,可以直接写出来,但是计算1+2+3+···+100的时候,就不能写了.如果计算1到1亿的和,全写出来就有点不现实了.为了让计算机能计算出1到1亿的和,这时候就需要循环结构了 ...

  8. python中csv文件操作_python中操作csv文件

    python中操作csv文件 读取csv improt csv f = csv.reader(open("文件路径","r")) for i in f: pri ...

  9. 零基础小白python入门——深入Python中的文件操作

    任何语言都离不开对文件的操作,那么Python语言是如何来操作和管理文件的. 编码方式 编码方式的历史大致为ASCII ->gb2312->unicode->utf-8,期间具体详细 ...

最新文章

  1. Qt5开发及实例学习之文件系统浏览
  2. DNS(二)--正反解析及主从配置
  3. POJ-2391 Ombrophobic Bovines 网络流-拆点构图
  4. 使Struts2与Servlet并存解决办法 Filter转发Servlet
  5. 使用Scikit-Learn轻松实现数据缩放
  6. 安装 openSUSE Leap 42.1 之后要做的 8 件事
  7. duilib清空richedit内容
  8. HTML5 Canvas游戏开发(二)高级功能
  9. 蒙特卡罗方法 python 实现2
  10. Java学习路线图,知识点总结大全图,从入门到精通,你要好好学习Java,千万不能只学习python
  11. 算法:单词匹配290. Word Pattern
  12. 操作系统实验1—基于优先数的时间片轮转调度算法调度处理模拟程序设计
  13. 根据hash值找到bt种子的磁力下载链
  14. android camera2美颜,Nano Camera(多功能美颜相机)V2.1 安卓版
  15. spss进行相关性分析
  16. macmini更换硬盘重装系统后安装win10双系统
  17. 很黄色的JAVA游戏_《yellow》很黄!很暴力?居然有这么黄的游戏!
  18. 测试自动化风险或成功的条款
  19. Java利用aspose-words将word文档转换成pdf
  20. drcom linux最新版,Drcom-client.org 上线暨新版 PUM v1.0 发布

热门文章

  1. J-Link 输出供电问题
  2. MTK MtkSettings Sim Dialog Patch
  3. 全志 移除屏幕超时选项 Patch
  4. linux重启终端后go命令,Linux基础命令之关机,重启,注销-Go语言中文社区
  5. 青岛智能物联网产才融合中心成立,山东大学携手百度飞桨海尔海纳云等共育AI人才
  6. 求职中最吃香的编程语言:JavaScript、Java 和 Python
  7. 带你了解『百度智能云发布云智一体的AI开发全栈模式』
  8. 修改tomcat的临时文件夹_tomcat 临时文件夹被移除的问题
  9. 探索ASP.NET Core中的IStartupFilter
  10. Python Cookbook(第3版)中文版:15.17 传递文件名给C扩展