扫码关注

作者:黄伟呢
源自:数据分析与统计学之美

1.文件读写的流程

1)类比windows中手动操作txt文档,说明python中如何操作txt文件?
① windows中手动操作txt文件的步骤
  • 找到word文档

  • 打开word文档

  • 查看(或操作)word文档中的内容

  • 关闭word文档

② python操作txt文件的步骤
  • 获取被打开的文件的内存对象,该内存对象又叫做文件句柄

  • 通过这个内存对象(文件句柄),来对文件进行操作(读取,写入等操作)

  • 关闭文件

2)什么是文件的内存对象(文件句柄)?

使用python读取一个txt文件的时候,相当于把这个文件从硬盘上,读取到了内存中。

我们如果想要操作这个文件,是不是先要获取这个文件对象?只有获取这个文件对象后,才能够真正的去操作这个文件,不管是读取文件中的内容,还是向文件中写入内容。

这个文件句柄包含了文件的文件名、文件的字符集、文件的大小、文件在硬盘上的起始位置。

3)演示怎么读取文件
① 演示如下
f = open(r"G:\6Tipdm\file_read_write\yesterday.txt","r",encoding="utf-8")
data  = f.read()
print(data[:245])
f.close()

结果如下:

② 一个很奇怪的现象?
f = open(r"G:\6Tipdm\file_read_write\yesterday.txt","r",encoding="utf-8")
data  = f.read()
data1 = f.read()
print(data[:245])
print("-------------------------------------")
print(data1[:245])
f.close()

结果如下:

问题:我们读取了2遍内容,为什么只显示了一次读取的结果呢?对于上述问题,我们用一张图回答上述问题。

通过上图我们可以发现,当我们操作这个文件句柄的read()方法去读取文件的时候,这个句柄会从文件的开头位置1,移动到文件的结束位置2。

如果不做任何操作,读取完毕之后,句柄就会停止在2这个位置。因此当我们再次读取文件的时候,该句柄是从2这个位置,往后面读取内容。由于后面没有任何内容,因此第二次读取为空。

那么,如果我们想要第二次同样能够读取到文件中的内容,应该怎么办呢?那么接着往下看。

4)演示怎么写文件
f = open(r"G:\6Tipdm\file_read_write\yesterday2.txt","w",encoding="utf-8")
f.write("我爱北京天安门")
f.close()

结果如下:

假如我们在写一句天安门上太阳升,会出现啥情况呢?

f = open(r"G:\6Tipdm\file_read_write\yesterday2.txt","w",encoding="utf-8")
f.write("天安门上太阳升")
f.write("很好,很好")
f.close()

结果如下:

意外发生:当我们再次写入新的内容的时候,发现之前写的内容不见了,这是为啥呢?这就是我们下面要讲述的文件读写的几种常见模式。  

2.文件读写的几种常见模式(你不清楚的知识点)

1)关于r+、w+、a+使用说明(易错点)

当我们读取某个文件,向文件中写入某些内容(覆盖写),向文件中追加写入某写内容时,最好的方式就是分别使用r、w、a这三种模式。对于这三种模式,要么读,要么写,读模式就不能写,写模式就不能读。

对于r+、w+、a+这三种模式,如果你不是特别清楚python文件读写的原理,就不要轻易使用,因为会出现很多问题,下面我们仅演示r+、w+、a+这三种模式。

2)r+模式:可读可写

对于这种模式,不管是读取文件中的内容,还是朝文件中写入内容。前提条件:文件存在。

# 只读取文件中的内容
f = open(r"G:\6Tipdm\file_read_write\yesterday1.txt","r+",encoding="utf-8")
data = f.read()
print(data)
f.close()# 朝文件中写入内容后,立即读取,会出现啥问题?
f = open(r"G:\6Tipdm\file_read_write\yesterday1.txt","r+",encoding="utf-8")
f.write("丽丽姑娘")data = f.read()
print(data)
f.close()# 朝文件中写入内容后,调整句柄位置后,再读取,会出现啥问题?
f = open(r"G:\6Tipdm\file_read_write\yesterday1.txt","r+",encoding="utf-8")
f.write("丽丽姑娘")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下:

使用r+模式,当只读文件的时候,可以读取到其中的内容。

当写入内容后,立即读取文件内容,发现什么也读取不到。这是由于当你写入内容后,文件句柄会放在写入内容的最后面,因此当你立即读取的时候,句柄会从上次内容最后的位置,往后面读,因此读取为空。

当朝文件中写入内容后,调整句柄位置后,再读取文件中的内容,发现就有了内容。这是由于我们使用了f.seek(0)方法,将句柄由内容末尾调整到了内容开头,因此就又有了内容。

3)w+:可读可写
# 直接往文件中写入内容
f = open(r"G:\6Tipdm\file_read_write\yesterday3.txt","w+",encoding="utf-8")
f.write("bbbbbb")
f.close()# 直接读取上述文件,看看会发生啥问题?(特别注意这一步)
f = open(r"G:\6Tipdm\file_read_write\yesterday3.txt","w+",encoding="utf-8")
data = f.read()
print(data)
f.close()# 朝文件中写入内容后,立即读取,又会发生什么?
f = open(r"G:\6Tipdm\file_read_write\yesterday3.txt","w+",encoding="utf-8")
f.write("哈哈哈哈哈")
data = f.read()
print(data)
f.close()# 朝文件中写入内容后,调整句柄位置后,再读取,会发生什么?
f = open(r"G:\6Tipdm\file_read_write\yesterday3.txt","w+",encoding="utf-8")
f.write("嘿嘿嘿嘿嘿")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下:

使用w+模式,当我们直接朝文件中写入bbbbbb,毋庸置疑,肯定是可以的。

接着,我们直接读取这个文件中的内容,奇怪的现象发生了,什么都读取不到。这是因为w+模式,在进行文件读取的时候,默认是先写再读。但是我们确实没有写入任何东西呀?这是由于系统默认帮我们写入了一个空值,因此把原有内容覆盖了。所以再当我们读取文件中的内容的时候,发现读取为空。

再接着,我们朝文件中,写入内容后再立即读取,这下仍然读取不到任何内容,这又是为什么呢?这是由于我们第一次写入“哈哈哈哈哈哈”的时候,句柄移动到了内容最后。当我们立即读取的时候,句柄从内容最后的位置,继续朝后面读,因此啥也没有。

最后,当朝文件中写入内容后,调整句柄位置后,再读取文件中的内容,发现就有了内容。这是由于我们使用了f.seek(0)方法,将句柄由内容末尾调整到了内容开头,因此就又有了内容。

4)a+:可读可写
# 直接朝文件中写入内容
f = open(r"G:\6Tipdm\file_read_write\yesterday4.txt","a+",encoding="utf-8")
f.write("哈哈")
f.close()# 直接读取文件中的内容
f = open(r"G:\6Tipdm\file_read_write\yesterday4.txt","a+",encoding="utf-8")
data = f.read()
print(data)
f.close()# 调整句柄位置后,再读取文件中的内容
f = open(r"G:\6Tipdm\file_read_write\yesterday4.txt","a+",encoding="utf-8")
f.seek(0)
data = f.read()
print(data)
f.close()

结果如下:

使用a+模式,朝文件中写入内容,毋庸置疑,肯定是没问题的。

接着,当我们读取上述文件中的内容,会发现什么也读取不到。这是由于,使用r+模式打开文件,文件句柄默认放在内容的最后面,因此你直接读取其中的内容,什么也没有。

最后,在读取文件中内容之前,我们使用了f.seek(0)方法,将句柄由内容末尾调整到了内容开头,再次读取文件中的内容,发现就有了内容。

3.read、readline、readlines的区别

1)read()方法的使用说明
f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
data = f.read()
print(type(data))
print(data)
f.close()

结果如下:

2)readline()方法的使用说明
f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
data = f.readline()
print(type(data))
print(data)
f.close()f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
for i in range(3):data = f.readline()print(data)
f.close()

结果如下:

去掉每一行末尾的换行符:

f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
for i in range(3):data = f.readline().strip()print(data)
f.close()

结果如下:

3)readlines()方法的使用说明
f = open(r"G:\6Tipdm\file_read_write\test.txt","r",encoding="utf-8")
data = f.readlines()
print(type(data))
print(data)
f.close()

结果如下:

4.对于一个10G的大文件,怎么高效的查看文件中的内容呢?

1)相关说明

当我们读取文件中的内容,相当于是把写在硬盘上的东西,读取到内存中。不管你是使用read()或者readlines()一次性读取到到内存中,还是使用readline()一行行的将整个内容读取到内存中,如果文件很大,都将会耗用很大的内存。同时,从硬盘读取文件内容到内存中,也会很慢。

因此,有没有一种高效的方式?既让我们看到了文件中的内容,又不会占用内存呢?下面我们将进行说明。

2)操作说明
f = open(r"G:\6Tipdm\file_read_write\yesterday.txt","r",encoding="utf-8")
for line in f:print(line.strip())

部分截图如下:

上述方式中,f相当于一个迭代器,我们使用for循环迭代f中元素。每循环一次,就相当于读取一行到内存中,并记住这一次读取到的位置。当进行下次迭代的时候,上一次读取到内存中的内容,就会被销毁了,当前内存中读取的就是第二行的内容。当进行第三次循环的时候,内存中第二行的内容也会被销毁,此时内存中只会保存第三行的内容,这样依次进行下去。直到最后一次循环,读取最后一行的内容,此时,内存中保留的也只是最后一行的内容。

迭代器有一个特性:每次进行迭代的时候,就会记住当前读取的位置。当进行下一次迭代的时候,前面的内容会被销毁掉,在内存中只会保留当前循环得到的内容。

- End -

精 彩 文 章 肝!计算机网络基础知识总结程序员必备网站之一:No Design你离黑客的距离,就差这20个神器了付费?是不可能的!20行Python代码实现一款永久免费PDF编辑工具最后说一个题外话,相信大家有不少人开通了视频号。小詹也开通了一个视频号,会分享互联网那些事、读书心得与副业经验,欢迎各位扫描下方二维码关注。

肝!超好懂的 Python 文件读写教程!相关推荐

  1. 最好懂的python文件读写(详解)

    目录   1.文件读写的流程   2.文件读写的几种常见模式(你不清楚的知识点)   3.read.readline.readlines的区别   4.对于一个10G的大文件,怎么高效的查看文件中的内 ...

  2. Python 文件读写操作-Python零基础入门教程

    目录 一.Python 文件的打开 open 二.Python 文件的关闭 close 三.Python 文件的读取 read 1.read 函数 2.readline 函数 3.readlines ...

  3. seek是python文件操作方法吗,seek引发的python文件读写的问题

    我的需求很简单,就是统计一下我的安装脚本执行的次数和时间,格式是这样的 install_times:1|install_times:2018-09-03 15:58:46 install_times: ...

  4. python异步读写文件_一文彻底搞懂python文件读写

    Python文件读写 一,I/O操作 I/O在计算机中是指Input/Output,也就是Stream(流)的输入和输出.这里的输入和输出是相对于内存来说的,Input Stream(输入流)是指数据 ...

  5. python delimiter分隔符用法_使用Python文件读写,自定义分隔符(custom delimiter)

    众所周知,python文件读取文件的时候所支持的newlines(即换行符),是指定的.这一点不管是从python的doucuments上还是在python的源码中(作者是参考了python的io版本 ...

  6. python文件读写_python基础-文件读写'r' 和 'rb'区别

    一.Python文件读写的几种模式: r,rb,w,wb 那么在读写文件时,有无b标识的的主要区别在哪里呢? 1.文件使用方式标识 'r':默认值,表示从文件读取数据. 'w':表示要向文件写入数据, ...

  7. python文件读取模式_day-2 python 文件读写模式r,r+,w,w+,a,a+的区别

    r+和w+都是可读可写,区别在于r+读文件时,不会覆盖之前的内容,之前的内容能够读出来:w+读时,会覆盖之前的内容:所以读文件时,用r或者r+ #读操作 r 1 filepath = 'aa.log' ...

  8. Python 文件读写

    Python 文件读写 Python内置了读写文件的函数,用法和C是兼容的.本节介绍内容大致有:文件的打开/关闭.文件对象.文件的读写等. 本章节仅示例介绍 TXT 类型文档的读写,也就是最基础的文件 ...

  9. python文件读写及形式转化和CGI的简单应用

    一丶python文件读写学习笔记 open() 将会返回一个 file 对象,基本语法格式如下: open(filename, mode) filename:包含了你要访问的文件名称的字符串值. mo ...

最新文章

  1. [ACM训练] ACM中巧用文件的输入输出来改写acm程序的输入输出 + ACM中八大输入输出格式...
  2. 你知道怎么离线安装全局 node 模块吗?
  3. Postman-汉化插件
  4. tcpclient java_[Java] 网络-01 TCPClient / TCPServer
  5. 猎豹傅盛:升维思考,降维攻击!(深度好文)
  6. 703. 数据流中的第K大元素
  7. office安装教程
  8. 机器学习和人工智能的关系是什么?
  9. 跨国项目要注意时区问题
  10. 计算机网络 之 DNS (Domain Name System)域名服务器
  11. java程序计算鸡兔同笼_.请编写一个Java程序,能够计算鸡兔同笼问题,已知笼中共有9个头和26只脚,要求计算出该笼中有几只兔子几...
  12. 我的STM32 IAP BOOT跳转到APP进入HardFault_Handler解决方案
  13. c语言自动填表chrome网页,Form Filler:自动填写表单
  14. Python—PEP8规范
  15. JavaScript的语法解析与抽象语法树
  16. Android第一行代码学习思考笔记(碎片、广播、持久化技术和Android数据库)
  17. 绘图库Matplotlib | Python技能树征题
  18. BERT 的 PyTorch 实现(超详细)
  19. 多功电子表是否采用计算机技术计量,浅谈电子式电能表应用的几点问题
  20. 计算机摄像,电脑摄像头工具

热门文章

  1. php7.0支持调用lua脚本
  2. php5和php7的bccomp计算精度区别
  3. Elasticsearch和MongoDB对比
  4. Linux之CentOS找不到configure
  5. CRMEB系统开发文档
  6. python 内网镜像站_Python|还是回归海龟与裸IDLE,准备卸载Anaconda
  7. java 中jtextfield访问限制_java.swing JtextField 中怎么限制只能输入数字
  8. java volatile线程可见_volatile-验证线程之间的可见性
  9. rpm安装的mysql如何数据迁移_linux下mysql数据库的rpm安装步骤及常见问题的解决
  10. python turtle库setpos_Python内置海龟(turtle)库绘图命令详解(二)