文件的操作,归根结底就只有两种:打开文件、操作文件

一、打开文件:文件句柄= open('文件路径','模式')

python中打开文件有两种方式,即:open(...) 和  file(...),本质上前者在内部会调用后者来进行文件操作,在这里我们推荐使用open,解释

二、操作文件

操作文件包括了文件的读、写和关闭,首先来谈谈打开方式:当我们执行 文件句柄= open('文件路径','模式') 操作的时候,要传递给open方法一个表示模式的参数:

打开文件的模式有:

r,只读模式(默认)。

w,只写模式。【不可读;不存在则创建;存在则删除内容;】

a,追加模式。【可读;   不存在则创建;存在则只追加内容;】

"+" 表示可以同时读写某个文件

r+,可读写文件。【可读;可写;可追加】

w+,先写再读。【这个方法打开文件会清空原本文件中的所有内容,将新的内容写进去,之后也可读取已经写入的内容】

a+,同a

"U"表示在读取时,可以将 \r \n \r\n自动转换成 \n(注意:只能与 r 或 r+ 模式同使用)

rU

r+U

rbU

rb+U

"b"表示处理二进制文件(如:FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)

rb

wb

ab

以下是file操作的源码解析:

1 class file(object):

2

3 def close(self): # real signature unknown; restored from __doc__

4 关闭文件

5

6 """close() -> None or (perhaps) an integer. Close the file.

7

8 Sets data attribute .closed to True. A closed file cannot be used for

9 further I/O operations. close() may be called more than once without

10 error. Some kinds of file objects (for example, opened by popen())

11 may return an exit status upon closing.

12 """

13

14 def fileno(self): # real signature unknown; restored from __doc__

15 文件描述符

16

17 """fileno() -> integer "file descriptor".

18

19 This is needed for lower-level file interfaces, such os.read(). """

20

21 return 0

22

23 def flush(self): # real signature unknown; restored from __doc__

24 刷新文件内部缓冲区

25

26 """ flush() -> None. Flush the internal I/O buffer. """

27

28 pass

29

30 def isatty(self): # real signature unknown; restored from __doc__

31 判断文件是否是同意tty设备

32

33 """ isatty() -> true or false. True if the file is connected to a tty device. """

34

35 return False

36

37 def next(self): # real signature unknown; restored from __doc__

38 获取下一行数据,不存在,则报错

39

40 """ x.next() -> the next value, or raise StopIteration """

41

42 pass

43

44

45

46 def read(self, size=None): # real signature unknown; restored from __doc__

47 读取指定字节数据

48

49 """read([size]) -> read at most size bytes, returned as a string.

50

51 If the size argument is negative or omitted, read until EOF is reached.

52 Notice that when in non-blocking mode, less data than what was requested

53 may be returned, even if no size parameter was given."""

54

55 pass

56

57 def readinto(self): # real signature unknown; restored from __doc__

58 读取到缓冲区,不要用,将被遗弃

59

60 """ readinto() -> Undocumented. Don't use this; it may go away. """

61

62 pass

63

64

65 def readline(self, size=None): # real signature unknown; restored from __doc__

66 仅读取一行数据

67 """readline([size]) -> next line from the file, as a string.

68

69 Retain newline. A non-negative size argument limits the maximum

70 number of bytes to return (an incomplete line may be returned then).

71 Return an empty string at EOF. """

72

73 pass

74

75 def readlines(self, size=None): # real signature unknown; restored from __doc__

76 读取所有数据,并根据换行保存值列表

77

78 """readlines([size]) -> list of strings, each a line from the file.

79

80 Call readline() repeatedly and return a list of the lines so read.

81 The optional size argument, if given, is an approximate bound on the

82 total number of bytes in the lines returned. """

83

84 return []

85

86

87

88 def seek(self, offset, whence=None): # real signature unknown; restored from __doc__

89 指定文件中指针位置

90 """seek(offset[, whence]) -> None. Move to new file position.

91

92 Argument offset is a byte count. Optional argument whence defaults to

93 0 (offset from start of file, offset should be >= 0); other values are 1

94 (move relative to current position, positive or negative), and 2 (move

95 relative to end of file, usually negative, although many platforms allow

96 seeking beyond the end of a file). If the file is opened in text mode,

97 only offsets returned by tell() are legal. Use of other offsets causes

98 undefined behavior.

99 Note that not all file objects are seekable. """

100

101 pass

102

103

104

105 def tell(self): # real signature unknown; restored from __doc__

106 获取当前指针位置

107

108 """ tell() -> current file position, an integer (may be a long integer). """

109 pass

110

111

112 def truncate(self, size=None): # real signature unknown; restored from __doc__

113 截断数据,仅保留指定之前数据

114

115 """ truncate([size]) -> None. Truncate the file to at most size bytes.

116

117 Size defaults to the current file position, as returned by tell().“""

118

119 pass

120

121

122

123 def write(self, p_str): # real signature unknown; restored from __doc__

124 写内容

125

126 """write(str) -> None. Write string str to file.

127

128 Note that due to buffering, flush() or close() may be needed before

129 the file on disk reflects the data written."""

130

131 pass

132

133 def writelines(self, sequence_of_strings): # real signature unknown; restored from __doc__

134 将一个字符串列表写入文件

135 """writelines(sequence_of_strings) -> None. Write the strings to the file.

136

137 Note that newlines are not added. The sequence can be any iterable object

138 producing strings. This is equivalent to calling write() for each string. """

139

140 pass

141

142

143

144 def xreadlines(self): # real signature unknown; restored from __doc__

145 可用于逐行读取文件,非全部

146

147 """xreadlines() -> returns self.

148

149 For backward compatibility. File objects now include the performance

150 optimizations previously implemented in the xreadlines module. """

151

152 pass

针对上面源码中的个方法,可以具体看一下在实际操作中的用例:

obj1 = open('filetest.txt','w+')

obj1.write('I heard the echo, from the valleys and the heart\n')

obj1.writelines(['Open to the lonely soul of sickle harvesting\n',

'Repeat outrightly, but also repeat the well-being of\n',

'Eventually swaying in the desert oasis'])

obj1.seek(0)

print obj1.readline()

print obj1.tell()

print obj1.readlines()

obj1.close()

我们以‘w+’的打开方式为例,write是向文件中写入一个字符串,而writelines是想文件中写入一个字符串数组。seek(0)方法是将指针指向其实位置,因为在写的过程中,指针的标记是随着写入的内容不断后移的,seek方法可以将指针移动到指定位置,而这个时候就指向0位置,从这个位置开始读,就可以读到刚刚写入的所有内容了;readline()是从指针位置读取一行,所以在这里,执行readline会将刚刚写入文件中的第一行读取出来;tell是指出指针当前的位置,这个时候执行tell()方法,指针指向了第二行的起始位置;之后的readlines方法,则会将文件当前指针之后的剩余内容按行读入数组中。下图是程序执行后文件和控制台的结果:

尽管刚刚使用'w+'的方式打开文件,但是事实上这种打开方式在文件处理中并不常用,曾一度被我们老师评为‘无意义’,因为用‘w+’方法会清空原文件里所有的东西~

上面一口气介绍了那么多方法,让我们有了一个笼统的概念,接下来把这些方法们各功能拿出来对比下:

写文件操作

write,writelines,相比于那些五花八门的读方法,写方法就单纯的多了,只有wite和writelines两种。看下面的例子和写入的结果,其实write方法和writelines方法都差不多,只不过一个接受的参数是list格式,一个接受的参数是字符串格式而已。这里使用的时候要注意换行符。

1 obj1 = open('E:\PythonL\\11-8\\filetest.txt','r')

2 obj1 = open('filetest.txt','w+')

3 obj1.write('I heard the echo, from the valleys and the heart\nOpen to the lonely soul of sickle harvesting\n')

4 obj1.writelines([

5 'Repeat outrightly, but also repeat the well-being of\n',

6 'Eventually swaying in the desert oasis'

7 ])

刚刚我们使用write和writelines方法向文件里写入了泰戈尔的一段小诗,结果如下:

I heard the echo, from the valleys and the heart

Open to the lonely soul of sickle harvesting

Repeat outrightly, but also repeat the well-being of

Eventually swaying in the desert oasis

读文件操作

我们以上面这个文件为例,来说说读文件:

首先来看一下直接读取文件中所有内容的方法read和readlines,从下面的结果来看就知道这两种方法一个返回列表,一个是返回字符串,和上面的write方法相对应:

1 #readline方法

2 obj1 = open('E:\PythonL\\11-8\\filetest.txt','r')

3 print 'readlines:',obj1.readlines()5 #readline方法

6 print "read:",obj1.read()

1 readlines: ['I heard the echo, from the valleys and the heart\n', 'Open to the lonely soul of sickle harvesting\n', 'Repeat outrightly, but also repeat the well-being of\n', 'Eventually swaying in the desert oasis']

1 read: I heard the echo, from the valleys and the heart

2 Open to the lonely soul of sickle harvesting

3 Repeat outrightly, but also repeat the well-being of

4 Eventually swaying in the desert oasis

readlines和read方法虽然简便好用,但是如果这个文件很庞大,那么一次性读入内存就降低了程序的性能,这个时候我们就需要一行一行的读取文件来降低内存的使用率了。

readline,next,xreadlines:用来按行读取文件,其中需要仔细看xreadlines的用法,因为xreadlines返回的是一个迭代器,并不会直接返回某一行的内容

需要注意的是,尽管我把这一大坨代码放在一起展示,但是要是真的把这一大堆东西放在一起执行,就会报错(ValueError: Mixing iteration and read methods would lose data),具体的原因下面会进行解释。

1 obj1 = open('E:\PythonL\\11-8\\filetest.txt','r')

2 #readline方法

3 print "readline:",obj1.readline()

5 #readline方法

6 print "next:",obj1.next()

8 #readline方法

9 r = obj1.xreadlines()

10 print 'xreadlines:',r.next()

12 #readline方法

13 print 'readlines:',obj1.readlines()

15 #readline方法

16 print "read:",obj1.read()

先展示一下执行上面这些程序的结果好了:

左侧是代码,右侧是相应的执行结果。这里先展示readline,next,xreadlines这三个方法。

1 readline: I heard the echo, from the valleys and the heart

2

3 next: Open to the lonely soul of sickle harvesting

4

5 xreadlines: Repeat outrightly, but also repeat the well-being of

这里要补充一点,xreadlines方法在python3.0以后就被弃用了,它被for语句直接遍历渐渐取代了:

1 obj1 = open('filetest.txt','r')

2 for line in obj1:

3 print line

4

5 运行结果:

6 I heard the echo, from the valleys and the heart

7

8 Open to the lonely soul of sickle harvesting

9

10 Repeat outrightly, but also repeat the well-being of

11

12 Eventually swaying in the desert oasis

文件中的指针

看完了文件的读写,文件的基本操作我们就解决了,下面介绍文件处理中和指针相关的一些方法: seek,tell,truncate

1 obj1 = open('filetest.txt','w+')

2 obj1.write('I heard the echo, from the valleys and the heart\n'

3 'Open to the lonely soul of sickle harvesting\n')

4 print '1.tell:',obj1.tell()

5 obj1.writelines([

6 'Repeat outrightly, but also repeat the well-being of\n',

7 'Eventually swaying in the desert oasis'

8 ])

9 print '2.tell:',obj1.tell()

首先看tell,tell的作用是指出当前指针所在的位置。无论对文件的读或者写,都是依赖于指针的位置,我们从指针的位置开始读,也从指针的位置开始写。我们还是写入之前的内容,在中间打印一下tell的结果。执行代码后结果如下:

1.tell: 96

2.tell: 188

接下来再看一下seek的使用:

1 obj1 = open('E:\PythonL\\11-8\\filetest.txt','r')

2 print "next:",obj1.next(),'tell1:',obj1.tell(),'\n'

3 obj1.seek(50)

4 print "read:",obj1.read(),'tell2:',obj1.tell(),'\n'

next: I heard the echo, from the valleys and the heart

tell1: 188

read: Open to the lonely soul of sickle harvesting

Repeat outrightly, but also repeat the well-being of

Eventually swaying in the desert oasis tell2: 188

从显示的执行结果来看这个问题,我们在使用next读取文件的时候,使用了tell方法,这个时候返回的是188,指针已经指向了tell的结尾(具体原因在下面解释),那么我们执行read方法,就读不到内容了,这个时候我们使用seek方法将指针指向50这个位置,再使用中read方法,就可以把剩下的内容读取出来。

在看一个关于truncate的例子:

1 obj1 = open('filetest.txt','r+')

2

3 obj1.write('this is a truncate test,***')

4 obj1.seek(0)

5 print 'first read:\n',obj1.read()

6

7 obj1.seek(0)

8 obj1.write('this is a truncate test')

9 obj1.truncate()

10 obj1.seek(0)

11 print '\nsecond read:\n',obj1.read()

1 first read:

2 this is a truncate test,***valleys and the heart

3 Open to the lonely soul of sickle harvesting

4 Repeat outrightly, but also repeat the well-being of

5 Eventually swaying in the desert oasis

6

7 second read

8 this is a truncate test

有上面的打印结果我们可以知道,在文件进行写操作的时候,会根据指针的位置直接覆盖相应的内容,但是很多时候我们修改完文件之后,后面的东西就不想保留了,这个时候我们使用truncate方法,文件就仅保存当前指针位置之前的内容。我们同样可以使用truncate(n)来保存n之前的内容,n表示指针位置。

with操作文件

为了避免打开文件后忘记关闭,可以通过管理上下文,即:with open('文件路径','操作方式') as 文件句柄:

1 #使用whith打开可以不用close

2 with open('E:\PythonL\\filetest.txt','r') as file_obj:

3 file_obj.write('')

4

5 #在Python 2.7 后,with又支持同时对多个文件的上下文进行管理,下例为同时打开两个文件

6 #with open('E:\PythonL\\filetest1.txt','r') as file_obj1,open('E:\PythonL\\filetest2.txt','w') as file_obj2:'''

容易犯的错误:

ValueError: Mixing iteration and read methods would lose data

我在操作文件的过程中遇到过这样一个问题,从字面上来看是说指针错误,那么这种问题是怎么产生的呢?我发现在使用next或者xreadlines方法之后再使用read或readlines方法就会出现这种错误,原因是next或者xreadlines包括我们平时常用的for循环读取文件的方式,程序都是在自己内部维护了一个指针(这也解释了我们使用这些方法的时候再用tell方法拿到的指针都是指向了的文件末尾,而不是当前独到的位置),所以如果我们要先使用上述的next或者xreadlines方法读取一行,然后再用read或readlines方法将剩余的内容读到就会报错。

解决方案:

这个时候有两种解决方案:

第一种,在读取一行后,用seek指定指针的位置,就可以继续使用其他方法了

第二种,使用readline方法,这个方法没有内部维护的指针,它就是辣么单纯的一行一行傻傻的读,指针也就傻傻的一行一行往下移动。这个时候你也可以使用tell方法追踪到指针的正确位置,也可以使用seek方法定位到想定位的地方,配合truncate,wirte等方法,简直不能更好用一些。

python如何使用文件_Python的文件操作相关推荐

  1. python以读写方式打开文件_python读写文件操作详细介绍【传智播客】

    Python文件的打开或创建可以使用函数open().该函数可以指定处理模式,设置打开的文件为只读.只写或可读写状态.open()的声明如下所示. open(file, mode='r', buffe ...

  2. python引入同目录文件_Python的文件目录操作

    录也称文件夹,用于分层保存文件.通过目录可以分门别类地存放文件.我们也可以通过目录快速找到想要的文件.在Python中,并没有提供直接操作目录的函数或者对象,而是需要使用内置的os和os.path模块 ...

  3. python基础文档_python基本文件操作

    python文件操作 python的文件操作相对于java复杂的IO流简单了好多,只要关心文件的读和写就行了 基本的文件操作 要注意的是,当不存在某路径的文件时,w,a模式会自动新建此文件夹,当读模式 ...

  4. python 读写utf8文件_Python关于 文件读写的总结

    # 文件的操作 # 打开文件 open # 默认的编码是gbk 这个是中文编码,最好的习惯呢就是我们再打开一个文件的时候 # 给它指定一个编码类型 # fobj=open('./Test.txt',' ...

  5. python编程头文件_python头文件怎么写

    本文主要以python2为例.首先介绍一下Python头文件的编程风格,然后再给大家详细介绍import部分的基本用法.这两个部分就是Python中头文件的组成模块. 编程风格#!/usr/bin/e ...

  6. python def return 文件_python基础-文件处理与函数

    1. 文件处理 1.1 文件处理流程 1.打开文件,得到文件句柄并赋值给一个变量 2.通过句柄对文件进行操作 3.关闭文件 1.2 文件读取模式r r文本模式的读,在文件不存在,不会创建新文件 f = ...

  7. python素材和代码_python之文件和素材

    11.1 打开文件 open函数 open(name[,mode[,buffering]]) >>>f = open(r'C:\text\somefile.txt') 11.1.1 ...

  8. unity webgl读写txt文件_python Files文件读写操作

    今天学习python的Files文件读写操作,并记录学习过程欢迎大家一起交流分享. 首先新建一个文本文件test.txt,内容如下: hello worldhello youhello mehello ...

  9. python编程头文件_python头文件的编程风格

    python头文件的编程风格 发布时间:2020-09-03 10:23:25 来源:亿速云 阅读:96 作者:小新 小编给大家分享一下python头文件的编程风格,希望大家阅读完这篇文章后大所收获, ...

最新文章

  1. Silverlight4.0教程之使用CompositeTransform复合变形特效实现倒影
  2. 非科班Java尝试全国高校计算机能力挑战赛第三届计挑赛
  3. 广义表的基本概念【数据结构】
  4. mysql 1317,MySQL 中的-Error_code:1317-爱可生
  5. Pandas dataframe列名重命名
  6. Ionic系列——调用系统电话
  7. error C2440 无法转换到 AFX_PMSG mfc自定义信号及实现 PostMessage FindWindow
  8. PC USB Warning
  9. 【NOIP2012提高组】开车旅行
  10. 配置接口IP地址并通过静态路由、默认路由配置实现全网互通!
  11. 瓦克美国多晶硅基地爆炸 多晶硅及硅片或涨价
  12. 组合、聚合、继承详解
  13. Linux初装gitlab初始默认密码
  14. 在英语中什么时候该用主格,什么时候该用宾格呢?
  15. css3雨滴掉落水面网页动画
  16. 利用matlab绘制系统开环幅频渐进特性曲线(附详细注释)
  17. linux连接ps4手柄,PS4模拟器新视频公布:已可进入安全模式菜单 支持PS4手柄
  18. 简单的掷骰子游戏(Java、UI界面)
  19. 艾永亮:从产品功能需求到打造超级产品过程中,企业经历了什么?
  20. ​​电源完整性仿真案例

热门文章

  1. go语言判断手机号归属地
  2. 什么?使用cmd登陆mysql的命令忘了?我辞职学习去了。。。
  3. 为什么需要MapReduce?
  4. java基础---instanceof关键字
  5. 【JavaScript】前端模块化:import 和 export 的使用
  6. 数据结构 - 链表 - 面试中常见的链表算法题
  7. java中CyclicBarrier的使用
  8. 分布式系统Quorum机制
  9. Kafka使用Java客户端进行访问
  10. Windows 上配置Docker Desktop 的k8s