python目录和文件的基本操作_python学习笔记（七）—

目录和文件操作

语言只有和外部连起来操作才会实现更强大的功能，比如操作文件、数据库等，这样数据可以有一块单独存储的地方，而不是存放在内存中。更强大的是网络编程，当然这些后续都会学习。接下来学习python对目录和文件的操作。前面的笔记都是基础理论知识，我觉得从这里开始几乎就可以干一些事了。

有关文件夹与文件的查找，删除等功能在os模块中实现。使用时需先导入这个模块：import os

1、取得当前目录——os.getcwd()

>>> importos>>> s=os.getcwd()#获得当前运行脚本所在目录

>>>s'C:\\Python27'

比如运行test.py，那么输入该命令就会返回脚本所在的文件夹位置。

例如将test.py放入A文件夹。并且希望不管将A文件夹放在硬盘的哪个位置，都可以在A文件夹内生成一个新文件夹。且文件夹的名字根据时间自动生成。

>>> importos>>> importtime>>> folder = time.strftime(r"%Y-%m-%d_%H-%M-%S",time.localtime())>>> os.makedirs(r'%s/%s'%(os.getcwd(),folder)) #创建以时间命名文件夹名

这是运行脚本的目录即'C:\\Python27'下多了一个以当前时间命名的文件夹

2、创建子目录——os.makedirs("path")，path是要创建的子目录

>>> os.makedirs("C:\\temp\\test") #这是C盘下就创建了temp目录，temp下嵌套的文件夹是test

(当然，也可能创建失败，比如path已存在，或者驱动器不在，或者无写权限等等)

3、更改当前目录——os.chdir()

相当于dos或Linux下的cd命令

>>> os.chdir('c:\\') #将当前目录改为C盘根目录下

4、将路径分解为目录名和文件名——os.path.split()

格式为：fpath , fname = os.path.split( "要分解的路径")

>>> a,b=os.path.split("c:\\dir1\\dir2\\file.txt")>>> printa

c:\dir1\dir2>>> printb

file.txt

5、分解文件名的扩展名——os.path.splitext()

格式为：fpath_name , ftext = os.path.splitext( "要分解的路径")

>>> a,b=os.path.splitext("c:\\dir1\\dir2\\file.txt")>>> printa

c:\dir1\dir2\file>>> printb

.txt

6、判断一个路径（目录或文件）是否存在——os.path.exists()

格式为：os.path.exists(“要判断的路径或文件”)

>>> os.path .exists ("C:\\") #该路径存在

True>>> os.path .exists ("C:\\123\\") #该路径不存在

False>>> os.path .exists ("C:\\123.txt") #该文件不存在

False>>> os.path .exists ("C:\\test.txt") #该文件存在

True

7、判断一个路径是否有需要的文件——os.path.isfile("文件")

>>> os.path .isfile("C:\\test.txt")

True>>> os.path .isfile("C:\\123.txt")

False

8、判断一个路径是否存在——os.path.isdir("路径")

>>> os.path .isdir("C:\\")

True>>> os.path .isdir("H:\\")

False

9、获取目录中的文件及子目录的列表——os.listdir("路径")

相当于Windows下powershell中获取Get-ChildItem命令和Linux中的ls命令。但是这个显示不是以常见的列表的形式：

>>> os.listdir("C:\\") #这里包括隐藏文件也显示出来了

['$Recycle.Bin', '360ld', '360rescue', '360SANDBOX', '360SysRt', 'Boot', 'bootmgr', 'BOOTSECT.BAK', 'CacheTemp', 'Documents and Settings', 'grldr', 'IFRToolLog.txt', 'inetpub', 'MSOCache', 'pagefile.sys', 'Program Files', 'Program Files (x86)', 'ProgramData', 'Python27', 'Recovery', 'RECYCLER', 'SBTDR', 'System Volume Information', 'test.txt', 'Users', 'Windows']

>>> def getDirList( p ):

p = str( p )

if p=="":

return [ ]

p = p.replace( "/","\\")

if p[ -1] != "\\":

p = p+"\\"

a = os.listdir( p )

b = [ x for x in a if os.path.isdir( p + x ) ]

return b

>>> getDirList( "C:\\" )

['$Recycle.Bin', '360rescue', '360SANDBOX', '360SysRt', 'Boot', 'CacheTemp', 'Documents and Settings', 'inetpub', 'MSOCache', 'Program Files', 'Program Files (x86)', 'ProgramData', 'Python27', 'Recovery', 'RECYCLER', 'System Volume Information', 'Users', 'Windows']

获取指定目录下所有文件的列表

>>> def getFileList( p ):

p = str( p )

if p=="":

return [ ]

p = p.replace( "/","\\")

if p[ -1] != "\\":

p = p+"\\"

a = os.listdir( p )

b = [ x for x in a if os.path.isfile( p + x ) ]

return b

>>> getFileList( "C:\\" )

['360ld', 'bootmgr', 'BOOTSECT.BAK', 'grldr', 'IFRToolLog.txt', 'pagefile.sys', 'SBTDR', 'test.txt']

10、删除子目录——os.rmdir("path"),只能删除空目录

>>> os.rmdir("C:\\temp\\test") #注意只删除了test目录

>>> os.rmdir("C:\\temp") #这里才删除了temp目录

文件

python中模块的引入使得对文件的操作变的很简单。最基本的文件操作就是在文件中进行读写数据，在操作文件之前要打开文件。

打开文件——open('file'[,'mode'])

>>>import os

>>>os.getcwd()'c:\\'

>>> file=open('test.txt') #默认的mode是'r'，即读模式

>>>file.read() #读取文件内容'hello\nworld\nhello,python' # \n在文件中的形式是换行

mode的选项即含义如下：

模式

描述

以读方式打开文件，可读取文件信息。

以写方式打开文件，可向文件写入信息。如文件存在，则清空该文件，再写入新内容；如果文件不存在则创建

以追加模式打开文件（即一打开文件，文件指针自动移到文件末尾），如果文件不存在则创建

以读写方式打开文件，可对文件进行读和写操作。

消除文件内容，然后以读写方式打开文件。

以读写方式打开文件，并把文件指针移到文件尾。

以二进制模式打开文件，而不是以文本模式。该模式只对Windows或Dos有效，类Unix的文件是用二进制模式进行操作的。

关于文件的其他操作我觉得没必要记录的很详细了，因为基本都很简单，下面列出的是文件的常用方法，并且在例子中有相关说明。另外有一点注意的是读取文件中经常存在的编码问题。不同的解释器默认的编码不同，具体解决方案会再介绍。

常见文件操作方法：

方法

描述

f.close()

关闭文件，记住用open()打开文件后一定要记得关闭它，否则会占用系统的可打开文件句柄数。

f.name()

获取文件名称

f.next()

返回下一行，并将文件操作标记位移到下一行。把一个file用于for … in file这样的语句时，就是调用next()函数来实现遍历的。

f.fileno()

获得文件描述符，是一个数字。返回一个长整型的”文件标签“

f.flush()

刷新输出缓存，把缓冲区的内容写入硬盘

f.isatty()

如果文件是一个终端设备文件（Linux系统中），则返回True，否则返回False。

f.read([size])

读出文件，size为读取的长度，以byte为单位

f.readline([size])

读出一行信息，若定义了size，则读出一行的一部分

f.readlines([size])

读出所有行，也就是读出整个文件的信息。(把文件每一行作为一个list的一个成员，并返回这个list。其实它的内部是通过循环调用readline()来实现的。如果提供size参数，size是表示读取内容的总长，也就是说可能只读到文件的一部分)

f.seek(offset[,where])

把文件指针移动到相对于where的offset位置。where为0表示文件开始处，这是默认值；1表示当前位置；2表示文件结尾。(注意：如果文件以a或a+的模式打开，每次进行写操作时，文件操作标记会自动返回到文件末尾)

f.tell()

获得文件指针位置，标记当前位置，以文件开头为原点

f.truncate([size])

把文件裁成规定的大小，默认的是裁到当前文件操作标记的位置。如果size比文件的大小还要大，依据系统的不同可能是不改变文件，也可能是用0把文件补到相应的大小，也可能是以一些随机的内容加上去。

f.write(string)

把string字符串写入文件，write()不会在str后加上一个换行符。

f.writelines(list)

把list中的字符串一行一行地写入文件，是连续写入文件，没有换行。

现有一个test.txt文件，格式如下：

hello

world

hello

python

下面是一些常见操作：

>>> file=open('test.txt')>>> file.read (4) #读取前4个字节

'hell'

>>> file.read(6) #注意这里是在刚才读过的基础上再向后读的

'o\nworl'

>>> file.read () #不指定size，则读到文件结尾

'd\nhello\npython'

>>> file.read() #再读时已是文件结尾

>>> file.seek(0) #将文件位置定位到第一个字节

>>> file.readline () #一次读一行

'hello\n'

>>>file.readline ()'world\n'

>>> file.seek(0) #将文件定位到开始

>>> file.readlines () #读取整个文件的内容

['hello\n', 'world\n', 'hello\n', 'python']>>> file .tell() #读完之后显示seek位置，即文件的最后了

27L #以长整型表示

>>> file.name #查看文件的名称'test.txt'

>>> file.close() #关闭文件

刚开始测试read和readline等用法的时候，因为只要读取一次就在上次基础上往后读，当时我还以为这是一个出栈操作，显然，知道有seek这个方法后，我才知道它不是，只是每次读的时候seek的位置就往后移动一个，而每次读取是以seek所在的位置为起点的。所以如果需要从头开始读取文件内容时，将文件位置设为开始即可，即seek(0)。

>>> file=open('test.txt','w')>>> file.write ('\nwelcome') #会将之前的内容覆盖

>>> file.writelines ('I love python')>>> file.close () #关闭文件时才能看到文件内容的修改

>>> file=open('test.txt','a') #追加到文件尾，而不会覆盖

>>> file.writelines ('this is a test')>>> file.close()

对文件的相关操作有时需要引入shutil模块：

>>> importshutil>>> shutil.copyfile('test.txt','123.txt') #参数只能是文件

>>> shutil.copy("olddir","newfileordir") #olddir只能是文件夹，newfile可以是文件，也可以是目标目录

>>> shutil.copytree("olddir","newdir") #olddir和newdir都只能是目录，且newdir必须不存在

>>> shutil.move("oldpos","newpos") #移动文件或目录

>>> shutil.rmtree("dir") #空目录、有内容的目录都可以删

>>> importos

>>> os.rmdir("dir") #只能删除空目录>>> os.remove("file") #删除文件

>>> os.rename("oldname","newname") #文件或目录都是使用这条命令

文件编码：

#获得当前环境默认编码

>>> importsys>>> importlocale>>>sys.getdefaultencoding() # 返回当前系统所使用的默认字符编码'ascii'

>>>sys.getfilesystemencoding () # 返回用于转换Unicode文件名至系统文件名所使用的编码'mbcs'

>>>locale.getdefaultlocale() # 获取默认的区域设置并返回元组(语言, 编码)

('zh_CN', 'cp936')>>>locale .getpreferredencoding () # 返回用户设定的文本数据编码'cp936'

python目录和文件的基本操作_python学习笔记（七）——文件和目录操作相关推荐

python读取文件路径格式_Python学习笔记读写文件之文件与文件路径
随笔记录方便自己和同路人查阅. #------------------------------------------------我是可耻的分割线--------------------------- ...
python文件是什么的集合和抽象_python学习笔记(三):文件操作和集合
这篇博客来说一下python对文件的操作. 对文件的操作分三步: 1.打开文件获取文件的句柄,句柄就理解为这个文件 2.通过文件句柄操作文件 3.关闭文件. 现有以下文件file.txt: 1 2 3 ...
python shutil删除文件_Python学习笔记组织文件之shutil模块
随笔记录方便自己和同路人查阅. #------------------------------------------------我是可耻的分割线--------------------------- ...
python文本进度条94页_Python学习笔记 | 实例4：文本进度条
本文为中国大学MOOC<Python语言程序设计>课程学习笔记,课程主讲:嵩天老师,练习平台:Python123,参考教材:<Python语言程序设计基础> 文本进度条-简单的 ...
python提取图片文字视频教学_Python学习第七天之爬虫的学习与使用（爬取文字、图片、视频）...
一.爬虫记得基本方法 1.1 爬虫概述网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.另外一些不常使 ...
python爬取文字和图片_Python学习第七天之爬虫的学习与使用（爬取文字、图片、视频）...
[toc] 一.爬虫记得基本方法 1.1 爬虫概述网络爬虫(又被称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页追逐者),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本. ...
python爬取基金历史净值_Python学习笔记之抓取某只基金历史净值数据实战案例
摘要:这篇Python开发技术栏目下的"Python学习笔记之抓取某只基金历史净值数据实战案例",介绍的技术点是"Python学习笔记.Python.历史净值数据.学习笔 ...
python3 读取.plist文件_Python学习笔记 -5 - 文件操作
Python文件操作读写文件是最常见的IO操作,在磁盘上读写文件的功能都是由操作系统提供的,操作系统不允许普通的程序直接操作磁盘(大部分程序都需要间接的通过操作系统来完成对硬件的操作),所以,读写文 ...
python列表和元组的应用_python学习笔记之列表(list)与元组(tuple)详解
前言最近重新再看python的基础知识,感觉自己还是对于这些知识很陌生,需要用的时候还是需要翻书查阅,还是先注重基础吧--我要重新把python的教程阅读一遍,把以前自己忽略的部分学习,加强练习和记 ...

python目录和文件的基本操作_python学习笔记（七）——文件和目录操作

python目录和文件的基本操作_python学习笔记（七）——文件和目录操作相关推荐

最新文章

热门文章