文章目录

  • 1.按照扩展名进行分类
  • 2.导出文件的大小
  • 3.计算文件夹大小
  • 4.分类到字典
  • 5.完整代码及效果

1.按照扩展名进行分类

使用Python查询一个路径下的所有文件可以借助glob模块以及os模块。
在导入文件列表之前,我们需要指定我们的操作目录,操作目录一经指定,在后续的函数中默认查找路径即为当前设定的值。
注意:

  • 区分文件(file)和文件夹(folder),二者没有交集。
  • 完整路径名=路径(path)+文件名(filename)
  • 文件名=短文件名(shortname)+拓展名(extension)

以下简单介绍几个函数的功能:

  1. os.getcwd()——返回操作目录
  2. os.chdir(Current_dir)——将Current_dir设置为当前操作路径
  3. glob.glob("*.*")——返回操作目录下的所有文件
  4. glob.glob("*.pdf")——返回操作目录下所有PDF类型的文件
  5. glob.glob("*test*.*")——返回含有test的任意文件
  6. glob.glob("*test*.pdf)——返回操作目录下含“test”的pdf文件
  7. glob.glob("**",recursive=True)——返回该目录下所有文件夹和文件路径
  8. os.listdir()——列出该操作目录下的所有文件及其文件夹
  9. (dirname,filename)=os.path.split(pathname)——将完整路径名的路径和文件名分离
  10. (shortname,extension)=os.path.splitext(filename)——将短文件名和拓展名分离
    在本例中,我们需要加载的模块就是两个:
import os, glob

2.导出文件的大小

os.stat(file).st_size可以导出file文件的大小(单位是B),其中file必须是文件名(短文件名+拓展名)组成的字符串,由于之前已经制定了操作目录,所以不需要列出完整路径。但是仅能显示B的大小是不易识别的,我们可以写一个函数来将文件大小级别分为B,KB,MB,GB,TB几个档次,每一个级别的系数都小于1024。编写函数如下:

def size_variable(file_size):# 将文件大小转换为可视化数据if file_size<2**10:return str(file_size)+"B"   # <1KB用单位B表示elif file_size<2**20:return format(file_size/(2**10),".2f")+"KB" # >1KB且<1MB用单位KB表示elif file_size<2**30:return format(file_size/(2**20),".2f")+"MB" # >1MB且<1GB用单位MB表示elif file_size<2**40:return format(file_size/(2**30),".2f")+"GB" # >1GB且<1TB用单位GB表示else:return format(file_size/(2**40),".2f")+"TB" # >1TB直接用TB表示

3.计算文件夹大小

计算文件夹大小和计算文件大小有所区别,在这里我们可以给定一个函数计算文件夹目录下的所有文件,再依次打开每个文件夹,按照同样的函数递归求和,最终得出文件夹所包含的文件总和。这么做固然可以,但缺点也很明显——第一,作为递归算法,当文件夹层数较多但是文件数目不大时,该代码运行效率低;第二,该代码需要在函数内部加入递归环节,书写复杂。
因此,在此提供一种简单的方法计算文件夹的大小,即调用第一部分的函数7——glob("**",recursive=True)导出所有的路径。这是一个很方便的做法,我们可以将路径更新至我们需要计算的文件夹下,再调用此方法。同时利用列表解析,筛选出有拓展名的路径(即真正是文件的路径path,因为只有文件具有大小),最后把他们的大小加起来,即得到我们需要的文件夹大小,书写函数如下:

def folder_size(folder):os.chdir(os.path.join(Current_dir,folder))  # 更新当前的操作目录为文件夹下目录all_files = glob.glob('**', recursive=True)  # 导入所有文件路径all_files = [file for file in all_files if os.path.splitext(file)[1]]   # 筛选出该文件夹下所有文件(包含子目录文件)all_files_size = [os.stat(file).st_size for file in all_files]  # 将所有文件大小统计至列表os.chdir(Current_dir)   # 还原原操作目录return sum(all_files_size)  # 返回所有文件的大小(单位B)

4.分类到字典

如果说要显示一个文件列表的话,按照扩展名分类到字典是最不错的选择,将文件拓展名保存至一个集合(或列表),将文件名保存到一个列表,再将文件夹保存到一个列表,最后运用字典解析构造字典(每一个键对应的值都是一个列表,对于每一个文件,以该文件的拓展名为键,将其短文件名添加到该键对应的值(一个列表)中)。
在这个示例中需要同时导出文件和文件夹,那么os.listdir()即是最好的选择。然而情况并没有这么简单——文件夹和文件是需要作区分的,这个区分在于文件夹没有extension(文件拓展名)属性,利用此方法将文件夹单独分离出来,单独构成一键添加到字典。

5.完整代码及效果

当前目录为:

"""文件系统查看器
查看该系统目录下的文件并分类显示
该文件查看器具有显示文件大小及其文件夹大小的功能"""
__author__ = "ouni"
__version__ = "V1.1"
__date__ = "$Date:2019/2/25"
__copyright__ = "Copyright (c) 2019 欧倪"
__license__ = "Python3.6.5"
import os, glob  # 载入文件系统Python模块
Current_dir = r'C:\Users\ouni\AppData\Local\Programs\Python\Python36'
Initial_dir = os.getcwd()def size_variable(file_size):# 将文件大小转换为可视化数据if file_size<2**10:return str(file_size)+"B"   # <1KB用单位B表示elif file_size<2**20:return format(file_size/(2**10),".2f")+"KB" # >1KB且<1MB用单位KB表示elif file_size<2**30:return format(file_size/(2**20),".2f")+"MB" # >1MB且<1GB用单位MB表示elif file_size<2**40:return format(file_size/(2**30),".2f")+"GB" # >1GB且<1TB用单位GB表示else:return format(file_size/(2**40),".2f")+"TB" # >1TB直接用TB表示def print_dict(dict1):# 打印字典for key in dict1.keys():print(str(key)+':')for filename in dict1[key]:print(' '*len(key)+'|'+str(filename))def write_dict(dict1,file1):# 保存字典for key in dict1.keys():file1.writelines(str(key)+':\n')for filename in dict1[key]:file1.writelines(' '*3+'|'+str(filename)+'\n')def folder_size(folder):os.chdir(os.path.join(Current_dir,folder))  # 更新当前的操作目录为文件夹下目录all_files = glob.glob('**', recursive=True)  # 导入所有文件路径all_files = [file for file in all_files if os.path.splitext(file)[1]]   # 筛选出该文件夹下所有文件(包含子目录文件)all_files_size = [os.stat(file).st_size for file in all_files]  # 将所有文件大小统计至列表os.chdir(Current_dir)   # 还原原操作目录return sum(all_files_size)  # 返回所有文件的大小(单位B)print("当前操作目录为:%s" % Current_dir)
os.chdir(Current_dir)    # 更新默认奥做系统为当前目录
Files = glob.glob('*.*')  # 所有文件的目录,导入之后为list格式
Folders_and_Files = os.listdir(Current_dir)  # 导入所有路径
Folders = [folder+"("+size_variable(folder_size(folder))+")" for folder in Folders_and_Files if not os.path.splitext(folder)[1]]  # 没有文件后缀名的是文件夹
File_Ext = [os.path.splitext(file)[1] for file in Files]  # 文件的扩展名列表
File_Ext = list(set(File_Ext))  # 先转换为集合再转换为列表,去除所有重复元素
File_Ext.append("Folders")  # 人为添加文件夹类型的扩展名,以供字典解析
File_Dict = {Ext: [] for Ext in File_Ext}  # 以文件扩展名为关键字构成的字典
for file in Files:  # 将文件扩展名添加至字典Ext = os.path.splitext(file)[1]  # 获得拓展名File_Dict[Ext].append(os.path.splitext(file)[0]+'('+size_variable(os.stat(file).st_size)+')')   # 加入字典文件名信息及其大小
File_Dict["Folders"].extend(Folders)  # 将文件夹全部录入字典
print_dict(File_Dict)
os.chdir(r"C:\Users\ouni\桌面")
with open('%s_File_Dir.txt' % os.path.split(Current_dir)[1], mode='w', encoding='utf-8') as a_file:a_file.write("文件系统目录为%s\n" % Current_dir)write_dict(File_Dict, a_file)os.chdir(Initial_dir)   # 恢复原始路径,供Python Console或者Python Shell调试

输出效果如下:

我们随便打开几个文件夹查看一下大小:

我们标定的是2.15MB

我们标定的是1.57MB

我们标定的是486B
可以看出,文件夹的大小和资源管理器标出的略有差异,但是差异较小,另外需注意这个文件大小和实际占用大小的区别,一般情况下由于存储空间不能100%利用,实际占用大小都会略大于文件大小。
通过修改Current_dir可以得到不同目录下的文件列表。可以看出文本文档中的文件目录和资源管理器中的一致。
最后值得一提的是本代码的帮助文档,按照此格式书写的帮助(放在所有代码开头):

"""文件系统查看器
查看该系统目录下的文件并分类显示
该文件查看器具有显示文件大小及其文件夹大小的功能"""
__author__ = "ouni"
__version__ = "V1.1"
__date__ = "$Date:2019/2/25"
__copyright__ = "Copyright (c) 2019 欧倪"
__license__ = "Python3.6.5"

假若在调试器中(Python Console或者Shell IDLE)调用help函数,也可以很方便地得到该模块信息,以下为在Shell中的场景:

>>> import File_Directory
当前操作目录为:C:\Users\ouni\AppData\Local\Programs\Python\Python36
>>> print(File_Directory.__doc__)
文件系统查看器
查看该系统目录下的文件并分类显示
该文件查看器具有显示文件大小及其文件夹大小的功能
>>> help(File_Directory)
Help on module File_Directory:NAMEFile_DirectoryDESCRIPTION文件系统查看器查看该系统目录下的文件并分类显示该文件查看器具有显示文件大小及其文件夹大小的功能FUNCTIONSfolder_size(folder)print_dict(dict1)size_variable(file_size)write_dict(dict1, file1)DATACurrent_dir = r'C:\Users\ouni\AppData\Local\Programs\Python\Python36'Ext = '.dll'File_Dict = {'.dll': ['python3(57.15KB)', 'python36(3.44MB)', 'vcrunti...File_Ext = ['.dll', '.exe', '.txt', '.pth', '.py', 'Folders']Files = ['LICENSE.txt', 'NEWS.txt', 'PIL.pth', 'python.exe', 'python3....Folders = ['DLLs(11.10MB)', 'Doc(7.65MB)', 'exercises(644B)', 'include...Folders_and_Files = ['DLLs', 'Doc', 'exercises', 'include', 'Lib', 'li...Initial_dir = r'C:\Users\ouni\桌面\办公\编程\Python 3.6\Python3入门教程\文件系统'__copyright__ = 'Copyright (c) 2019 ouni'__license__ = 'Python3.6.5'a_file = <_io.TextIOWrapper name='Python36_File_Dir.txt' mode='w' enco...file = 'vcruntime140.dll'VERSIONV1.1DATE$Date:2019/2/25AUTHORouniFILEc:\users\ouni\桌面\办公\编程\python 3.6\python3入门教程\文件系统\file_directory.py

【Python】导入资源管理器的文件列表(计算文件和文件夹大小)相关推荐

  1. “不能初始化PHOTOSHOP,因为该文件已锁定.在WINDOWS资源管理器中使用属性命令来解锁文件”的解决办法

    最近photoshopCS3启动的时候弹出"不能初始化PHOTOSHOP,因为该文件已锁定.在WINDOWS资源管理器中使用属性命令来解锁文件"而被逼关闭,重装无效,很不爽啊. 然 ...

  2. java获取文件列表,[javaSE] java获取文件列表

    递归测试 import java.io.File; import java.util.ArrayList; import java.util.HashMap; import java.util.Lis ...

  3. 操作无法完成,因为已在Windows资源管理器中打开。(YunShellExtV164.dll文件无法删除)

    因为在电脑上来回安装卸载百度网盘,导致有些文件没有卸载干净,在安装路径里会留下一个dll文件怎么删都删除不掉,会显示操作无法完成,因为已在Windows资源管理器中打开. 这种情况下重启是没有用的,重 ...

  4. 利用MT Photos生成的重复文件列表,删除重复文件

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一.获取重复文件信息 二.使用步骤 1. 运行"MTphotos重复文件(生成excel).py" ...

  5. 同步/异步移动文件列表框选中的文件

    //PlayBackDlg.h CStringArray m_ArrayFiles; HANDLEm_hThreadMoveFiles;//异步移动文件句柄 unsigned int ThreadI ...

  6. 读取云服务器文件列表,读取云服务器文件列表

    读取云服务器文件列表 内容精选 换一换 登录Windows操作系统的弹性云服务器时,需使用密码方式登录.因此,用户需先根据创建弹性云服务器时使用的密钥文件,获取该弹性云服务器初始安装时系统生成的管理员 ...

  7. python导入xlrd库_python中xlrd库如何实现文件读取?

    俗话说得好,技多不压身,虽然我们已经掌握了多种可以实现读取文件的方式,但是丝毫不影响我们要学会精益求精,他说学习文件读取的奥秘,况且,数据分析是十分重要的,一切的代码运行,总归都是要服务于数据,好啦, ...

  8. python剪切文件如何恢复_用python实现的可以拷贝或剪切一个文件列表中的所有文件...

    # coding:utf-8 import os import sys def cut_and_paste_file(source, destination): ''' source: file pa ...

  9. 从资源管理器中,获取被选择的文件的路径(及文件夹)的API

    从下面的URL中,获得了这个Library. Get paths of selected items in an explorer window /*http://www.autohotkey.com ...

最新文章

  1. 挪动以太坊:比特币现金的新功能使其成为智能合约竞争者
  2. seaborn 安装成功 + ImportError: DLL load failed: 找不到指定的模块 问题解决
  3. Windows10上怎样开启FTP服务
  4. 在eclipse中把项目部署到tomcat中时,发现项目文件不完整
  5. Android中异步任务AsyncTask的使用
  6. 2019全球程序员薪酬报告:软件开发比机器学习抢手!40岁后收入下滑
  7. 列表视图案例2——显示用户列表
  8. 多个 Linux 发行版考虑移除 Chromium 软件包
  9. Python图片文字识别转换程序
  10. 你想收到中国向世界发出的第一封电子邮件吗
  11. 记一次quartz定时任务不执行排雷
  12. php引用字体,thinkphp引入字体文件时候被当做模块求解决问题
  13. 关于重装vscode打不开的三种解决方法,亲测有用
  14. Java job interview:公司项目Java开发走进软件世界
  15. unix 时间戳 c语言,C语言实现字符转unix时间戳
  16. 互联网里的东邪、西毒、南帝、北丐
  17. android开发之eclipse调试debug模式详解
  18. 采购评标管理过程是怎样的?有哪些评标标准?
  19. 七年级计算机教学质量分析,七年级年级组质量分析会
  20. 计算机组成与结构资源,计算机组成与系统结构-Selubc资源共享空间-home.ppt

热门文章

  1. Redis 核心技术与实战
  2. Shell 中各种括号的作用
  3. Ubuntu18使用docker快速安装oracle 11g
  4. Angular添加class的正确方式
  5. Problem H: 今年第几天?
  6. 2017 Google 开发者大会直播入口
  7. 2Python全栈之路系列之MysQl基本数据类型
  8. wdcp支持两种安装方式
  9. [转载] 中国象棋软件-引擎实现(一)概述
  10. FFmpeg 2.1 试用(新版支持HEVC,VP9)