工作中,当你需要对某个文件夹或多个文件夹内的大量类似文件做相同操作(增删改查)时,你还在拼命加班做一个没有感情的工具人嘛?掌握以下几个操作,瞬间完成任务,然后你就可以摸鱼去了。

运用Python进行批量处理,无疑是减少了无限的工作量,将枯燥无味,重复性工作交给机器。你只需要花几分钟时间编写几行代码,轻松摆脱工具人,这就是办公自动化的魅力所在。

在介绍批量处理文件之前,先介绍下Python文件IO的一般操作。

OS模块常用方法

import os
  1. os.getcwd( )

方法获取代码当前工作路径


  1. os.listdir(path)

获取当前工作文件夹内的文件夹或文件。

用于返回指定的文件夹包含的文件或文件夹的名字的列表。这个列表以字母顺序。它不包括 '.' 和'..'即使它在文件夹中。

  • path -- 需要列出的目录路径


  1. os.makedirs(path, mode=0o777)

用于递归创建目录。

如果子目录创建失败或者已经存在,会抛出一个 OSError 的异常,Windows上Error 183 即为目录已经存在的异常错误。

  • path -- 需要递归创建的目录,可以是相对或者绝对路径。

  • mode -- 权限模式。

如果第一个参数 path 只有一级,则 mkdir() 函数相同。


  1. os.mkdir(path[, mode])

用于以数字权限模式创建目录。

默认的模式为 0777 (八进制)。如果目录有多级,则创建最后一级,如果最后一级目录的上级目录有不存在的,则会抛出一个 OSError。

  • path -- 要创建的目录,可以是相对或者绝对路径。

  • mode -- 要为目录设置的权限数字模式


  1. os.walk(top[, topdown=True[, οnerrοr=None[, followlinks=False]]])

是一个简单易用的文件、目录遍历器,可以帮助我们高效的处理文件、目录方面的事情。

可以创建一个生成器,用以生成所要查找的目录及其子目录下的所有文件。

用于通过在目录树中游走输出在目录中的文件名,向上或者向下。

  • top -- 根目录下的每一个文件夹(包含它自己), 产生3-元组(dirpath, dirnames, filenames)【文件夹路径, 文件夹名字, 文件名】。

  • topdown --可选,为True或者没有指定, 一个目录的的3-元组将比它的任何子文件夹的3-元组先产生 (目录自上而下)。如果topdown为 False, 一个目录的3-元组将比它的任何子文件夹的3-元组后产生 (目录自下而上)。

  • onerror -- 可选,是一个函数; 它调用时有一个参数, 一个OSError实例。报告这错误后,继续walk,或者抛出exception终止walk。

  • followlinks -- 设置为True,则通过软链接访问目录。


  1. os.chdir(path)

用于改变当前工作目录到指定的路径。

  • path -- 要切换到的新路径


  1. os.path.abspath(path)

返回绝对路径


  1. os.path.dirname(path)

返回文件路径


  1. os.path.join(path1[, path2[, ...]])

把目录和文件名合成一个路径


  1. os.path.split(path)

把路径分割成 dirnamebasename,返回一个元组


  1. os.path.splitext(path)

分割路径中的文件名与拓展名


  1. os.path.walk(path, visit, arg)

遍历path,进入每个目录都调用visit函数,visit函数必须有3个参数(arg, dirname, names),dirname表示当前目录的目录名,names代表当前目录下的所有文件名,args则为walk的第三个参数。


  1. os.path.exists(path)

路径存在则返回True,路径损坏返回False


获取指定后缀名的文件

当一个文件夹中含有多种类型的文件,以下列举几个,有时候实际情况比这更多更复杂,我们需要找到需要的格式文件比较困难,因此批量获取指定后缀名的文件显得尤其重要。

import os
def find_file(work_dir, extension='jpg'):"""获取指定后缀名的文件:param work_dir:传递当前目录:param extension:指定的后缀名:return: 返回所有目录下的文件"""# 空列表用以存储获取到的文件名lst = []for filename in os.listdir(work_dir):# 指定文件夹中的文件名逐一打印print(filename)# 获取得到文件后缀splits = os.path.splitext(filename)file_ext = splits[1] # 拿到扩展名if file_ext == '.' + extension:lst.append(filename)return lst

函数运用

>>> In: find_file('./批处理').ipynb_checkpointsData STUDIO.jpglogger.pyMySQL.zipsvm.pptxtest.csvtext.xlstext.xlsx关注《数据STUDIO》.gif成都市地图.html批处理.ipynb控规图.dwg
>>> Out: ['Data STUDIO.jpg']

xls批量转换成xlsx

此方法是获取指定后缀名的文件的一个应用,获取到指定后缀名的文件后对相应文件作一个修改。

import os
def batch_rename(work_dir, old_ext ='.xls', new_ext='.xlsx'):"""批量重命名后缀:param work_dir:传递当前目录:param old_ext:原来后缀名:param new_ext:新的后缀名后"""for filename in os.listdir(work_dir):# 获取得到文件后缀split_file = os.path.splitext(filename)file_ext = split_file[1]# 定位后缀名为old_ext 的文件if old_ext == file_ext:# 修改后文件的完整名称newfile = split_file[0] + new_ext# 实现重命名操作os.rename(os.path.join(work_dir, filename),os.path.join(work_dir, newfile))    print("完成重命名")
print(os.listdir(work_dir))

如果将其中的file_ext = split_file[1]改为file_name = split_file[0],后面再做相应的修改,可以变成批量修改文件名称。

批量获取文件修改时间

这里演示os.walk(path) 的应用。有时我们需要获取某个具有好几个层级的目录下的所有文件,根据条件筛选出某个目标文件,对其做相应的操作。这里演示获取文件的修改时间。

# 获取目录下文件的修改时间
import os
from datetime import datetime
print(f"当前时间:{datetime.now().strftime('%Y-%m-%d %H:%M:%S')}")
def get_modify_time(indir):for root, _, files in os.walk(indir): # 循环D:\批处理目录和子目录for file in files:absfile = os.path.join(root, file)modtime = datetime.fromtimestamp(os.path.getmtime(absfile))now = datetime.now()difftime = now-modtimeif difftime.days < 20: # 条件筛选超过指定时间的文件print(f"""{absfile}修改时间[{modtime.strftime('%Y-%m-%d %H:%M:%S')}]距今[{difftime.days:3d}天{difftime.seconds//3600:2d}时{difftime.seconds%3600//60:2d}]""") # 打印相关信息
get_modify_time('./批处理')

输出

当前时间:2021-02-05 19:21:48./MySQL.zip修改时间[2021-01-29 16:46:13]距今[ 7天 3时35]              ./svm.pptx修改时间[2021-01-21 10:22:12]距今[ 15天 8时59]./test.csv修改时间[2021-01-25 18:36:40]距今[ 11天 0时45]./关注《数据STUDIO》.gif修改时间[2021-02-04 11:14:07]距今[ 1天 8时 7]./批处理.ipynb修改时间[2021-02-05 19:21:44]距今[ 0天 0时 0]./.ipynb_checkpoints\批处理-checkpoint.ipynb修改时间[2021-02-05 19:57:42]距今[ 0天 0时24]

批量压缩文件

这里同样运用到os.path.walk(path)

另外一个用来做压缩和解压的Python模块--zipfile

压缩文件

zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
  • file -- 文件的路径或类文件对象(file-like object)

  • mode -- 指示打开zip文件的模式,默认值为'r',表示读已经存在的zip文件,也可以为 'w''a''w'表示新建一个zip文档或覆盖一个已经存在的zip文档, 'a'表示将数据附加到一个现存的zip文档中;

  • compression -- 在写zip文档时使用的压缩方法,它的值可以是zipfile.ZIP_STOREDzipfile.ZIP_DEFLATED。如果要操作的zip文件大小超过2G,应该将allowZip64设置为True

有如下常用方法

  1. ZipFile.infolist()获取zip文档内所有文件的信息,返回一个zipfile.ZipInfo的列表

  2. ZipFile.namelist() 获取zip文档内所有文件的名称列表

  3. ZipFile.printdir()将zip文档内的信息打印到控制台上

import zipfile
# 加载压缩文件,创建ZipFile对象file_dir = './Data STUDIO.zip'
zipFile = zipfile.ZipFile(file_dir)print('info:',zipFile.infolist())
print('name:',zipFile.namelist())
print('dir:',zipFile.printdir())

输出

info: [<ZipInfo filename='Data STUDIO.jpg' compress_type=deflate external_attr=0x20 file_size=791106 compress_size=336551>]
name: ['Data STUDIO.jpg']
File Name                                             Modified             Size
Data STUDIO.jpg                                2020-11-03 10:01:00       791106
dir: None

解压文件

ZipFile.extract(member[, path[, pwd]])

将zip文档内的指定文件解压到当前目录。

  • member -- 指定要解压的文件名称或对应的ZipInfo对象;

  • path -- 指定了解析文件保存的文件夹;

  • pwd -- 为解压密码。

下面一个例子将保存在程序根目录下的text.zip内的所有文件解压到D:/Work 目录

import zipfile
import os
zipFile = zipfile.ZipFile(file_dir)
for file in zipFile.namelist():zipFile.extract(file, 'd:/Work')
zipFile.close()

另一种解压zip文档中的所有文件到当前目录:

ZipFile.extractall([path[, members[, pwd]]])

members的默认值为zip文档内的所有文件名称列表,也可以自己设置,选择要解压的文件名称

批量压缩文件

import zipfile # 导入zipfile,这个是用来做压缩和解压的Python模块;
import os
import time
def batch_zip(start_dir):start_dir = start_dir # 要压缩的文件夹路径file_news = start_dir + '.zip' # 压缩后文件夹的名字z = zipfile.ZipFile(file_news, 'w', zipfile.ZIP_DEFLATED)for dir_path, dir_names, file_names in os.path.walk(start_dir):print(dir_path)print(dir_names)print(file_names)# 这一句很重要,不replace的话,就从根目录开始复制f_path = dir_path.replace(start_dir, '')# 实现当前文件夹以及包含的所有文件的压缩f_path = f_path and f_path + os.sep for filename in file_names:z.write(os.path.join(dir_path, filename), f_path + filename)z.close()return file_news
batch_zip('E:/批处理/test')

输出

E:/批处理/test
[]
['Data STUDIO.jpg', 'logger.py', 'MySQL.zip', 'svm.pptx', 'test.csv', 'text.xls', 'text.xlsx', '关注《数据STUDIO》.gif', '成都市地图.html', '控规图.dwg']'E:/批处理/test.zip'

检验压缩效果。

-- 数据STUDIO --

快看,教你怎么上班摸鱼!相关推荐

  1. 5e怎么绑定一键跳投_想上班摸鱼?分享一款超好用软件,一键隐藏窗口,摸鱼一时爽,一直摸鱼一直爽!...

    点击蓝字即可快速关注我,分享好软件~ 平时小林君分享的一般都是非常实用或者比较增加工作效率的软件,今天就不一样了,今天教大家怎么上班摸鱼(误),隐藏电脑窗口,设置一个老板键 今天要介绍的这款软件名叫H ...

  2. 上班摸鱼看小说的最佳软件

    这个软件几乎满足了我对上班摸鱼的所有担忧, 比如上班的时候打开网页看下说,那太明显了,不说摄像头,后台看一下浏览器历史记录就暴露的特别明显, 这合适吗?老板来到你身后远远的就看见了 那这款软件呢?就很 ...

  3. 刷抖音18.5G、看视频22.5G,国美通报员工上班摸鱼:回应来了

    上班"摸鱼"的经历你有过吗?近日,一则关于#国美通报批评员工上班摸鱼#的消息冲上微博热搜榜榜单,引发网友们的大量关注. 据@老板联播 消息,11月16日,国美发布<关于违反员 ...

  4. 学习记录贴:上班摸鱼做一个看lol文字直播的小工具

    学习记录贴:上班摸鱼做一个看lol文字直播的小工具 前言 运行图 流程及思路 项目及代码 总结 前言 本人纯新手小白,上班练手. 致谢: 基于Python命令行的NBA文字直播小工具. 运行图 流程及 ...

  5. Windows 11成上班摸鱼利器,微软CEO喊话苹果:欢迎引入iMessage

    杨净 发自 凹非寺 量子位 报道 | 公众号 QbitAI "套壳安卓"."逐渐苹果化"-- 网友甚至给Windows11加戏: 明明是我的电影,我却不能有姓名 ...

  6. 上班摸鱼 这个软件少不了 任意窗口透明化

    " 敲黑板,使用电脑上班的同学看过来,你今天摸鱼了嘛,今天哔哔君给大家带来的这款神器不得了,上班追剧两不误,一般人都是使用切屏的技能来小小的摸一会鱼,今天哔哔君呢,教大家怎么使任意窗口透明化 ...

  7. 程序员上班摸鱼,这么玩才高端

    说到上班摸鱼,用手机刷剧.打游戏这些方式都太低端了,不仅低着头对颈椎不好,还容易被老板抓到. 那么,今天就来给大家分享一下高端程序员应该掌握的摸鱼技巧. 1.Ratel 万万没想到,有一天我居然会在命 ...

  8. 基于C++的酷跑游戏,上班摸鱼必备,代码如下

    基于C++的酷跑游戏,上班摸鱼必备,代码如下 #include<bits/stdc++.h> #include<windows.h> #include<stdio.h&g ...

  9. 那群因为上班摸鱼而被罚的打工人...

    读者大爷们好,我是老K. 昨天在摸鱼群看到一张图,国美的一些打工人因为上班摸鱼而被通报处罚了: 这个新闻下午一度冲上了微博热搜. 看了表格,我也觉得吧,你上班期间听个音乐也就算了,那些看视频刷抖音的, ...

最新文章

  1. 《HTML 5与CSS 3 权威指南(第3版·上册)》——3.2 新增的非主体结构元素
  2. java实现手机短信验证全过程
  3. 2020年网易校招提前批JAVA岗笔试第一题
  4. java记事本技术参数_[源码和文档分享]基于JAVA的记事本
  5. 【数字信号处理】 第二章、时域中的离散时间信号
  6. redis 系列27 Cluster高可用 (2)
  7. Docker run centos 内部使用systemctl 启动服务的方法
  8. Laravel Request 和 Laravel Input 常用操作方法
  9. 算法:求刚好大于当前数组组合Next Permutation
  10. 前端存储之websql
  11. 服务器 虚拟软驱,virtual floppy(虚拟软驱)命令行版本
  12. 2019杭电多校第六场 HDU6638 Snowy Smile(线段树区间合并+枚举)
  13. 微信小程序实战十三:狗狗小程序云搭建
  14. ThinkPHP3.2.3手册阅读
  15. 关于iperf工具的了解
  16. 强引用置为null,会不会被回收及内存分配及年轻代年老代算法回收
  17. 转:细数国内市场智能语音开放平台有哪些?
  18. Windows server 2003常用设置
  19. 解决最新版discuz安装模板插件提示“对不起,您安装的不是正版应用”
  20. unity绑定骨骼动画 使用现成的模型和动作库

热门文章

  1. Python 量化投资实战教程(4) —KDJ 策略
  2. windows重启php服务,windows server 下重启 MySQL(服务)
  3. Sandboxie-沙箱软件-编译说明-模块解析
  4. 计算机桌面显示已锁定什么意思,电脑已锁定是什么意思,桌面没有了
  5. Mifare One 非接触式IC卡介绍
  6. 蒸压加气混凝土砌块荷载系数1.4取值依据
  7. java将实体类转为json_JavaWeb实体类转为json对象的实现方法
  8. Python读取 xlsb 文件格式
  9. 目标函数最优解matlab,目标函数最优解
  10. win7小工具打不开_win7nvidia控制面板打不开-win7nvidia控制面板打开教程