导入依赖

'''导入依赖'''from pathlib import Pathimport filecmp

函数说明

'''
filecmp.cmp(path1, path2, shallow=True)path1/path2:待比较的两个文件路径。shallow :默认为True,即只比较os.stat()获取的元数据(创建时间,大小等信息)是否相同,
设置为False的话,在对比文件的时候还要比较文件内容。
'''

提取待去重文件路径

# 初始化文件路径列表path_files_list = []# 遍历for path in Path(r'/usr/load/data').iterdir():# 校验是否为文件if path.is_file():# 加入到待去重文件列表path_files_list.append(path)# 遍历待去重文件for file_index in range(len(path_files_list) - 1):# 遍历,两辆比对for later in range(file_index + 1, len(path_files_list)):# 校验内容是否相同if filecmp.cmp(path_files_list[file_index],
path_files_list[later], shallow=False):# 内容相同、则删除path_files_list[file_index].unlink()break

【粉丝福利】关注公众号,获取全套视频资料,喜欢小编点个 '关注' 吧!

【往期精选】

● python的GUI框架tkinter,实现程序员的流氓式表白逻辑

● 探究python函数的不定长参数args与*kwargs

● 没有深思过的python冷知识你知道几个?

● python图片处理,自动生成gif动态图片

● python-redis 的操作手法,相当简单的redis数据存储方式!

● python 日期、时间处理,各种日期时间格式/字符串之间的相互转换究竟是怎样的?

● python 内置的数据计数器Counter相当nice

● 几十行代码实现python发送邮件与接收邮件

● 梳理python路线知识盲区,最全面、最详细的python知识体系框架思维导图终于出炉了!

● 没有开发工具,在服务器控制台如何进行python代码调试,高级编程pdb代码调试!

● python中的set集合,元素的CRUD处理,交集/差集/并集计算,不只是能去重!

● python编程:yaml文件应用支持,轻松读取可配置参数!

● VsCode再出神器-Pylance,终于为python开发者也带来福利了!

● 灵魂发问:每个程序员心中都有自己的一套编码规范,你的代码别人能看懂吗?

本文由微信公众号【python 集中营】发布,更多精彩文章、视频资料即可领取!

python十行代码实现文件去重,去除重复文件的脚本相关推荐

  1. Win10中使用CMD命令遍历文件夹删除重复文件

    接上一篇<Win10中使用CMD命令遍历文件夹去除多余后缀名>,当修改完后缀名的时候发现,有些文件下载了两次,比如说同时存在video.mp4和video(1).mp4这两个文件,随便点开 ...

  2. 根据文件MD5删除重复文件

    根据文件MD5删除重复文件,仅保留一份文件: ```shell find . -type f -exec md5sum {} \; | sort -k 1 | awk 'a[$1]++{print $ ...

  3. 10行Python代码自动清理电脑内重复文件,释放双手!

    给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除」 主要涉及的知识点有: os模块综合应用glob模块综合应用利用filecmp模块比较两个文件步骤分析 该程序实现的逻辑 ...

  4. 10行Python代码自动清理电脑内重复文件

    给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除 主要涉及的知识点有: os模块综合应用 glob模块综合应用 利用filecmp模块比较两个文件 步骤分析 该程序实现的 ...

  5. 10行Python代码自动清理电脑内重复文件,解放双手!

    前言 今天分享一个系统层面的自动化案例: 「给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除」 主要涉及的知识点有: os模块综合应用 glob模块综合应用 利用file ...

  6. linux将所有文件生成lst_10行Python代码自动清理电脑内重复文件,解放双手!

    作者:陈熹 来源:早起Python 大家好,又到了Python办公自动化系列. 今天分享一个系统层面的自动化案例: 「给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除」 ...

  7. 10 行 Python 代码自动清理电脑内重复文件,解放双手!

    来源 | 早起Python 头图 | 视觉中国 前言 大家好,又到了Python办公自动化系列. 今天分享一个系统层面的自动化案例: 「给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若 ...

  8. 截取文件最后10行_10 行 Python 代码自动清理电脑内重复文件,解放双手

    来源 | 早起Python 头图 | 视觉中国 前言 大家好,又到了Python办公自动化系列. 今天分享一个系统层面的自动化案例: 「给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若 ...

  9. python 判断文件夹是否存在 否则创建_10行Python代码自动清理电脑内重复文件,解放双手!...

    大家好,又到了Python办公自动化系列. 今天分享一个系统层面的自动化案例: 「给定一个文件夹,使用Python检查给定文件夹下有无文件重复,若存在重复则删除」 主要涉及的知识点有: os模块综合应 ...

最新文章

  1. php excel导入mysql_使用PHPExcel导入Excel到MySql
  2. 小余学调度:学习记录(2022.2,3)
  3. django 不用自带的mysql_21_django配置使用mysql数据库的两种方式
  4. SpringMVC的请求-文件上传-客户端表单实现
  5. CCF201409-2 画图 java(100分)
  6. Android之Color颜色值和RGB颜色对照表
  7. hadoop小型集群_小型Hadoop集群的Ganglia配置和一些故障排除
  8. 命令行调用VS编译器
  9. python字典用法大全
  10. IIS 7.5配置PHP更容易!
  11. python pymysql实例_Python使用pymysql模块操作mysql增删改查实例分析
  12. ADL之UI初预览 AJAX 开发
  13. sql语句分析是否走索引_Mysql中SQL语句不使用索引的情况
  14. Python移动应用开发
  15. eplan p8详细安装步骤文库_Win10系统安装Eplan Electric P8详细步骤
  16. R语言检测异常值的几个案例
  17. jQuery仿百度商桥在线客服代码
  18. ESP32远程OTA指令升级bin固件
  19. 在网页上打印时用javascript设置打印区域和不打印区域,分页等
  20. ABV指标与通达信的主力进出指标分析

热门文章

  1. B4i(iOS)应用程序所需的所有功能
  2. mac上使用使用rz,sz命令
  3. 机器视觉 手部关键点检测(手部识别)安卓应用App(Hand Tracking)基于mediapipe。
  4. Idea汉化安装后Settings无响应
  5. 认识世界和改造世界 [马原]
  6. 异构处理器,SIMD
  7. QT_媒体播放器播放Mp3QMediaPlayer
  8. [Visual Studio 2022 C#]使用SplitContainer拆分器让一个Windows窗口秒变多个
  9. 省、市、区、街道行政区数据以及行政区数据合并问题
  10. 330+地级市GDP以及一二三产业增加值数据(1995-2020)