以下代码素材自取:链接:https://pan.baidu.com/s/1fL17RjKyGjpvpeeUFONCaQ  提取码:zgiw

# coding:utf-8
import os
import filecmp# 将指定目录下的所有文件的路径存储到all_files变量中
def get_all_files(path, dirs):all_files = []for d in dirs:cur_path = os.path.join(path, d)files = os.listdir(cur_path)for f in files:all_files.append(os.path.join(cur_path, f))return all_files# 比较两个文件的内容是否一致
def cmp_files(x, y):if filecmp.cmp(x, y):# 如果一致,则删除第二个,保留第一个,并输出信息
        os.remove(y)print("路径\"" + y + "\"下的文件是重复文件,已经删除")if __name__ == '__main__':# 需要把路径替换成你的文件夹所在路径,当把这个代码文件放在要处理的文件夹外一层时,可以使用下面的相对路径写法path = r'F:\temp\problem3_files'# 已知路径下存在两个文件夹pic1和pic2dirs = ['pic1', 'pic2']# 调用函数,获取文件列表all_files = get_all_files(path, dirs)# 用双重for循环来比较文件是否有重复for x in all_files:for y in all_files:# 如果x和y不是相同的文件,而且都存在,则执行后续操作if x != y and os.path.exists(x) and os.path.exists(y):# 比较两个文件的内容是否一致cmp_files(x,y)

转载于:https://www.cnblogs.com/xiaodai0/p/10309841.html

python-----利用filecmp删除重复文件相关推荐

  1. 利用python删除重复文件和归类文件

    标题利用python实现两个功能: 1 删除重复文件:通过filecmp比较文件内容是否相同进行操作 2 归类文件:通过文件后缀名进行归类 import os import glob import s ...

  2. python删除重复文件代码

    整理磁盘才发现有好多重复文件,便想手写一个删除重复文件的工具.我当然可以用java轻松写一个了,只是最近看了一些python方面的东西,所以想不如拿python练练手.功能很简单,只是为了查阅资料,我 ...

  3. python 重复图片_删除重复文件或图片(去重)的python代码

    通过python爬虫或其他方式保存的图片文件通常包含一些重复的图片或文件, 通过下面的python代码可以将重复的文件删除以达到去重的目的.其中,文件目录结构如下图: # /usr/bin/env p ...

  4. python 删除重复文件

    背景: 由于操作异常造成文件夹下有大量重复生成的文件, 例如 D:\mydata\data1.txt D:\mydata\data1(1).txt D:\mydata\data2.txt D:\myd ...

  5. 【shell】删除重复文件

    2019独角兽企业重金招聘Python工程师标准>>> #!/bin/bash  #name:remove_one.sh #用途:查找并删除重复文件,每个文件只保留一个样本 #将文件 ...

  6. 【数据挖掘】利用md5查找重复文件

    [数据挖掘]利用md5查找重复文件 电脑经过长时间的使用,难免会存留许多重复文件.这些重复文件往往四散在各处,其文件名.修改时间等信息都有改动,这对我清理重复文件造成了困扰.尽管重复文件已经有了诸多修 ...

  7. 重复文件导出html,分享|删除重复文件的神器:dupeGuru

    最近,我需要清理我父亲的文件和文件夹.有一个难题是,里面存在很多不正确的名字的重复文件.有移动硬盘的备份,同时还为同一个文件编辑了多个版本,甚至改变的目录结构,同一个文件被复制了好几次,名字改变,位置 ...

  8. linux删除相同的文件,Linux下删除重复文件的神器:dupeGuru

    最近,我需要清理我父亲的文件和文件夹.有一个难题是,里面存在很多不正确的名字的重复文件.有移动硬盘的备份,同时还为同一个文件编辑了多个版本,甚至改变的目录结构,同一个文件被复制了好几次,名字改变,位置 ...

  9. python 利用pyinstaller 编译.exe文件过程中编写完的.exe文件执行过程中闪退

    问题描述: python 利用pyinstaller 编译.exe文件过程中编写完的.exe文件执行过程中闪退,并提示no module named 'pyproj.datadir' 解决方法: 闪退 ...

最新文章

  1. 用yum查询想安装的软件
  2. 使用 IntraWeb (15) - 基本控件之 TIWEdit、TIWMemo、TIWText
  3. Linux循环链表删除节点,删除循环单链表开头元素
  4. ViewModel优雅的弹加载窗和获取Context
  5. [js] 使用js实现一个循环队列
  6. JeeWx 捷微二代微信活动平台1.0发布!活动插件持续开源更新!
  7. 解决ssh无密码登录不成功的问题
  8. java 单向链表 双向链表_java 单向链表与双向链表的实现
  9. 析构函数定义为虚函数原因
  10. 虚拟机以及Linux CentOS 7安装
  11. quicktime不能成功安装
  12. android快速复制粘贴,Android开发复制和粘贴
  13. 我需要HCNE模拟考试系统
  14. 计算机操作系统学习笔记----进程管理
  15. Protobuf数据格式解析
  16. 未来最有发展前景的行业分享
  17. python知识点智能问答_【每日一荐】智能问答API
  18. 程序人生 - 目前市场上各大品牌笔记本(戴尔,联想,华硕,惠普等等)的点评?
  19. 2022年考研数据结构_8 排序
  20. SSL(HTTPS)证书过期的问题

热门文章

  1. 链接全局变量再说BSS段的清理
  2. 2013年3月百度之星B题
  3. [置顶] 面向业务开发应用
  4. C# 运算符的优先级
  5. java基于http协议编程_Java中基于HTTP协议网络编程
  6. 服务器温度3d显示,智能问答助手、3D可视化展示,腾讯医典“黑科技”助力科普更有温度...
  7. 如何调整金格电子章服务器印章_大型集团公司的印章管理方法
  8. 运行php能运行asp么,配置使web server即能运行asp又能运行PHP(不装Apache)
  9. oracle rac ora 12537,解决11gR2 Rac ORA-12537: TNS:connection closed 一例
  10. 9开启线程日志_GC 日志分析