github博客传送门
csdn博客传送门

使用md5删除重复文件思路和本帖一样

首先遍历需要去重文件夹下的所有文件

然后生成每个文件md5码的同时 和集合中的md5码比较

如md5码不存在,则进行保存.如存在,则不进行保存

最后保存路径的文件 则是不重复的文件

import hashlib
import os
from PIL import Image
import numpy as npfiles_path = "这里输入你要去重的文件夹路径.."
save_files_path = "这里输入你去重后保存文件的路径..."
files = os.listdir(files_path)  # 遍历文件夹下的所有文件temp = set()  # 创建一个set()
count = 0  # 删除的文件计数
for file in files:file_path = files_path + file  # 获得完整的路径img = Image.open(file_path)  # 打开图片img_array = np.array(img)  # 转为数组md5 = hashlib.md5()  # 创建一个hash对象md5.update(img_array)  # 获得当前文件的md5码if md5.hexdigest() not in temp:  # 如果当前的md5码不在集合中temp.add(md5.hexdigest())  # 则添加当前md5码到集合中img.save(save_files_path + file)  # 并保存当前图片到保存文件的路径else:count += 1  # 否则删除图片数加一print("duplicate removal:", count)  # 最后输出删除图片的总数
print_r('点个赞吧');
var_dump('点个赞吧');
NSLog(@"点个赞吧!")
System.out.println("点个赞吧!");
console.log("点个赞吧!");
print("点个赞吧!");
printf("点个赞吧!\n");
cout << "点个赞吧!" << endl;
Console.WriteLine("点个赞吧!");
fmt.Println("点个赞吧!")
Response.Write("点个赞吧");
alert(’点个赞吧’)

转载于:https://www.cnblogs.com/Mrzhang3389/p/11093569.html

使用Python+md5删除本地重复(同一张不重名)的照片相关推荐

  1. python dataframe去掉索引_关于python:删除具有重复索引的行(Pandas DataFrame和TimeSeries)...

    我正在从网上阅读一些自动天气数据. 观察每5分钟发生一次,并编译成每个气象站的月度文件. 一旦我完成了解析文件,DataFrame看起来像这样: Sta  Precip1hr  Precip5min ...

  2. jxl 删除excel重复的行

    思路:先从前到后检索excel文件,找出重复的行的行号(从0开始),然后删除之: 注意:使用removeRow(int row)删除多行时,需要从后往前遍历,因为从前往后删除时行号就乱了,跟检索时的行 ...

  3. 在项目中git新建分支 删除本地分支和合并分支

    1.新建分支 有时候我们开发需要开一个分支,这样可以有效的并行开发. 开分支有两种方式: 一种是在远程开好分支,本地直接拉下来; 这个方法是用vscode建分支, 1.红框的那个是当前分支创建一个本地 ...

  4. [JS]请给Array本地对象增加一个原型方法,它用于删除数组条目中重复的条目(可能有多个),返回值是一个包含被删除的重复条目的新数组。

    请给Array本地对象增加一个原型方法,它用于删除数组条目中重复的条目(可能有多个),返回值是一个包含被删除的重复条目的新数组. 刚开始复习js题还不太习惯 CSDN上看了一个帖子,说是牛客上的标答, ...

  5. python列表删除算法_关于算法:如何从python中的列表中删除重复的条目

    最近在一次采访中,我被要求编写一个python代码来从列表中删除所有重复的条目. 例如: Input List = {1,2,4,5,2,3,1} Expected Output List = {4, ...

  6. python列表删除多个相同元素_Python遍历列表删除多个元素或者重复元素

    在遍历list的时候,删除符合条件的数据,结果不符合预期 num_list = [1, 2, 2, 2, 3] print(num_list) for item in num_list: if ite ...

  7. 根据文件MD5删除重复文件

    根据文件MD5删除重复文件,仅保留一份文件: ```shell find . -type f -exec md5sum {} \; | sort -k 1 | awk 'a[$1]++{print $ ...

  8. Python 技术篇-用os库实现删除本地文件、非空文件夹方法,python判断本地文件、文件夹是否存在方法

    os.remove() 就是删除文件的 os.removedirs() 就是删除文件夹的 os.path.exists() 用来判断文件或文件夹是否存在 import ospath = "D ...

  9. python一张图学懂_【python系统学习07】一张图看懂字典并学会操作

    一张图get字典 一张图get字典的些许知识点 如果图中知识点描述过于概括,请看下列细文: 字典是什么 js的对象 说到字典,前端同学可以理解其为:对象.因为python中的字典和js中的对象长的不能 ...

最新文章

  1. 【Go】Go基础(五):函数
  2. NLP语言模型任务数据准备及实战
  3. 美国科学家发现:AI跟人类一样,都是需要“睡觉”的
  4. 浅谈Android中Lifecycle
  5. 远程桌面连接CentOS7
  6. linux环境-docker安装rabbitmq
  7. 解决log4j2漏洞遭到挖矿、僵尸进程病毒攻击
  8. BZOJ1036 (其实这只是一份板子)
  9. Python实现八皇后问题所有实现方式
  10. linux中ls文件内存大小,Linux下用ls和du命令查看文件以及文件夹大小
  11. python5000行代码项目_5000行python代码+可视化60W数据,告诉你知乎用户不为人知的事...
  12. 圣诞素材网站推荐 这几个网站超多免费可商用素材
  13. 性能测试工程师职业现状分析
  14. 计算机看游戏显卡,如何看电脑显卡性能
  15. 使用vue-video-player实现直播
  16. 2个DIV制作十字架
  17. Wox Github下载太慢了
  18. HTTP 304: Not Modified
  19. 国密算法(SM2,SM3,SM4)辅助工具升级版(OTP+PBOC3.0)
  20. Unity 制作愤怒的小鸟

热门文章

  1. 【转】二叉树、B树、B-树、B+树、B*树
  2. iOS中网络请求的使用(GET请求与POST请求)
  3. distinct使SQL查询除去重复的字段
  4. kafka partition分配_logstash消费kafka数据,partition分配不均衡
  5. amd显卡风扇调节_为什么NVIDIA和AMD公版显卡纷纷摒弃涡轮散热器而采用多风扇散热设计?...
  6. 十六进制数用int吗_你真的精通C语言吗?来解这十道C语言迷题试试吧!
  7. 见贤思齐焉,送3本新书
  8. 加拿大证券监管机构澄清加密公司监管规定
  9. 波卡生态HydraDX将于2月8日通过Balancer发售5亿枚代币
  10. 曾遭闪电贷攻击的Origin将重新推出稳定币OUSD