【shell】删除重复文件
2019独角兽企业重金招聘Python工程师标准>>>
#!/bin/bash
#name:remove_one.sh
#用途:查找并删除重复文件,每个文件只保留一个样本
#将文件依据大小排序并输出
ls -lS | awk 'BEGIN {
#得到第一行total总数并丢弃,读取下一行
getline;getline;
name1=$9;size=$5;
}
{
name2=$9;
if(size==$5)
#大小一样的可能是内容相同的文件
{
#用md5进行校验和
("md5sum "name1)|getline; csum1=$1;
("md5sum "name2)|getline; csum2=$1;
#如果校验和相同则为内容相同的文集,输出名字
if( csum1==csum2 )
{
{print name1;print name2}
}
};
size=$5;name1=name2;
}' | sort -u > duplicate_files
#计算重复文件的md5sum,将重复文件中的一采样写入duplicate_sample中
cat duplicate_files|xargs -I {} md5sum {}| sort | uniq -w 32 | awk '{print $2}' | sort -u > duplicate_sample
echo Removing...
#删除在duplicate_files中列出且未被duplicate_sample列出的全部文件
comm duplicate_files duplicate_sample -2 -3|tee /dev/stderr|xargs rm
echo Removed duplicates files successfully
转载于:https://my.oschina.net/u/2553223/blog/609694
【shell】删除重复文件相关推荐
- shell 删除重复文件
shell 删除重复文件的脚本 #!bin/bash #文件名:remove_duplicates.sh #用途:查找并删除重复文件,每一个文件只保留一个样本ls -lS | awk 'BEGIN{g ...
- 根据文件MD5删除重复文件
根据文件MD5删除重复文件,仅保留一份文件: ```shell find . -type f -exec md5sum {} \; | sort -k 1 | awk 'a[$1]++{print $ ...
- 通过md5值删除重复文件
不能不说shell命令的强大,一条命令就可以解决繁琐编码. 根据文件MD5删除重复文件,仅保留一份文件: find "$1" -type f -exec md5sum {} \; ...
- CCleaner软件一键查找/删除重复文件
在日常工作学习中,电脑系统在使用后难免会出现一些重复文件,这些重复文件不仅会给工作带来极大的不便,也会占用电脑宝贵的内存资源.因此,经常查找与清理电脑系统中的重复文件就显得格外重要. 小编在此向大家推 ...
- 群晖自动删除重复文件_在群晖中批量删除重复文件(零基础手把手图文)
在群晖中批量删除重复文件(零基础手把手图文) 2020-03-26 14:51:01 24点赞 229收藏 39评论 小编注:此篇文章来自即可瓜分10万金币,周边好礼达标就有,邀新任务奖励无上限,点击 ...
- 在Linux中查找和删除重复文件的4种方法
大神教你在Linux中查找和删除重复文件的4种方法 在本教程中,您将学习如何使用rdfind和fdupes命令行工具以及称为DupeGuru和FSlint的GUI工具在Linux中查找和删除重复文件. ...
- Win10中使用CMD命令遍历文件夹删除重复文件
接上一篇<Win10中使用CMD命令遍历文件夹去除多余后缀名>,当修改完后缀名的时候发现,有些文件下载了两次,比如说同时存在video.mp4和video(1).mp4这两个文件,随便点开 ...
- linux删除重复文件,linuxshell删除重复文件只保留一份
#!/bin/bash #name:remove_one.sh #用途:查找并删除重复文件,每个文件只保留一个样本 #将文件依据大小排序并输出 ls -lS | awk 'BEGIN { #得到第一行 ...
- 删除重复文件的脚本代码
测试环境 :centos7 ⚠️注意:该代码在Mac os系统下会因为参数问题报错 无参数"ls --time-style" "uniq -w" "m ...
最新文章
- 迁移学习与跨域推荐,以及解决跨域推荐的方法
- BNF范式(巴科斯范式)简介
- Spring-注入方式(基于xml方式)
- 银行营业网点管理系统——implt包(BranchesDaoImpl )
- python爬虫程序框架的理论是什么_Python网络爬虫(scrapy框架简介和基础应用)
- pcjome新闻图片替换效果
- 如何停止Linux系统中占用CPU 100%的进程
- 一个存储交流的报告——闪存存储系统设计
- CentOS/RHEL 7中的firewall控制
- Spring IOC三种注入方式(接口注入、setter注入、构造器注入)
- 农历和阳历日期互转,Python实现
- Flutter 旋转动画
- Mac+virtualbox安装win7
- circos 可视化手册-histograms 篇
- C# 发送邮件内容嵌入图片
- ONVIF 获取RTSP URL过程
- 例题6-21 uva506 System Dependencies 模拟
- GBASE 8C——SQL参考 5 全文检索
- 阿里巴巴收购中天微,中国“芯”指日可待!
- SMARTS操作指南(9):变量与表单
热门文章
- 如何衡量机器与人类的智能关系,AI智商评测标准专家研讨会邀请
- 10句“金玉良言”,助你面试成功!
- 7 年“键盘手”没在意!某程序员手疼查出骨肿瘤,已让骨头成了“豆腐渣”
- HDU-2044-一只小蜜蜂
- jsonView谷歌插件
- NO7 利用三剑客awk-grep-sed-head-tail等7种方法实践
- 2018-2019-2 20165313 《网络对抗技术》Exp4 恶意代码分析
- vue写的简单版todolist
- 查找局域网中的DHCP服务器
- Python 设计模式: 单例模式(singleton pattern)