2019独角兽企业重金招聘Python工程师标准>>>

#!/bin/bash 
#name:remove_one.sh
#用途:查找并删除重复文件,每个文件只保留一个样本

#将文件依据大小排序并输出
ls -lS | awk 'BEGIN {
#得到第一行total总数并丢弃,读取下一行
getline;getline;
name1=$9;size=$5;
}
{
name2=$9;
if(size==$5)
#大小一样的可能是内容相同的文件
{
#用md5进行校验和
("md5sum "name1)|getline; csum1=$1;
("md5sum "name2)|getline; csum2=$1;
#如果校验和相同则为内容相同的文集,输出名字
if( csum1==csum2 )
{
{print name1;print name2}
}
};
size=$5;name1=name2;
}' | sort -u > duplicate_files

#计算重复文件的md5sum,将重复文件中的一采样写入duplicate_sample中
cat duplicate_files|xargs -I {} md5sum {}| sort | uniq -w 32 | awk '{print $2}' | sort -u > duplicate_sample

echo Removing...

#删除在duplicate_files中列出且未被duplicate_sample列出的全部文件
comm duplicate_files duplicate_sample -2 -3|tee /dev/stderr|xargs rm
echo Removed duplicates files successfully

转载于:https://my.oschina.net/u/2553223/blog/609694

【shell】删除重复文件相关推荐

  1. shell 删除重复文件

    shell 删除重复文件的脚本 #!bin/bash #文件名:remove_duplicates.sh #用途:查找并删除重复文件,每一个文件只保留一个样本ls -lS | awk 'BEGIN{g ...

  2. 根据文件MD5删除重复文件

    根据文件MD5删除重复文件,仅保留一份文件: ```shell find . -type f -exec md5sum {} \; | sort -k 1 | awk 'a[$1]++{print $ ...

  3. 通过md5值删除重复文件

    不能不说shell命令的强大,一条命令就可以解决繁琐编码. 根据文件MD5删除重复文件,仅保留一份文件: find "$1" -type f -exec md5sum {} \; ...

  4. CCleaner软件一键查找/删除重复文件

    在日常工作学习中,电脑系统在使用后难免会出现一些重复文件,这些重复文件不仅会给工作带来极大的不便,也会占用电脑宝贵的内存资源.因此,经常查找与清理电脑系统中的重复文件就显得格外重要. 小编在此向大家推 ...

  5. 群晖自动删除重复文件_在群晖中批量删除重复文件(零基础手把手图文)

    在群晖中批量删除重复文件(零基础手把手图文) 2020-03-26 14:51:01 24点赞 229收藏 39评论 小编注:此篇文章来自即可瓜分10万金币,周边好礼达标就有,邀新任务奖励无上限,点击 ...

  6. 在Linux中查找和删除重复文件的4种方法

    大神教你在Linux中查找和删除重复文件的4种方法 在本教程中,您将学习如何使用rdfind和fdupes命令行工具以及称为DupeGuru和FSlint的GUI工具在Linux中查找和删除重复文件. ...

  7. Win10中使用CMD命令遍历文件夹删除重复文件

    接上一篇<Win10中使用CMD命令遍历文件夹去除多余后缀名>,当修改完后缀名的时候发现,有些文件下载了两次,比如说同时存在video.mp4和video(1).mp4这两个文件,随便点开 ...

  8. linux删除重复文件,linuxshell删除重复文件只保留一份

    #!/bin/bash #name:remove_one.sh #用途:查找并删除重复文件,每个文件只保留一个样本 #将文件依据大小排序并输出 ls -lS | awk 'BEGIN { #得到第一行 ...

  9. 删除重复文件的脚本代码

    测试环境 :centos7 ⚠️注意:该代码在Mac os系统下会因为参数问题报错 无参数"ls --time-style" "uniq -w" "m ...

最新文章

  1. 迁移学习与跨域推荐,以及解决跨域推荐的方法
  2. BNF范式(巴科斯范式)简介
  3. Spring-注入方式(基于xml方式)
  4. 银行营业网点管理系统——implt包(BranchesDaoImpl )
  5. python爬虫程序框架的理论是什么_Python网络爬虫(scrapy框架简介和基础应用)
  6. pcjome新闻图片替换效果
  7. 如何停止Linux系统中占用CPU 100%的进程
  8. 一个存储交流的报告——闪存存储系统设计
  9. CentOS/RHEL 7中的firewall控制
  10. Spring IOC三种注入方式(接口注入、setter注入、构造器注入)
  11. 农历和阳历日期互转,Python实现
  12. Flutter 旋转动画
  13. Mac+virtualbox安装win7
  14. circos 可视化手册-histograms 篇
  15. C# 发送邮件内容嵌入图片
  16. ONVIF 获取RTSP URL过程
  17. 例题6-21 uva506 System Dependencies 模拟
  18. GBASE 8C——SQL参考 5 全文检索
  19. 阿里巴巴收购中天微,中国“芯”指日可待!
  20. SMARTS操作指南(9):变量与表单

热门文章

  1. 如何衡量机器与人类的智能关系,AI智商评测标准专家研讨会邀请
  2. 10句“金玉良言”,助你面试成功!
  3. 7 年“键盘手”没在意!某程序员手疼查出骨肿瘤,已让骨头成了“豆腐渣”
  4. HDU-2044-一只小蜜蜂
  5. jsonView谷歌插件
  6. NO7 利用三剑客awk-grep-sed-head-tail等7种方法实践
  7. 2018-2019-2 20165313 《网络对抗技术》Exp4 恶意代码分析
  8. vue写的简单版todolist
  9. 查找局域网中的DHCP服务器
  10. Python 设计模式: 单例模式(singleton pattern)