如何得到两个文件的交集、并集和差集?

交集:两个文件中都出现的行

并集:两个文件中的所有行加起来,去掉重复

差集:在一个文件中存在,而在另一个文件中不存在。

比如以下两个文件:

a.txt

aaa

bbb

ccc

111

222

b.txt

ccc

ddd

eee

111

333

结果:

a.txt和b.txt的交集:

ccc

111

a.txt和b.txt的并集:

111

222

333

aaa

bbb

ccc

ddd

eee

a.txt中存在b.txt中不存在:

222

aaa

bbb

b.txt中存在a.txt中不存在:

333

ddd

eee

方法一:sort+uniq

sort:用于将文本文件内容加以排序

uniq:删除文件中重复的行,得到文件中唯一的行

交集

sort a.txt b.txt | uniq -d

(用sort将a.txt b.txt文件进行排序,uniq使得两个文件中的行唯一,使用-d输出两个文件中次数大于1的内容,即是得到交集)

并集

sort a.txt b.txt | uniq

(将a.txt b.txt文件进行排序&#x

linux两个文件取交集、并集、差集相关推荐

  1. ORAClE 两个表取交集,并集,差集

    这是我盗的 selct A.* from A UNION ALL/UNION/Intersect/MINUS select B.* from B; UNION ALL ---------------- ...

  2. Linux中uniq去重以及对两个文件取交集,并集,差集

    uniq 前言 很多时候我们需要对数据去重,不管是少量数据还是大量数据,写代码进行去重终究没有使用系统功能直接操作文件方便,所以本文就介绍了一些关于uniq的使用方法 uniq单独使用 uniq配合s ...

  3. Linux 两个文件求交集、并集、差集

    Linux 两个文件求交集.并集.差集 原文地址: Linux 两个文件求交集.并集.差集 (https://www.cnblogs.com/molong1208/p/5358509.html) 一. ...

  4. jdk8两个List取交集、差集、并集(不去重)、并集(去重)

    jdk8两个List取交集.差集.并集(不去重).并集(去重) /*** 交集* @param list1* @param list2* @return*/private static List< ...

  5. 【Java】对两个Set取交集,差集,并集

    1.取交集(取两个集合中都存在的元素) HashSet<String> setA = new HashSet<>(); HashSet<String> setB = ...

  6. Python-两个列表取交集、并集、差集(编写了一个两个文件取交集的小工具)

    最近突然有个需求(取两个文件数据的交集),数据量非常大(2000多万行的数据),最开始的思路是先取一个文件所有的数据,保存成一个列表,然后判断是否在另一个文件中,花了十几分钟写出来后,一运行,差点崩溃 ...

  7. 利用shell求取两个文件的交集、差集、并集等

    求文件行数 cat a.txt | wc -l 交集 sort a.txt b.txt | uniq -d 并集 sort a.txt b.txt | uniq 差集 (1) a.txt-b.txt ...

  8. 两个list的交集并集差集

    昨天看了一本书,讲了更优雅的进行两个集合的并集.交集.差集等.比之前的那个stream流要好用. 1.并集 最正常的使用add方法. list1.addAll(list2); 注意:要是想要得到不重复 ...

  9. linux文件取交集、差集、并集

    # 交集 sort a.txt | uniq > aa.txt sort b.txt | uniq > bb.txt cat aa.txt bb.txt | sort | uniq -d ...

最新文章

  1. 【错误记录】C 语言中通过指针操作字符串常量出错记录 ( 只有 栈内存 或 堆内存 中的数据才能通过指针修改 | 不要通过指针修改常量区的字符串 )
  2. H3C S5500核心交换机策略路由调度流量到不同的路由设备
  3. 2.域控制器及证书颁发机构
  4. 用matlab参数法拟合,MATLAB|曲线拟合基本介绍
  5. Mybatis源码解析:sql参数处理(1)
  6. html 遮罩层在底部,底部弹出遮罩层.html
  7. LeetCode 513. Find Bottom Left Tree Value
  8. 【转】windows下GSL的配置
  9. linux系统下载r软件安装,Linux安装R语言包
  10. 【前端项目】<开发实战>一个小而精致的个人简历
  11. “小而美”背后的大道理:WebRAY崛起的深层次原因
  12. ios开发之故事板StoryBoard的使用
  13. PAT 1003 我要通过! python
  14. win7搜索文件 服务器,win7系统搜索不到文件的解决方法
  15. 计算机蓝屏代码0xc0000020,Win10运行程序提示“损坏的映像 错误0xc0000020”解决方法图文教程...
  16. Linux系统管理-audit文件太多导致du -sh命令卡死
  17. RazaviChap8
  18. 安卓车机能升级鸿蒙吗,华为鸿蒙系统能否应用到车机系统
  19. 2005年创新商业模式之窄告
  20. scratch加法出题机 电子学会图形化编程scratch等级考试三级真题和答案解析2021-3

热门文章

  1. javaCV简单解析gb28181的rtp ps流,并推流到rtmp服务
  2. 读书笔记--项亮《推荐系统实践》第一章
  3. 测试人员如何避免背黑锅
  4. SpringBoot 基本奥义
  5. 项目实训2021.07.13
  6. 【SQLite】SQLite数据库使用与案例(二)
  7. TMC5160/5130驱动芯片使用简明指南
  8. 全球与中国磁滞式电缆卷筒市场深度研究分析报告
  9. VLfeat学习(1)——Covariant feature detectors(协变特征检测器)
  10. ESP32开发 micropython常见问题记录