文本处理时,经常要删除重复行,下面是三种方法

第一,用sort+uniq,注意,单纯uniq是不行的。
sort -n test.txt | uniq

第二,用sort+awk命令,注意,单纯awk同样不行,原因同上。

sort -n $file | awk '{if($0!=line)print; line=$0}'
 

第三,用sort+sed命令,同样需要sort命令先排序。

sort -n $file | sed '$!N; /^\(.*\)\n\1$/!P; D'

Shell脚本

# !/bin/shfile='test.txt'sort -n $file | uniqsort -n $file | awk '{if($0!=line)print; line=$0}'sort -n $file | sed '$!N; /^\(.*\)\n\1$/!P; D'

测试文件:

yanggang@barry$ cat test.txt 
aaa
bbbbb
ccccc
123
aaaaa
123
bbb
aaa
执行结果:

yanggang@barry$ ./diffRow.sh 
aaa
aaaaa
bbb
bbbbb
ccccc
123

推荐参考:

删除文本中的重复行sort+uniq/awk/sed

SED单行脚本快速参考Unix 流编辑器

Linux删除重复行相关推荐

  1. linux多个文件删除重复行,shell中删除文件中重复行的方法

    Linux下文本处理工具很丰富很强大,例如这样一个文件: cat log www.jb51.net 192.168.1.1 www.jb51.net 192.168.1.1 www.jb51.net ...

  2. linux shell 合并多个文件 并删除重复行

    目录 源文件 合并文件 删除重复行并显示 文件并集&交集&补集 cat a.txt b.txt | sort | uniq > h.txt 源文件 1.首先输入"cd ...

  3. pandas使用drop_duplicates函数基于subset参数指定的数据列子集删除重复行、并设置keep参数保留重复行中的最后一个数据行

    pandas使用drop_duplicates函数基于subset参数指定的数据列子集删除重复行.并设置keep参数保留重复行中的最后一个数据行 目录

  4. pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行(不进行数据保留)

    pandas删除数据行中的重复数据行.基于dataframe所有列删除重复行.基于特定数据列或者列的作何删除重复行.删除重复行并保留重复行中的最后一行.pandas删除所有重复行(不进行数据保留) 目 ...

  5. 温故知新MySQL--如何在MySQL表中删除重复行

    2019独角兽企业重金招聘Python工程师标准>>> 如何在MySQL表中删除重复行 在实际应用中,会有需要删除重复数据的场景.这里简单介绍下如何删除重复的数据 1. 准备数据 C ...

  6. editplus 批量删除 重复行

    编辑 - 删除 - 删除重复行.最后只剩下不重复的部分,之前重复的行,也只剩下一份.

  7. MySQL 如何查找删除重复行?

    如何查找重复行 第一步是定义什么样的行才是重复行.多数情况下很简单:它们某一列具有相同的值.本文采用这一定义,或许你对"重复"的定义比这复杂,你需要对sql做些修改.本文要用到的数 ...

  8. sqlserver中删除重复行的方法

    前段时间,公司同事不小心在数据库表中重加了数据,不多,7000条左右.因为信息比较重要,不能删错了.但也不能有重复数据.所以找我求救. 解决问题后,总结如下: SQL Server删除重复行是我们最常 ...

  9. datagrid如何获取一行数据中的某个字段值_MySQL 如何查找删除重复行?

    如何查找重复行 第一步是定义什么样的行才是重复行.多数情况下很简单:它们某一列具有相同的值.本文采用这一定义,或许你对"重复"的定义比这复杂,你需要对sql做些修改.本文要用到的数 ...

最新文章

  1. 中文自然语言处理导论
  2. SSH远程登录解析(linux)
  3. tomcat服务器文件被清空,SpringBoot内置Tomcat缓存文件目录被意外删除导致异常
  4. 彻底了解JS中难懂的闭包
  5. C#LeetCode刷题之#67-二进制求和(Add Binary)
  6. 探索MicroPython(四)--传感器应用
  7. Python练习:五到七章的练习题
  8. Java程序员学习笔记——Mybatis日常记录
  9. dataframe 排序_如何对Pandas DataFrame进行自定义排序
  10. numpy——flat与flatten
  11. 关于动态规划的一点学习感想
  12. 制作开心网页游戏 HTML+CSS静态网页
  13. 旧主机改NAS最终成功的过程
  14. MMKV 组件-快速丶读丶查丶写的sp
  15. 神舟Z8-SP7D1驱动安装
  16. 【Linux】logrotate切割Tomcat日志并轮转(Flume采集准备工作适用)
  17. 【线程池的工作参数、什么情况下会触发最大线程数?什么情况下会回收线程?】
  18. 重磅:微信官方推出 Web 前端和小程序统一框架
  19. {  周赛  }又被虐爆了
  20. 计算机局域网的基本拓扑结构五种,计算机网络中局域网的拓扑结构有哪五种(图文)...

热门文章

  1. Excel 多条件筛选 与 数据透视表 实现
  2. 视频图片 超分与动漫化+补帧
  3. 深耕边缘计算 揭秘阿里云边缘云网一体化的技术实践
  4. NYOJ - 独木舟上的旅行
  5. CF 1720 D1. Xor-Subsequence (easy version) dp 1800
  6. 全国职业院校技能大赛网络搭建与应用赛项——云平台底层的一些命令
  7. 全球与中国硅通孔(TSV)市场深度研究分析报告
  8. 程序员土豆原创诗四首回顾
  9. 巴拿赫空间的基本性质
  10. flyingsaucer转换多个html,如何在将PDF转换为HTML的同时在Flying-Saucer中设置基本URL?...