Linux删除重复行
文本处理时,经常要删除重复行,下面是三种方法
第一,用sort+uniq,注意,单纯uniq是不行的。
sort -n test.txt | uniq
第二,用sort+awk命令,注意,单纯awk同样不行,原因同上。
sort -n $file | awk '{if($0!=line)print; line=$0}'
第三,用sort+sed命令,同样需要sort命令先排序。
sort -n $file | sed '$!N; /^\(.*\)\n\1$/!P; D'
Shell脚本
# !/bin/shfile='test.txt'sort -n $file | uniqsort -n $file | awk '{if($0!=line)print; line=$0}'sort -n $file | sed '$!N; /^\(.*\)\n\1$/!P; D'
测试文件:
yanggang@barry$ cat test.txt
aaa
bbbbb
ccccc
123
aaaaa
123
bbb
aaa
执行结果:
yanggang@barry$ ./diffRow.sh
aaa
aaaaa
bbb
bbbbb
ccccc
123
推荐参考:
删除文本中的重复行sort+uniq/awk/sed
SED单行脚本快速参考Unix 流编辑器
Linux删除重复行相关推荐
- linux多个文件删除重复行,shell中删除文件中重复行的方法
Linux下文本处理工具很丰富很强大,例如这样一个文件: cat log www.jb51.net 192.168.1.1 www.jb51.net 192.168.1.1 www.jb51.net ...
- linux shell 合并多个文件 并删除重复行
目录 源文件 合并文件 删除重复行并显示 文件并集&交集&补集 cat a.txt b.txt | sort | uniq > h.txt 源文件 1.首先输入"cd ...
- pandas使用drop_duplicates函数基于subset参数指定的数据列子集删除重复行、并设置keep参数保留重复行中的最后一个数据行
pandas使用drop_duplicates函数基于subset参数指定的数据列子集删除重复行.并设置keep参数保留重复行中的最后一个数据行 目录
- pandas删除数据行中的重复数据行、基于dataframe所有列删除重复行、基于特定数据列或者列的作何删除重复行、删除重复行并保留重复行中的最后一行、pandas删除所有重复行(不进行数据保留)
pandas删除数据行中的重复数据行.基于dataframe所有列删除重复行.基于特定数据列或者列的作何删除重复行.删除重复行并保留重复行中的最后一行.pandas删除所有重复行(不进行数据保留) 目 ...
- 温故知新MySQL--如何在MySQL表中删除重复行
2019独角兽企业重金招聘Python工程师标准>>> 如何在MySQL表中删除重复行 在实际应用中,会有需要删除重复数据的场景.这里简单介绍下如何删除重复的数据 1. 准备数据 C ...
- editplus 批量删除 重复行
编辑 - 删除 - 删除重复行.最后只剩下不重复的部分,之前重复的行,也只剩下一份.
- MySQL 如何查找删除重复行?
如何查找重复行 第一步是定义什么样的行才是重复行.多数情况下很简单:它们某一列具有相同的值.本文采用这一定义,或许你对"重复"的定义比这复杂,你需要对sql做些修改.本文要用到的数 ...
- sqlserver中删除重复行的方法
前段时间,公司同事不小心在数据库表中重加了数据,不多,7000条左右.因为信息比较重要,不能删错了.但也不能有重复数据.所以找我求救. 解决问题后,总结如下: SQL Server删除重复行是我们最常 ...
- datagrid如何获取一行数据中的某个字段值_MySQL 如何查找删除重复行?
如何查找重复行 第一步是定义什么样的行才是重复行.多数情况下很简单:它们某一列具有相同的值.本文采用这一定义,或许你对"重复"的定义比这复杂,你需要对sql做些修改.本文要用到的数 ...
最新文章
- 中文自然语言处理导论
- SSH远程登录解析(linux)
- tomcat服务器文件被清空,SpringBoot内置Tomcat缓存文件目录被意外删除导致异常
- 彻底了解JS中难懂的闭包
- C#LeetCode刷题之#67-二进制求和(Add Binary)
- 探索MicroPython(四)--传感器应用
- Python练习:五到七章的练习题
- Java程序员学习笔记——Mybatis日常记录
- dataframe 排序_如何对Pandas DataFrame进行自定义排序
- numpy——flat与flatten
- 关于动态规划的一点学习感想
- 制作开心网页游戏 HTML+CSS静态网页
- 旧主机改NAS最终成功的过程
- MMKV 组件-快速丶读丶查丶写的sp
- 神舟Z8-SP7D1驱动安装
- 【Linux】logrotate切割Tomcat日志并轮转(Flume采集准备工作适用)
- 【线程池的工作参数、什么情况下会触发最大线程数?什么情况下会回收线程?】
- 重磅:微信官方推出 Web 前端和小程序统一框架
- { 周赛 }又被虐爆了
- 计算机局域网的基本拓扑结构五种,计算机网络中局域网的拓扑结构有哪五种(图文)...
热门文章
- Excel 多条件筛选 与 数据透视表 实现
- 视频图片 超分与动漫化+补帧
- 深耕边缘计算 揭秘阿里云边缘云网一体化的技术实践
- NYOJ - 独木舟上的旅行
- CF 1720 D1. Xor-Subsequence (easy version) dp 1800
- 全国职业院校技能大赛网络搭建与应用赛项——云平台底层的一些命令
- 全球与中国硅通孔(TSV)市场深度研究分析报告
- 程序员土豆原创诗四首回顾
- 巴拿赫空间的基本性质
- flyingsaucer转换多个html,如何在将PDF转换为HTML的同时在Flying-Saucer中设置基本URL?...