文本 去除重复行(sublime Text3 ,正则表达式)

去除重复行的方法很多,这里通过正则表达式实现;

农林牧渔子类
农林牧渔子类
农林牧渔子类
农林牧渔子类
卫生和社会工作子类
卫生和社会工作子类
卫生和社会工作子类
卫生和社会工作子类
交通运输、仓储和邮政业子类
交通运输、仓储和邮政业子类
交通运输、仓储和邮政业子类
交通运输、仓储和邮政业子类
交通运输、仓储和邮政业子类
交通运输、仓储和邮政业子类
交通运输、仓储和邮政业子类
交通运输、仓储和邮政业子类
建筑业子类
建筑业子类
建筑业子类
建筑业子类
信息传输、软件和信息服务业子类
信息传输、软件和信息服务业子类
信息传输、软件和信息服务业子类
信息传输、软件和信息服务业子类
住宿和餐饮业子类
住宿和餐饮业子类
住宿和餐饮业子类
住宿和餐饮业子类
卫生和社会工作子类
卫生和社会工作子类
卫生和社会工作子类
卫生和社会工作子类
文化、体育和娱乐业子类
文化、体育和娱乐业子类
文化、体育和娱乐业子类
文化、体育和娱乐业子类
制造业子类
制造业子类
制造业子类
制造业子类
制造业子类
制造业子类
制造业子类
制造业子类
制造业子类
制造业子类
制造业子类
制造业子类
农林牧渔子类
农林牧渔子类
农林牧渔子类
农林牧渔子类
渔船船员子类
渔船船员子类
渔船船员子类
渔船船员子类
渔船船员子类
渔船船员子类
渔船船员子类
渔船船员子类
制造业子类
制造业子类
制造业子类
制造业子类

正则表达式

(.*)(?=.*\n\1)

(^.*\n)(?=\1)

(.*) 任意字符 并捕获在第一组
(?=.*\n\1) 这是断言, 表示后面内容将是 任意个字符加上第一组所捕获的内容

替换为空

结果

农林牧渔子类
卫生和社会工作子类
交通运输、仓储和邮政业子类
建筑业子类
信息传输、软件和信息服务业子类
住宿和餐饮业子类
卫生和社会工作子类
文化、体育和娱乐业子类
制造业子类
农林牧子类
渔船船员子类
制造业子类

再去除空行(安装插件DeleteBlankLines或者录制执行正则表达式的宏),排序F9都可以使用sublime Text3

文本 去除重复行(sublime Text3 ,正则表达式)相关推荐

  1. 如何高效地做到大文本去除重复行

    如果只是去重,用sort的效率很低(指的是上千万行的量级),因为做了额外操作,因为你只是要去重,而不是排序 用awk数组来实现很简单很快,利用了awk数组是hashtable实现的特性.内存占用和去重 ...

  2. menisa mysql_实例详细说明linux下去除重复行命令uniq

    一,uniq干什么用的 文本中的重复行,基本上不是我们所要的,所以就要去除掉.linux下有其他命令可以去除重复行,但是我觉得uniq还是比较方便的一个.使用uniq的时候要注意以下二点 1,对文本操 ...

  3. linux排列去重复的命令,实例详细说明linux下去除重复行命令uniq

    一,uniq干什么用的 文本中的重复行,基本上不是我们所要的,所以就要去除掉.linux下有其他命令可以去除重复行,但是我觉得uniq还是比较方便的一个.使用uniq的时候要注意以下二点 1,对文本操 ...

  4. python3 文本文件内容去除重复行

    环境:python3.8 import shutil# 文件去除重复行 def remove_duplicates(path):lines_seen = set()outfile = open(f&q ...

  5. python excel处理重复行并统计个数_python统计一个文本中重复行数的方法

    python统计一个文本中重复行数的方法 这篇文章主要介绍了python统计一个文本中重复行数的方法,涉及针对Python中dict对象的使用及相关本文的操作,具有一定的借鉴价值,需要的朋友可以参考下 ...

  6. python统计重复的数_python统计一个文本中重复行数的方法

    本文实例讲述了python统计一个文本中重复行数的方法.分享给大家供大家参考.具体实现方法如下: 比如有下面一个文件 2 3 1 2 我们期望得到 2,2 3,1 1,1 解决问题的思路: 出现的文本 ...

  7. shell脚本--awk数组实现去除重复行

    去除重复行的方法有很多,这里介绍三种. 测试文本: [root@172-0-10-222 myscripts]# cat testfile andy 123456 hanna 123456 hello ...

  8. Pandas 模块-操纵数据(8)-去除重复行 .drop_duplicates()

    目录 8. 去除重复行 .drop_duplicates() 8.1 .drop_duplicates() 语法 8.1.1 .drop_duplicates() 语法结构 8.1.2 .drop_d ...

  9. linux shell 文件去除重复行

    原始文本文件 $ cat test jason jason jason fffff jason 方法一:sort -u 去除重复后 sort -u test fffff jason 注意顺序被打乱 方 ...

最新文章

  1. linux ubuntu 获取仓库源码并构建
  2. OutOfRangeError closed and has insufficient elements (requested 512, current size 362)
  3. 创新工场董事长兼首席执行官 李开复 发 言 稿
  4. SQL 分页查询语句大全即(查找第N到M条记录的方法)
  5. java源文件编译成jar_从源文件和JAR文件构建Java代码模型
  6. opensource项目_最佳Opensource.com:开放组织
  7. OSGi运行环境下java反序列化问题的解决方式
  8. 三维空间点到线段的距离
  9. av_rescale_q
  10. 【数据结构】图邻接矩阵的创建完整代码
  11. 【安全防御】IPsec VPN
  12. python制表符的作用_Python制表符是什么
  13. WordPress底部添加备案信息小技巧
  14. c语言a b等于c的编程,简单的a+b (C语言代码)
  15. win7计算机开始里没有设置,win7系统开始菜单没有设置的解决方法?
  16. ai人工智能_对人工智能的追求
  17. vue实现点击变色再次点击变回来
  18. mysql 单表最多能存多少数据?
  19. 扩展02 - 数据库可视化工具
  20. 使用ANTLR进行语法分析

热门文章

  1. 阿里云服务器安装mongodb
  2. 2016互联网金融安全峰会报名
  3. django qq邮箱发送验证码
  4. 《培生小学英语分级阅读80篇 五年级》勘误表
  5. 判断司机是否酒后驾车
  6. Excel将多个工作表一键按照字母排序
  7. 计算机工程专业院校排名,2017美国计算机工程专业院校排名
  8. 图像处理学习2,边缘检测1(sobel算子,kirsch算子)
  9. 数据类型扩展 相关面试题讲解 类型转换
  10. 怎样才能让青少年培养起阅读习惯?听听猿辅导这四位嘉宾怎么说