Linux系列文章

第十章 正则表达式与文本处理工具


文章目录

  • Linux系列文章
  • 1、正则表达式入门
    • 1.1 常规匹配
    • 1.2 常用特殊字符
  • 2、文本处理工具
    • 2.1 cut

1、正则表达式入门

正则表达式使用单个字符串来描述、匹配一系列符合某个语法规则的字符串。在很多文 本编辑器里,正则表达式通常被用来检索、替换那些符合某个模式的文本。在 Linux 中,grep, sed,awk 等文本处理工具都支持通过正则表达式进行模式匹配。

1.1 常规匹配

一串不包含特殊字符的正则表达式匹配它自己,例如:

cat /etc/passwd | grep root

就会匹配所有包含 root 的行。

1.2 常用特殊字符

1)特殊字符:^
^ 匹配一行的开头,例如:

cat /etc/passwd | grep ^a

会匹配出所有以 a 开头的行

[root@iZ2zei44cqux4qbfqwaz0yZ etc]# cat passwd |grep ^a
adm:x:3:4:adm:/var/adm:/sbin/nologin
apache:x:48:48:Apache:/usr/share/httpd:/sbin/nologin

2)特殊字符:$
$ 匹配一行的结束,例如

[root@iZ2zei44cqux4qbfqwaz0yZ etc]# cat passwd |grep n$
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
operator:x:11:0:operator:/root:/sbin/nologin
games:x:12:100:games:/usr/games:/sbin/nologin
ftp:x:14:50:FTP User:/var/ftp:/sbin/nologin
nobody:x:99:99:Nobody:/:/sbin/nologin
systemd-network:x:192:192:systemd Network Management:/:/sbin/nologin
dbus:x:81:81:System message bus:/:/sbin/nologin
polkitd:x:999:998:User for polkitd:/:/sbin/nologin
sshd:x:74:74:Privilege-separated SSH:/var/empty/sshd:/sbin/nologin
postfix:x:89:89::/var/spool/postfix:/sbin/nologin
chrony:x:998:996::/var/lib/chrony:/sbin/nologin
nscd:x:28:28:NSCD Daemon:/:/sbin/nologin
tcpdump:x:72:72::/:/sbin/nologin
mysql:x:27:27:MariaDB Server:/var/lib/mysql:/sbin/nologin
apache:x:48:48:Apache:/usr/share/httpd:/sbin/nologin

会匹配出所有以 n结尾的行

思考:^$ 匹配什么?

3)特殊字符:.
. 匹配一个任意的字符,例如

会匹配包含 rabt,rbbt,rxdt,root 等的所有行

4)特殊字符:*
* 不单独使用,他和上一个字符连用,表示匹配上一个字符 0 次或多次,例如

会匹配 rt, rot, root, rooot, roooot 等所有行

思考:.* 匹配什么?

5)字符区间(中括号):[ ]
[ ] 表示匹配某个范围内的一个字符,例如
[6,8]------匹配 6 或者 8
[0-9]------匹配一个 0-9 的数字
[0-9] * ------匹配任意长度的数字字符串
[a-z]------匹配一个 a-z 之间的字符
[a-z] * ------匹配任意长度的字母字符串
[a-c, e-f]-匹配 a-c 或者 e-f 之间的任意字符
会匹配 rt,rat, rbt, rabt, rbact,rabccbaaacbt 等等所有行

6)特殊字符:\
\ 表示转义,并不会单独使用。由于所有特殊字符都有其特定匹配模式,当我们想匹配 某一特殊字符本身时(例如,我想找出所有包含 ‘$’ 的行),就会碰到困难。此时我们就要 将转义字符和特殊字符连用,来表示特殊字符本身,例如

[root@iZ2zei44cqux4qbfqwaz0yZ etc]# cat passwd |grep 'a\$b'
就会匹配所有包含 a$b 的行。注意需要使用单引号将表达式引起来。

2、文本处理工具

2.1 cut

cut 的工作就是“剪”,具体的说就是在文件中负责剪切数据用的。cut 命令从文件的每 一行剪切字节、字符和字段并将这些字节、字符和字段输出。
1)基本用法 cut [选项参数] filename
说明:默认分隔符是制表符

(1)数据准备

[root@iZ2zei44cqux4qbfqwaz0yZ apps]# touch cut.txt


(2)切割 cut.txt 第一列

[root@iZ2zei44cqux4qbfqwaz0yZ apps]# cut -d " " -f 1 cut.txt
han
zhang
xiu
dao
zhen

(3)切割 cut.txt 第二、三列

[root@iZ2zei44cqux4qbfqwaz0yZ apps]# cut -d " " -f 2,3 cut.txt
li
tie
xian
you
bao

(4)在 cut.txt 文件中切割出 li

[root@iZ2zei44cqux4qbfqwaz0yZ apps]# cat cut.txt | grep li | cut -d " " -f 2
li

(5)选取系统 PATH 变量值,第 2 个“:”开始后的所有路径:

[root@iZ2zei44cqux4qbfqwaz0yZ apps]# echo $PATH
/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/usr/java/jdk1.8.0_131/bin:/usr/java/jdk1.8.0_131/jre/bin:/root/bin[root@iZ2zei44cqux4qbfqwaz0yZ apps]# echo $PATH | cut -d ":" -f 3-
/usr/sbin:/usr/bin:/usr/java/jdk1.8.0_131/bin:/usr/java/jdk1.8.0_131/jre/bin:/root/bin

(6)切割 ifconfig 后打印的 IP 地址

(下回Linux秘籍三剑客即将登场)

【Linux系列文章】正则表达式与文本处理工具相关推荐

  1. 【Linux系列文章】基本命令介绍

    Linux系列文章 第五章 基本命令 文章目录 Linux系列文章 1.常用快捷键 2.文件目录类 3.时间日期类 3.1显示时间 3.2 date 设置系统时间 3.3 查看日历 4.用户管理命令 ...

  2. Linux正则表达式和文本处理工具(gred、awk、sed)

    使用Linux 的 gred.awk.sed 可以方便得处理文本,然而若要灵活使用这三个工具,首先必须理解正则表达式.这里先对正则表达式进行学习,做点记录,之后再练习一下文本处理工具的使用. 正则表达 ...

  3. linux正则表达式与文本处理工具

    目录 一.基础正则表达式 二.文本处理工具 (1)grep命令 (2)cut.sort.uniq.tr cut   !列截取工具 ! sort排序工具 uniq去重工具 tr修改工具 一.基础正则表达 ...

  4. Shell第二篇:正则表达式和文本处理工具

    一 什么是正则 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则. 生活中处处都是正则:     比如我们描述:4条腿   ...

  5. 正则表达式和文本处理工具

    一 什么是正则 正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法.或者说:正则就是用来描述一类事物的规则. 生活中处处都是正则:     比如我们描述:4条腿   ...

  6. Linux系列文章 —— vim的基本操作(误入vim退出请先按「ESC」再按:q不保存退出,相关操作请阅读本文)

    系列文章目录 vim-操作篇 进程概念篇 进程地址空间篇 文章目录 系列文章目录 前言 一.vim的基本概念 二.vim的基本操作 1.退出vim编辑器 2.进入vim编辑器 3.模式功能及切换 三. ...

  7. 因果系列文章(6)——干预工具(上)

    本节将延续上一节学习的干预的有关概念,开始深入介绍几种干预的工具:后门调整.前门调整.逆概率加权等.本节将有大量公式来袭,请准备草稿纸或提前绕道~ 在上一节最后,我们推导出有关干预的重要公式--调整公 ...

  8. 【Linux学习】强大的文本分析工具AWK

    之所以叫 AWK 是因为其取了三位创始人 Alfred Aho,Peter Weinberger, 和 Brian Kernighan 的 Family Name 的首字符. 调用AWK: 1.命令行 ...

  9. 因果系列文章(7)——干预工具(下)

    在上一节我们继续学习了有关干预的知识,具体来说,学习了三种重要的干预工具:后门调整.前门调整.逆概率加权.在本节中,我们从线性系统开始入手,介绍变量连续时的因果效应如何表达,并学习中介.工具变量等概念 ...

  10. Linux中使用正则表达式进行文本匹配

    文本: 哈利波特第一部,<哈利波特与魔法石>,Harry.txt grep --color -E "le" Harry.txt --color : 匹配到的字符用颜色标 ...

最新文章

  1. 学python的心得体会-Python学习心得
  2. 建立Microsoft SQL Server 2005数据仓库
  3. vrish 删除虚机_使用Kvm命令集管理虚拟机
  4. druid不能close mysql连接_druid长时间无操作无法保持连接!!
  5. linux之用openssl命令Base64编码解码、md5/sha1摘要、AES/DES3加密解密
  6. 架构师一般做到多少岁_软件测试可以做到多大岁数?
  7. 市场营销读后感_好书共赏市场营销原理——带你探索市场营销成功的奥秘 !...
  8. c++ vector使用方法收集
  9. Android (AMS)ActivityManagerService源码分析
  10. 7-8 黑洞数 (20 分)
  11. centos6.6_vsftpd 虚拟账户FTP服务搭建
  12. Adyen海外支付 - 对接订阅
  13. DDG-1000下水
  14. 为什么这么多学生讨厌数学(以及如何解决它)?
  15. 全国高校json文件
  16. 【MM系列】SAP MM物料账在制品承担差异功能及配置
  17. 马云5年实现“无现金社会”,必须迈过这几道坎?
  18. 《Hive编程指南》阅读笔记
  19. ZZULIOJ 1114-1130 数组专题 参考代码
  20. arduino红外对管

热门文章

  1. MySQL基础篇——存储过程和函数中的变量
  2. P3939 数颜色 动态开点线段树
  3. 由零开始学习小程序架构
  4. Android序列化之Parcel
  5. oracle超级管理员忘记_Oracle 管理员账号密码忘记的快速解决方法
  6. 刻在祁连山上的艺术二维码,真的太酷了11
  7. 完美识别率 迅捷PDF转换成Word转换器发布
  8. 定量库存控制模型_定量订货库存管理模型分析及应用
  9. 以太坊nonce详解
  10. html入门怎么换字体颜色,html怎么改字体颜色