grep(global search regular expression(RE) and print out the line,全面搜索正则表达式并把行打印出来)是一种强大的文本搜索工具,它能使用正则表达式搜索文本,并把匹配的行打印出来。

一、选项

$ grep --h
用法: grep [选项]... PATTERN [FILE]...
在每个 FILE 或是标准输入中查找 PATTERN。
默认的 PATTERN 是一个基本正则表达式(缩写为 BRE)。
例如: grep -i 'hello world' menu.h main.c正则表达式选择与解释:-E, --extended-regexp     PATTERN 是一个可扩展的正则表达式(缩写为 ERE)
  -F, --fixed-strings       PATTERN 是一组由断行符分隔的定长字符串。
  -G, --basic-regexp        PATTERN 是一个基本正则表达式(缩写为 BRE)
  -P, --perl-regexp         PATTERN 是一个 Perl 正则表达式
  -e, --regexp=PATTERN      用 PATTERN 来进行匹配操作
  -f, --file=FILE           从 FILE 中取得 PATTERN
  -i, --ignore-case         忽略大小写
  -w, --word-regexp         强制 PATTERN 仅完全匹配字词
  -x, --line-regexp         强制 PATTERN 仅完全匹配一行
  -z, --null-data           一个 0 字节的数据行,但不是空行

杂项:-s, --no-messages         不显示错误信息
  -v, --invert-match        选中不匹配的行
  -V, --version             显示版本信息并退出
      --help                显示此帮助并退出
      --mmap                忽略向后兼容性

Output control:-m, --max-count=NUM       stop after NUM matches
  -b, --byte-offset         print the byte offset with output lines
  -n, --line-number         print line number with output lines
      --line-buffered       flush output on every line
  -H, --with-filename       print the file name for each match
  -h, --no-filename         suppress the file name prefix on output
      --label=LABEL         use LABEL as the standard input file name prefix
  -o, --only-matching       只显示一行中匹配PATTERN 的部分
  -q, --quiet, --silent     不显示所有输出
      --binary-files=TYPE   假定二进制文件的TYPE 类型;
                            TYPE 可以是`binary', `text', 或`without-match'-a, --text                等同于 --binary-files=text
  -I                        等同于 --binary-files=without-match
  -d, --directories=ACTION  操作目录的方式;
                            ACTION 可以是`read', `recurse',或`skip'-D, --devices=ACTION      操作设备、先入先出队列、套接字的方式;
                            ACTION 可以是`read'或`skip'-R, -r, --recursive       等同于 --directories=recurse
      --include=FILE_PATTERN  只查找匹配FILE_PATTERN 的文件
      --exclude=FILE_PATTERN  跳过匹配FILE_PATTERN 的文件和目录
      --exclude-from=FILE   跳过所有除FILE 以外的文件
      --exclude-dir=PATTERN  跳过所有匹配PATTERN 的目录。
  -L, --files-without-match  只打印不匹配FILEs 的文件名
  -l, --files-with-matches  只打印匹配FILES 的文件名
  -c, --count               只打印每个FILE 中的匹配行数目
  -T, --initial-tab         行首tabs 分隔(如有必要)
  -Z, --null                在FILE 文件最后打印空字符

文件控制:-B, --before-context=NUM  打印以文本起始的NUM 行
  -A, --after-context=NUM   打印以文本结尾的NUM 行
  -C, --context=NUM         打印输出文本NUM 行
  -NUM                      等同于 --context=NUM
      --color[=WHEN],
      --colour[=WHEN]       使用标志高亮匹配字串;
                            WHEN 可以是`always', `never'或`auto'-U, --binary              不要清除行尾的CR 字符(MSDOS 模式)
  -u, --unix-byte-offsets   当CR 字符不存在,报告字节偏移(MSDOS 模式)

‘egrep’即‘grep -E’。‘fgrep’即‘grep -F’。
直接使用‘egrep’或是‘fgrep’均已不可行了。
不带 FILE 参数,或是 FILE 为 -,将读取标准输入。如果少于两个 FILE 参数
就要默认使用 -h 参数。如果选中任意一行,那退出状态为 0,否则为 1;
如果有错误产生,且未指定 -q 参数,那退出状态为 2。请将错误报告给: bug-grep@gnu.org
GNU Grep 主页: <http://www.gnu.org/software/grep/>
GNU 软件的通用帮助: <http://www.gnu.org/gethelp/>

二、实例

参看:grep命令中文手册
参看:grep命令
以下是一些GNU grep的使用示例:

grep -i 'hello.*world' menu.h main.c

该命令用于列出menu.h和main.c中包含”hello”字符串且后面带有”world”字符串的所有行,hello和world中间可以有任意多个字符。注意正则表达式的”-i”选项使得grep忽略大小写,所以还能匹配”Hello, world!”。
下面是一些使用grep时常见的问题和答案。
1、如何列出匹配的文件名?

grep -l 'main' *.c

将列出当前目录下所有以”.c”结尾且文件中包含’main’字符串的文件名。

2、如何递归搜索目录?

grep -r 'hello' /home/gigi

搜索/home/gigi目录下所有文件,且文件中包含’hello’字符串。如果要灵活控制搜索的文件,可以结合find和xargs命令一起使用。例如下面的例子仅搜索C源文件。

find /home/gigi -name '*.c' -print0 | xargs -0r grep -H 'hello'

这不同于下面的命令:

grep -rH 'hello' *.c

这仅仅只是搜索当前目录下以”.c”结尾的文件。此处的”-r”选项基本上算是多余的,除非当前目录下有以”.c”结尾的目录,但这是很少见的情况。上面的find命令更类似于下面的命令:

grep -rH --include='*.c' 'hello' /home/gigi

3、如果pattern以短横线”-“开头会如何?

grep -e '--cut here--' *

将搜索”–cut here–”。但如果不给定”-e”选项,grep将可能把”–cut here”解析成一系列的选项。

4、如何搜索整个单词,而不是单词中的一部分?

grep -w 'hello' *

这将搜索当前目录下所有文件,并找出包含”hello”整个单词的文件,它无法匹配”Othello”。更灵活的控制可以使用”\<”和”>”来匹配单词的开始和结尾。例如:

grep 'hello\>' *

仅搜索”hello”结尾的单词,因此可以匹配”Othello”。

5、如何输出匹配行的上下几行?

grep -C 2 'hello' *

这将输出匹配行以及它的前后两行。

6、如何强制grep即输出匹配行又输出文件名? 只需在文件列表中加上’/dev/null’即可。

grep 'eli' /etc/passwd /dev/null

将得到:

/etc/passwd:eli:x:2098:1000:Eli Smith:/home/eli:/bin/bash

还可以使用GNU扩展选项”-H”:

grep -H 'eli' /etc/passwd

7、为什么有人在ps的后面使用奇怪的正则表达式?

ps -ef | grep '[c]ron'

如果pattern中不加上中括号,将匹配包含cron字符串的进程,包括grep自身,因为grep命令的表达式中包含了cron字符串。但如果加上了中括号,则grep命令行中包含的是”[c]ron”字符串,而grep所匹配的字符串是cron而不是[c]ron。 在输出结果上,这其实等价于下面这条命令:

ps -ef | grep 'cron' | grep -v 'grep'

8、为什么grep的结果中会报告”Binary file matches”?
如果grep列出二进制文件中的所有匹配行,将很可能生成一大堆乱七八糟的无用信息,因此GNU的grep默认禁止这样的输出。如果想要输出二进制内容,使用”-a”或”–binary-files=text”选项。

9、为什么’grep -lv’输出的是包含非匹配行的文件名?
‘grep -lv’列出的是包含一行或多行非匹配行的文件名。如果想要列出无匹配内容的文件名,则使用”-L”选项。 (注:例如a.txt中一部分行匹配到了,一部分行没匹配到,而b.txt中完全没有匹配上,则grep -lv将输出a.txt,而不是b.txt。因此可推测”-v”选项的操作优先级要高于”-l”,即先搜索出反转行,再输出包含这些反转行的文件)

10、使用”|”可以实现or逻辑,如何实现AND逻辑?

grep 'paul' /etc/motd | grep 'franc,ois'

将搜索出同时包含”paul”和”franc,ois”的所有行。

11、如何同时搜索文件和标准输入?
只需使用”-“代替标准输入的文件名即可:

cat /etc/passwd | grep 'alain' - /etc/motd

12、正则表达式中如何表达出回文结构?(注:回文结构表示正读和反读的结果是一样的,例如12321,abcba)可以使用反向引用来实现。例如,一个4字符的结构使用BRE来实现:

grep -w -e '\(.\)\(.\).\2\1' file

它可以匹配单词”radar”或”civic”。 Guglielmo Bondioni提出了一个正则表达式,可以搜索长达19个回文结构的字符串,其中使用了9个子表达式和9个反向引用。因为BRE或ERE最多只支持9个反向引用。

grep -E -e '^(.?)(.?)(.?)(.?)(.?)(.?)(.?)(.?)(.?).?\9\8\7\6\5\4\3\2\1$' file

13、为何反向引用会失效?

echo 'ba' | grep -E '(a)\1|b\1'

这不会输出任何内容,因为左边的表达式”(a)\1”无法匹配,因为输入数据中没有”aa”,因此右边的”\1”无法引用任何内容,意味着将不匹配任何东西。(此例中右边表达式仅在左边表达式成功匹配时才能生效。)
注:经测试,即使左边表达式能匹配上,右边表达式中引用左边的分组时也无效。例如”echo ‘baaca’ | grep -E ‘(a)\1|c\1’”可以匹配大其中的”aa”,但却匹配不到”ca”。

14、grep如何跨行匹配?
标准的grep无法实现该功能,因为它是基于行读取的。因此,仅仅使用字符类”[:space:]”无法如你想象中那样匹配换行符。
GNU的grep有一个选项”-z”,它可以处理使用”\0”结尾的行。因此,可以匹配输入数据中的换行符,但通常很可能在输出结果时,输出的是所有内容而不仅是被匹配的行,因此经常需要结合输出控制选项如”-q”来使用。例如:

printf 'foo\nbar\nabc' | grep -z 'foo[[:space:]]\+bar'
printf 'foo\nbar\nabc' | grep -z -q 'foo[[:space:]]\+bar'

如果这还不满足需求,可以将输入数据进行格式转换然后交给grep,或者使用其他工具替代grep,如”sed”、”awk”、”perl”或其他很多工具都能跨行操作。
15、“grep”,“fgrep”和“egrep”代表什么?
‘grep’这个名字来自于在Unix上进行行编辑的方式。 例如,’ed’使用以下语法在屏幕上打印匹配行的列表:

global/regular expression/print
g/re/p

‘fgrep’代表固定’grep’; ‘egrep’代表扩展的’grep’。

C语言再学习 -- grep 命令(转)相关推荐

  1. C语言再学习 -- dmesg 命令

    dmesg 这个命令,Linux下用的还是比较多的.现在来详细看一下: Linux dmesg命令用于显示开机信息. kernel会将开机信息存储在ring buffer中.您若是开机时来不及查看信息 ...

  2. C语言再学习 -- Linux下find命令用法

    参看:linux下find(文件查找)命令的用法总结 linux下查找文件的命令有两个:locate 和 find 首先说一下locate: 这个命名是对其生成的数据库进行遍历(生成数据库的命令:uo ...

  3. C语言再学习 -- 段错误(核心已转储)

    参看:Linux下的段错误产生的原因及调试方法 参看:Linux环境下段错误的产生原因及调试方法小结 参看:维基百科--Segmentation fault 参看:LINUX内核段错误调试详细指南精品 ...

  4. C语言再学习 -- 时间函数

    在软件设计中经常会用到关于时间的处理,用来计算语句.函数的执行时间,这时就需要精确到毫秒甚至是微妙的时间.我们首先来介绍一下,时间单位: 时间单位还有:秒(s).毫秒(ms).微秒 (μs).纳秒(n ...

  5. C语言再学习 -- 存储类型关键字

    定义: 是对声明的实现或者实例化.连接器(linker)需要它(定义)来引用内存实体.与上面的声明相应的定义如下:参看:C语言再学习 -- 存储类.链接 C语言中有 5 个作为存储类说明符的关键字,分 ...

  6. C语言再学习 -- C 预处理器

    gcc/cc xxx.c  可以编译链接C源程序生成一个可执行文件 a.out 整个过程中可以划分为以下的4步流程: (1)预处理/预编译: 主要用于包含头文件的扩展,以及执行宏替换等 //加上 -E ...

  7. C语言再学习 -- 输入/输出

    一.缓冲区 输入字符的立即回显是非缓冲或直接输入的一个实例,它表示你说键入的字符被收集并存储在一个被成为缓冲区的临时存储区域中.按下回车可使你所键入的字符块对程序变成可用. 为什么需要缓冲区?首先,将 ...

  8. C语言再学习 -- 关键字return和exit ()函数

    终于到了最后一个关键字 return 了.感觉时间过的飞快,转眼间又是一年,如果时间可以 return 就好了. 一.return 介绍 参看:C语言中return 用法 1.含义: return 表 ...

  9. C语言再学习--关键字

    如需转载请注明出处:https://blog.csdn.net/qq_29350001/article/details/53021879 C语言一共有32个关键字,如下表所示: 关键字 说明 auto ...

最新文章

  1. mysql 存储过程 显示控制_mysql存储过程之控制语句篇
  2. Spring-Spring MVC + Spring JDBC + Spring Transaction + Maven 构建web登录模块
  3. python初学火车座位判断_Python学习第三课 判断(if)语句
  4. VTK:图片之InteractWithImage
  5. k8s angular mysql_Angular 实践:如何优雅地发起和处理请求
  6. P3805 【模板】manacher算法
  7. linux下各种小命令
  8. C++基础教程之数据是如何封装的
  9. 机器学习第三回——正则化部分
  10. linux 用户登陆全部记录,Linux—— 记录所有登陆用户的历史操作记录
  11. 大气压力换算公式_大气压怎么算
  12. 【计算机图形学】着色简介
  13. java多线程设计模式详解[推荐]
  14. 高斯消元法的算法介绍
  15. 斯坦福和NLTK英语短语词组抽取工具原理及源码理解
  16. php调用接口发送短信
  17. 一些mathtype符号
  18. 闹钟小程序(C#源码)
  19. windows11 升级安装错误 - 0x80073701
  20. 紧急通知:无论你英语多差,只要想学,看了此文必有改变

热门文章

  1. 天兔(Lepus)监控邮件推送安装配置
  2. leetcode-Minimum Size Subarray Sum-209
  3. AppStore 上架注意事项及错误修改
  4. HTML Canvas
  5. ChartDirector资料小结
  6. Ruby的module(模块)
  7. this指针用法详解
  8. 科学计算:Python VS. MATLAB(4)----图形系统简介
  9. 安装模块时提示Collecting package metadata (repodata.json): failed
  10. 【Matlab】编译器和工作区等窗口怎么调整位置?