第一章 Shell专题之文本处理工具（grep、cut、sort、uniq、tee、diff、paste、tr）

1. grep工具

grep是**行**过滤工具；用于根据关键字进行行过滤

语法和选项

语法：

# grep [选项] '关键字' 文件名

常见选项：

OPTIONS:-i: 不区分大小写-v: 查找不包含指定内容的行,反向选择-w: 按单词搜索-o: 打印匹配关键字-c: 统计匹配到的行数-n: 显示行号-r: 逐层遍历目录查找-A: 显示匹配行及后面多少行    -B: 显示匹配行及前面多少行-C: 显示匹配行前后多少行-l：只列出匹配的文件名-L：列出不匹配的文件名-e: 使用正则匹配-E:使用扩展正则匹配^key:以关键字开头key$:以关键字结尾^$:匹配空行--color=auto ：可以将找到的关键词部分加上颜色的显示

颜色显示（别名设置）：

临时设置：
# alias grep='grep --color=auto'            //只针对当前终端和当前用户生效永久设置：
1）全局（针对所有用户生效）
vim /etc/bashrc
alias grep='grep --color=auto'
source /etc/bashrc2）局部（针对具体的某个用户）
vim ~/.bashrc
alias grep='grep --color=auto'
source ~/.bashrc

举例说明：

说明：不要直接使用/etc/passwd文件，将其拷贝到/tmp下做实验！

# grep -i root passwd                        忽略大小写匹配包含root的行
# grep -w ftp passwd                        精确匹配ftp单词
# grep -w hello passwd                      精确匹配hello单词;自己添加包含hello的行到文件
# grep -wo ftp passwd                       打印匹配到的关键字ftp
# grep -n root passwd                       打印匹配到root关键字的行好
# grep -ni root passwd                      忽略大小写匹配统计包含关键字root的行
# grep -nic root passwd                     忽略大小写匹配统计包含关键字root的行数
# grep -i ^root passwd                      忽略大小写匹配以root开头的行
# grep bash$ passwd                             匹配以bash结尾的行
# grep -n ^$ passwd                             匹配空行并打印行号
# grep ^# /etc/vsftpd/vsftpd.conf       匹配以#号开头的行
# grep -v ^# /etc/vsftpd/vsftpd.conf    匹配不以#号开头的行
# grep -A 5 mail passwd                     匹配包含mail关键字及其后5行
# grep -B 5 mail passwd                     匹配包含mail关键字及其前5行
# grep -C 5 mail passwd                     匹配包含mail关键字及其前后5行

2. cut工具

cut是**列**截取工具，用于列的截取

语法和选项

语法：

# cut 选项  文件名

常见选项：

-c:  以字符为单位进行分割,截取
-d: 自定义分隔符，默认为制表符\t
-f: 与-d一起使用，指定截取哪个区域

举例说明:

# cut -d: -f1 1.txt          以:冒号分割，截取第1列内容
# cut -d: -f1,6,7 1.txt     以:冒号分割，截取第1,6,7列内容
# cut -c4 1.txt                 截取文件中每行第4个字符
# cut -c1-4 1.txt           截取文件中每行的1-4个字符
# cut -c4-10 1.txt          截取文件中每行的4-10个字符
# cut -c5- 1.txt                从第5个字符开始截取后面所有字符

练习：
用小工具列出你当系统的运行级别。5/3

如何查看系统运行级别
- 命令runlevel
- 文件/etc/inittab
如何过滤运行级别

runlevel |cut -c3
runlevel | cut -d ' ' -f2
grep -v '^#' /etc/inittab | cut -d: -f2
grep '^id' /etc/inittab |cut -d: -f2
grep "initdefault:$" /etc/inittab | cut -c4
grep -v ^# /etc/inittab |cut -c4
grep 'id:' /etc/inittab |cut -d: -f2
cut -d':' -f2 /etc/inittab |grep -v ^#
cut -c4 /etc/inittab |tail -1
cut -d: -f2 /etc/inittab |tail -1

3. sort工具

sort工具用于排序;它将文件的每一行作为一个单位，从首字符向后，依次按ASCII码值进行比较，最后将他们按升序输出。

语法和选项

-u ：去除重复行
-r ：降序排列，默认是升序
-o : 将排序结果输出到文件中,类似重定向符号>
-n ：以数字排序，默认是按字符排序
-t ：分隔符
-k ：第N列
-b ：忽略前导空格。
-R ：随机排序，每次运行的结果均不同

举例说明

# sort -n -t: -k3 1.txt          按照用户的uid进行升序排列
# sort -nr -t: -k3 1.txt            按照用户的uid进行降序排列
# sort -n 2.txt                         按照数字排序
# sort -nu 2.txt                        按照数字排序并且去重
# sort -nr 2.txt
# sort -nru 2.txt
# sort -nru 2.txt
# sort -n 2.txt -o 3.txt            按照数字排序并将结果重定向到文件
# sort -R 2.txt
# sort -u 2.txt

4.uniq工具

uniq用于去除**连续的重复**行

常见选项：
-i: 忽略大小写
-c: 统计重复行次数
-d:只显示重复行举例说明：
# uniq 2.txt
# uniq -d 2.txt
# uniq -dc 2.txt

5.tee工具

tee工具是从标准输入读取并写入到标准输出和文件，即：双向覆盖重定向（屏幕输出|文本输入）

选项：
-a 双向追加重定向# echo hello world
# echo hello world|tee file1
# cat file1
# echo 999|tee -a file1
# cat file1

6.diff工具

diff工具用于逐行比较文件的不同

注意：diff描述两个文件不同的方式是告诉我们怎样改变第一个文件之后与第二个文件匹配。

语法和选项

语法：

diff [选项] 文件1 文件2

常用选项：

选项	含义	备注
-b	不检查空格
-B	不检查空白行
-i	不检查大小写
-w	忽略所有的空格
–normal	正常格式显示(默认)
-c	上下文格式显示
-u	合并格式显示

举例说明：

比较两个普通文件异同，文件准备：

[root@MissHou ~]# cat file1
aaaa
111
hello world
222
333
bbb
[root@MissHou ~]#
[root@MissHou ~]# cat file2
aaa
hello
111
222
bbb
333
world

1）正常显示

diff目的：file1如何改变才能和file2匹配
[root@MissHou ~]# diff file1 file2
1c1,2                   第一个文件的第1行需要改变(c=change)才能和第二个文件的第1到2行匹配
< aaaa               小于号"<"表示左边文件(file1)文件内容
---                 ---表示分隔符
> aaa                    大于号">"表示右边文件(file2)文件内容
> hello
3d3                 第一个文件的第3行删除(d=delete)后才能和第二个文件的第3行匹配
< hello world
5d4                 第一个文件的第5行删除后才能和第二个文件的第4行匹配
< 333
6a6,7                   第一个文件的第6行增加(a=add)内容后才能和第二个文件的第6到7行匹配
> 333                    需要增加的内容在第二个文件里是333和world
> world

2）上下文格式显示

[root@MissHou ~]# diff -c file1 file2
前两行主要列出需要比较的文件名和文件的时间戳；文件名前面的符号***表示file1，---表示file2
*** file1       2019-04-16 16:26:05.748650262 +0800
--- file2       2019-04-16 16:26:30.470646030 +0800
*************** 我是分隔符
*** 1,6 ****        以***开头表示file1文件，1,6表示1到6行
! aaaa              !表示该行需要修改才与第二个文件匹配111
- hello world       -表示需要删除该行才与第二个文件匹配222
- 333                   -表示需要删除该行才与第二个文件匹配bbb
--- 1,7 ----        以---开头表示file2文件，1,7表示1到7行
! aaa                   表示第一个文件需要修改才与第二个文件匹配
! hello             表示第一个文件需要修改才与第二个文件匹配111222bbb
+ 333                  表示第一个文件需要加上该行才与第二个文件匹配
+ world                表示第一个文件需要加上该行才与第二个文件匹配

3）合并格式显示

[root@MissHou ~]# diff -u file1 file2
前两行主要列出需要比较的文件名和文件的时间戳；文件名前面的符号---表示file1，+++表示file2
--- file1       2019-04-16 16:26:05.748650262 +0800
+++ file2       2019-04-16 16:26:30.470646030 +0800
@@ -1,6 +1,7 @@
-aaaa
+aaa
+hello111
-hello world222
-333bbb
+333
+world

默认情况下也会比较两个目录里相同文件的内容
[root@MissHou  tmp]# diff dir1 dir2
diff dir1/file1 dir2/file1
0a1
> hello
Only in dir1: file3
Only in dir2: test1
如果只需要比较两个目录里文件的不同，不需要进一步比较文件内容，需要加-q选项
[root@MissHou  tmp]# diff -q dir1 dir2
Files dir1/file1 and dir2/file1 differ
Only in dir1: file3
Only in dir2: test1

其他小技巧：

有时候我们需要以一个文件为标准，去修改其他文件，并且修改的地方较多时，我们可以通过打补丁的方式完成。

1）先找出文件不同，然后输出到一个文件
[root@MissHou ~]# diff -uN file1 file2 > file.patch
-u:上下文模式
-N:将不存在的文件当作空文件
2）将不同内容打补丁到文件
[root@MissHou ~]# patch file1 file.patch
patching file file1
3）测试验证
[root@MissHou ~]# diff file1 file2
[root@MissHou ~]#

7. paste工具

paste工具用于合并文件行

常用选项：
-d：自定义间隔符，默认是tab
-s：串行处理，非并行

8. tr工具

tr用于字符转换，替换和删除；主要用于删除文件中控制字符或进行字符转换

语法和选项

语法：

用法1：命令的执行结果交给tr处理，其中string1用于查询，string2用于转换处理commands|tr  'string1'  'string2'用法2：tr处理的内容来自文件，记住要使用"<"标准输入tr  'string1'  'string2' < filename用法3：匹配string1进行相应操作，如删除操作tr [options] 'string1' < filename

常用选项：

-d 删除字符串1中所有输入字符。
-s 删除所有重复出现字符序列，只保留第一个；即将重复出现字符串压缩为一个字符串

常匹配字符串：

字符串	含义	备注
a-z或[:lower:]	匹配所有小写字母	所有大小写和数字[a-zA-Z0-9]
A-Z或[:upper:]	匹配所有大写字母
0-9或[:digit:]	匹配所有数字
[:alnum:]	匹配所有字母和数字
[:alpha:]	匹配所有字母
[:blank:]	所有水平空白
[:punct:]	匹配所有标点符号
[:space:]	所有水平或垂直的空格
[:cntrl:]	所有控制字符	\f Ctrl-L 走行换页 \n Ctrl-J 换行
\r Ctrl-M 回车
\t Ctrl-I tab键

举例说明：

[root@MissHou  shell01]# cat 3.txt  自己创建该文件用于测试
ROOT:x:0:0:root:/root:/bin/bash
bin:x:1:1:bin:/bin:/sbin/nologin
daemon:x:2:2:daemon:/sbin:/sbin/nologin
adm:x:3:4:adm:/var/adm:/sbin/nologin
lp:x:4:7:lp:/var/spool/lpd:/sbin/nologin
sync:x:5:0:sync:/sbin:/bin/sync
shutdown:x:6:0:shutdown:/sbin:/sbin/shutdown
halt:x:7:0:halt:/sbin:/sbin/halt
mail:x:8:12:mail:/var/spool/mail:/sbin/nologin
uucp:x:10:14:uucp:/var/spool/uucp:/sbin/nologin
boss02:x:516:511::/home/boss02:/bin/bash
vip:x:517:517::/home/vip:/bin/bash
stu1:x:518:518::/home/stu1:/bin/bash
mailnull:x:47:47::/var/spool/mqueue:/sbin/nologin
smmsp:x:51:51::/var/spool/mqueue:/sbin/nologin
aaaaaaaaaaaaaaaaaaaa
bbbbbb111111122222222222233333333cccccccc
hello world 888
666
777
999# tr -d '[:/]' < 3.txt              删除文件中的:和/
# cat 3.txt |tr -d '[:/]'         删除文件中的:和/
# tr '[0-9]' '@' < 3.txt            将文件中的数字替换为@符号
# tr '[a-z]' '[A-Z]' < 3.txt         将文件中的小写字母替换成大写字母
# tr -s '[a-z]' < 3.txt            匹配小写字母并将重复的压缩为一个
# tr -s '[a-z0-9]' < 3.txt         匹配小写字母和数字并将重复的压缩为一个
# tr -d '[:digit:]' < 3.txt        删除文件中的数字
# tr -d '[:blank:]' < 3.txt        删除水平空白
# tr -d '[:space:]' < 3.txt        删除所有水平和垂直空白

小试牛刀

使用小工具分别截取当前主机IP；截取NETMASK；截取广播地址；截取MAC地址

# ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4
10.1.1.1:10.1.1.255:255.255.255.0
# ifconfig eth0|grep 'Bcast'|tr -d '[a-zA-Z ]'|cut -d: -f2,3,4|tr ':' '\n'
10.1.1.1
10.1.1.255
255.255.255.0
# ifconfig eth0|grep 'HWaddr'|cut -d: -f2-|cut -d' ' -f4
00:0C:29:25:AE:54
# ifconfig eth0|grep 'HW'|tr -s ' '|cut -d' ' -f5
00:0C:29:B4:9E:4E# ifconfig eth1|grep Bcast|cut -d: -f2|cut -d' ' -f1
# ifconfig eth1|grep Bcast|cut -d: -f2|tr -d '[ a-zA-Z]'
# ifconfig eth1|grep Bcast|tr -d '[:a-zA-Z]'|tr ' ' '@'|tr -s '@'|tr '@' '\n'|grep -v ^$
# ifconfig eth0|grep 'Bcast'|tr -d [:alpha:]|tr '[ :]' '\n'|grep -v ^$
# ifconfig eth1|grep HWaddr|cut -d ' ' -f11
# ifconfig eth0|grep HWaddr|tr -s ' '|cut -d' ' -f5
# ifconfig eth1|grep HWaddr|tr -s ' '|cut -d' ' -f5
# ifconfig eth0|grep 'Bcast'|tr -d 'a-zA-Z:'|tr ' ' '\n'|grep -v '^$'

将系统中所有普通用户的用户名、密码和默认shell保存到一个文件中，要求用户名密码和默认shell之间用tab键分割

# grep 'bash$' passwd |grep -v 'root'|cut -d: -f1,2,7|tr ':' '\t' |tee abc.txt

第一章 Shell专题之文本处理工具（grep、cut、sort、uniq、tee、diff、paste、tr）相关推荐

shell脚本——grep cut sort uniq tee diff paster tr等小工具的使用方法
shell脚本的一些小工具的使用方法 grep 语法和选项实例 cut 语法和选项实例 sort 语法和选项实例 uniq 语法和选项实例 tee 语法和选项实例 diff 语法和选项实例 ...
文本处理工具命令xargs, sort, uniq, tr, cut, paste, wc等
1. 计数命令wc wc -l [file]: 输出文件[file]的行数 wc -c [file]: 输出文件[file]的byte(字节)数 wc -m [file]: 输出文件[file]的字符 ...
shell编程之文本处理工具awk
shell编程之文本处理工具awk 文章目录 shell编程之文本处理工具awk 一.awk介绍 1. awk概述 2. awk能干啥? 二.awk使用方式 1. ==命令行模式使用== ㈠语法结构 ...
shell编程之文本处理工具sed
shell编程之文本处理工具sed 文章目录 shell编程之文本处理工具sed 一.文件编辑器知多少二.强悍的sed介绍 1. sed用来做啥? 2. sed如何处理文件? 三.sed使用方法介绍 ...
文本处理工具--grep
一.文本处理工具-grep Linux有被称为文本处理三剑客的工具 grep.sed.awk,本文来讲grep 1.简单的介绍 grep 文本过滤工具,全称为 Global search REgrla ...
shell 删除文本中的重复行(sort+uniq/awk/sed) (方法=效率啊)
From: http://churuimin425.blog.163.com/blog/static/341298772012230112956712/ 删除文本中的重复行(sort+uniq/awk ...
shell脚本的文本处理工具
一.cut cut 的工作就是"剪",具体的说就是在文件中负责剪切数据用的.cut 命令从文件的每一行剪切字节.字符和字段并将这些字节.字符和字段输出. 1)基本用法 cut [ ...
shell mysql awk_今日推荐：shell 三剑客之文本处理工具awk
背景 awk 是一个文本处理工具,通常用于处理数据并生成结果报告. awk 的命名是它的创始人 Alfred Aho.Peter Weinberger 和 Brian Kernighan 姓氏的首个字 ...
shell脚本三大文本处理工具
[-]目录一简介二grep命令格式选项 grep与正则表达式结合 egrep和fgrep 三sed命令 sed命令基本用法 sed文本定位 sed基本编辑命令 sed高级编辑命令四awk命令 ...

第一章 Shell专题之文本处理工具（grep、cut、sort、uniq、tee、diff、paste、tr）

1. grep工具

语法和选项

2. cut工具

语法和选项

3. sort工具

语法和选项

4.uniq工具

5.tee工具

6.diff工具

语法和选项

7. paste工具

8. tr工具

语法和选项

小试牛刀

第一章 Shell专题之文本处理工具（grep、cut、sort、uniq、tee、diff、paste、tr）相关推荐

最新文章

热门文章