文本处理:sed

1.sed工作流程

sed读一行放到模式空间进行处理

sed是一种在线的、非交互式的编辑器,它一次处理一行内容,处理时,把当前处理的行存储在临时缓冲区中,成为模式空间,接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区的内容送往屏幕。接着处理下一行,这样不断重复,直到文件末尾,文件内容并没有更改,除非使用重定向存储输出。

sed主要用来自动编辑一个或多个文件,简化对文件的反复操作,编写转换程序

sed -ri.bak

sed -ric --follow-symlinks

2.命令格式

sed [options] ‘command’ file(s) //选项后面跟命令

sed [options] -f scriptfile file(s) //选项后面跟sed命令的脚本

注意:

​ sed中空格也算一个字符

​ sed和grep不一样,不管是否找到指定的模式,它的退出转态都是0,只有当命令存在语法错误时,sed的退出状态码才是非0

sed命令在使用命令时,不加数字的话默认对每一行都进行模式匹配

例如 sed -r ‘4p’ //p命令表示打印,4p就是对第四行进行打印,其他行不会执行这个命令,如果是sed -r 'p’则是对每一行都执行此命令

3.支持正则表达式

与grep一样,sed在文件中查找模式时也可以使用正则表达式(RE)和各种元字符。正则表达式是括在斜杠间的面膜是,用于查找和替换,以下是sed支持的元字符。

使用基本元字符集^,$,.,*,[],[^],\<\>,\(\),\{\}
使用扩展元字符集?,+,{},|,()

使用扩展元字符的方式:

\+
sed -r

4.sed基本用法

sed -r 'p' passwd.txt              //打印所有行,会出现之前行的两倍,因为是原理就是先将一行放到屏幕然后在执行p命令,p命令是打印所以又会显示一行
sed -rn 'p' passwd.txt                //使用-n选项,可以忽略执行命令之前的行
sed -rn '/root/p' passwd.txt      //命令中的/root/p是指找到root的行进行打印
sed -r 's/root/jxl/' passwd.txt       //找到root的行替换成jxl,仅限第一个找到的
sed -r 's/root/jxl/g' passwd.txt      //全局替换
sed -r '1s/root/jxl/g' passwd.txt     //在第一行查找并替换
sed -r '1s/Root/jxl/gi' passwd.txt        //i表示忽略大小写
sed -r '/root/d/' passwd.txt  //找到root的行然后删除
sed -r '\#root#d' passwd.txt  //斜线可以换成任意符号一般想换建议使用#号如果文件中需要修改的内容带有"/"斜线,可以使用下面的方法进行修改
sed -r 's/\/etc\/abc/\/var\/lib/' passwd.txt      //将/etc/abc改成/var/lib,主要除了s///其他的斜线要用反斜线转义
sed -r 's#/etc/abc#var/lib#' passwd.txt           //可以将斜线换成#,也可以是@,在这里的其他符号可以不用转义因为后面有了/

5.sed扩展

地址(定址)

地址用于决定对那些行进行编辑,地址形式可以是数组、正则表达式或二者的组合,如果没有设定地址,sed将处理输入文件中的所有行

sed -r 'd' passwd.txt      //删除所有行
sed -r '3d' passwd.txt        //删除第三行
sed -r '1,3d' passwd.txt  //删除一到三行
sed -r '/^root/d' passwd.txt  //删除以root开头的行
sed -r '/bash$/d' passwd.txt    //删除以bash结尾的行
sed -r '/\<root\>/d' passwd.txt     //删除是root这个单词的行
sed -r '/root/,5d' passwd.txt     //从root行开始删除到第5行
sed -r '/root/,+5d' passwd.txt       //删除root行后在删除5行
sed -r 'root/!d' passwd.txt       //!取反,只保留root行sed -r '1~2d' passwd.txt     //删除奇数行
sed -r '0~2d' paswd.txt       //删除偶数行
sed -r '1~3d' passwd.txt      //删掉一行后留两行在删一行留两行

6.sed命令

sed命令告诉sed对指定行进行何种操作,包括打印、删除、修改等

a 在当前行后添加一行或多行

c 用新文本修改替换当前行中的文本

d 删除行

i 在当前行之前插入文本

l 列出非打印字符 多打印一行,并在后面加上$

p 打印行

n 获取下一行的内容,常用于要处理的行没有明显特征,可以借助上一行在使用n对下一行进行处理

q 结束或退出sed

! 对所选航意外的所有行应用命令

S 用一个字符串替换另一个

​ s 替换标志

​ g 全局替换

​ i 忽略大小写

r 从文件中读

w 将行写入文件

y 将字符转换为另一字符

h 把模式空间里的内容复制到暂存缓冲区(覆盖)

H 把模式空间里的内容追加到暂存缓冲区

G 取出暂存缓冲区的内容,将其复制到模式空间,追加在原有内容后面

g 取出暂存空间的内容,将其复制到模式空间中,原来的内容会被覆盖

x 交换暂存缓冲区与模式空间的内容

选项

​ -e 允许多项编辑,使用多个命令

​ -f 指定sed脚本文件名

​ -n 取消默认的输出

​ -i inplace,就地编辑也就是在文件中直接修改

​ -r 支持扩展元字符

7.命令示例

删除命令:d

如果想要多个命令同时使用就在{}中以分号分隔

sed -r '3d' passwd.txt     //删除第三行
sed -r '3{d;}' passwd.txt     //花括号中的d;其实表示可以使用多个命令选项,例如sed -r '3{p;d;}' passwd.txt
sed -r '3p;3d' passwd.txt     //多个命令使用,等同于3{p;d}
sed -r '3{d}' passwd.txt      //效果与3d一样
sed -r '3,$d' passwd.txt      //从第三行开始一直删除到最后一行
sed -r '$d' passwd.txt            //删除最后一行
sed -r '/norrth/d' datafile       //删除匹配north的行

替换命令:s

sed -r 's/west/north/g' datafile           //将west替换成north
sed -r 's/^west/north/' datafile          //将west开头的行换成north
sed -r 's/[0-9][0-9]$/&.5/' datafile      //&表示在查找串中匹配的内容,也就是将查找出来的内容再次调用,以二个数字为结尾的换成原行在跟一个.5
sed -r 's/(.*)/#\1\'      //在每一行前面加上#号
sed -r '1,5s/.*/#&/'      //将一到五行开头加上#号
sed -r '1,5s/^/#'     //也是1-5行前面加#号
sed -r 's/Hemenway/Jones/g' datafile      //将Hemenway换成jones
sed -r 's/(Mar)got/\1ianne/g' datafile        //将Mar做成组字符,在ianne前面调用也就是将margot换成morianne
sed -r 's#3#88#g'     //将3换成88
sed -r 's/[0-9]+$/&.5/' passwd.txt   //将结尾是数字的一个或多个的行在后面加上.5
sed -r 's/(.)(.)(.*)/\1\2jiang\3/' passwd.txt     //第一个.表示第一个字符第二个.表示第二个字符第三个.*表示整行,也就是在第二个字符后面加其他内容可以在调用完1,2后跟上所需内容在调用3
sed -r 's/(.*)(.)(.)/\1jiang\2\3/' passwd.txt //在最后二个字符前加其他内容======================================================================================
sed -r 's/root/jiangxiaolong/g' passwd.txt                 //将root换成jiangxiaolong
sed -r 's/^root/jiangxiaolong/g' passwd.txt               //将root开头的行换成jiangxiaolong
sed -r 's/[0-9][0-9]$/&.5/' passwd.txt                    //两个数字结尾的行换成原行内容在跟一个.5   &代表匹配的内容再次调用出来
sed -r 's/(.*)/#\1/'  passwd.txt           //将所有行前面加#
sed -r 's/.*/#&/' passwd.txt         //将所有行前面加#,使用&方式调用获得结果
sed -r 's/^/#/' passwd.txt                 //将所有行前面加#
sed -r 's/^(ro)ot/\1jiang/' passwd.txt    //将ro做成组字符,然后后面调用,也就是将root改成rojiangxiaolong
sed -r 's/(.)(.)(.*)/\1\2jiang\3/' passwd.txt    //在每一行的第二个字符前面加上任意内容,空格也代表一个字符
sed -r 's/(.*)(.)(.)/\1jiang\2\3/' passwd.txt     //在每一行结尾的最后两个字符前加其他内容

读文件命令:r

sed -r '/lp/r /etc/hosts' passwd.txt       //在lp行后面插入/etc/hosts/文件的内容
sed -r '2r /etc/hosts' passwd.txt     //在第二行后面读入/etc/hosts/中的内容
sed -r '/2/r /etc/hosts' passwd.txt           //这个跟2r有区别,这里是2在//中表示正则匹配,只有出现2的地方就会读入/etc/hosts中的内容

写文件命令:w

另存为的文件必须要有写入权限

每次另存到同一个文件,之前文件的内容会被覆盖掉

sed -r '/root/w /tmp/a.txt' passwd.txt //查找包含root的行,并保存到/tmp/a.txt文件中
sed -r '3,$w /tmp/a.txt' passwd.txt       //从第三行一直到最后一行保存到/tmp/a.txt文件中

追加命令:a

sed -r '2a chkconfig 35 21 85' passwd.txt      //在第二行后面追加内容
sed -r '/root/a jiangxiaolong' passwd.txt     //在包含root的行后面加内容
sed -r '2a jiang\
>xiao\
>long' passwd.txt           //第二行后面追加多行

插入命令:i

sed -r '2i jiang' passwd.txt           //在第二行插入内容
sed -r '/root/i jiang' passwd.txt     //在包含root的行插入内容,会在root行前面插入
sed -r '2i jiang\
>xiao\
>long' passwd.txt               //在二行插入这些内容,这些内容会从第二行开始插入

修改命令:c

sed -r '/root/c jiang' passwd.txt          //将root行换成jiang
sed -r '1c jiang' passwd.txt          //将第一行的内容换成jiang
sed -r '1c 1111\
> 222\
> 333' passwd.txt                   //将第一行的内容换成1111并添加222 333

获取下一行:n

获取下一行的内容,常用于要处理的行没有明显特征,可以借助上一行在使用n对下一行进行处理,类似于隔山打牛,实际上匹配的这一行但是不对这一行做操作而是对下一行

sed -r '/lp/{n;d}'         //查找lp的行并对下一行执行d命令
sed -r 'lp{n;s/sbin/bin/}'        //查找lp的行并对下一行执行s命令
sed -r '/lp/{n;n;s/sbin/bin/}' passwd.txt //查找lp的行在它的下两行执行s命令,n可以使用多个,一个表示下一行,二个表示下二行

暂存和取用命令:h H g G

sed命令除了模式空间还有暂存空间,所谓暂存空间就是把一行处理后放到一个暂存空间,在需要的时候进行调用,在暂存空间里小写的命令比如说h、g都是具有覆盖的功能,而大写的命令例如H、G都表示追加,暂存空间默认只有换行符

一般第一次放入暂存空间会使用覆盖的方式,因为默认会有一个空行

sed -r '1h;$G' passwd.txt          //把第一行覆盖到暂存空间,在最后一行的时候将模式空间的内容追加到最后一行下面
sed -r '1{h;d};$G' passwd.txt     //把第一行覆盖到暂存空间并删除,在最后一行在调用追加,相当于把第一行剪切到最后一行
sed -r '1h;2,$g' passwd.txt           //把第一行覆盖到暂存空间,从第二行到最后一行,每读一行就从暂存空间调回来,这里用的g表示覆盖,因此每调用一次都会把原来的内容覆盖掉,这样整个文本都会和第一行一样
sed -r '1h;2,3H;$G' passwd.txt        //把第一行覆盖到暂存空间,第二行第三行追加到暂存空间,在最后一行的时候在调用暂存空间的内容,这里的动作是追加

暂存空间与模式空间互换:x

互换是指,将暂存空间的内容换到模式空间,再将模式空间的内容放到了暂存空间

sed -r '3h;5x;$G' passwd.txt       //将第3行覆盖到暂存空间,读到第5行时将暂存空间与模式空间的内容互换,也就是处理完后第五行的内容为当时之前暂存空间的内容,而暂存空间的内容就是之前第五行的内容,在最后一行调用,调用出来的结果就是第五行的内容

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9C14277i-1589637362122)(C:\Users\Administrator\AppData\Roaming\Typora\typora-user-images\image-20200301220140473.png)]

取反命令:!

!一般放在命令前面

sed -r '1!a jiang' passwd.txt      //除了第一行都追加

-e多重编辑

-e选项完全用不着可以说,可以使用;将每个命令隔开即可

如果要对同一行进行操作还可以用{}方式

sed -r -e '1,3d' -e 's/bin/aaa/g' passwd.txt
sed -r '1,3d;s/sbin/bin/g' passwd.txt
sed -r '2s/bin/jiang/g;2s/x/aaa/g' passwd.txt
sed -r '2{s/bin/jiang/g;s/x/aaa/g}' passwd.txt

8.sed常见操作

删除配置文件中#号注释行

sed -r '/^#/d' /etc/vsftpd/vsftpd.conf         //只删除文件中以#开头的行
sed -r '/^[ \t]*#/d' /etc/vsftpd/vsftpd.conf      //删除以空格或者制表符出现0次或多次在跟一个#的行
sed -r '/^[ \t]*#d;/^[ \t]*$/d' /etc/vsftpd/vsftpd.conf       //删除以空格或者制表符出现0次或多次在跟一个#的行并且删除只以空格或者制表符出现0次到多次结尾的行,也就是既删除注释行也删除空行sed -r '/^[ \t]*#/!d' /etc/vsftpd/vsftpd.conf //取反只留下了注释行

删除配置文件中的//号注释行

sed -r '\#^[ \t]*//#d' szlxwj.txt

删除无内容的空行

sed -r '/^$/d'  /etc/vsftpd/vsftpd.conf
sed -r '/^[ \t]*$/d'  /etc/vsftpd/vsftpd.conf

删除注释行及空行

sed -r '/^[ \t]*#/d;/^[ \t]*$/d' /etc/vsftpd/vsftpd.conf       sed -r '/^[ \t]*#|^[ \t]*$/d'  /etc/vsftpd/vsftpd.conf        //将两部分合为一部分,用|元字符代表或者的意思sed -r '/^[ \t]*(#|$)/d'  /etc/vsftpd/vsftpd.conf      //利用元字符,因为前部分都一样只需要把不一样的地方用或者表示即可

修改文件

sed -ri '$a chroot_local_user=YES' /etc/vsftpd/vsftpd.conf        //在最后一行追加内容
sed -ri '/^SELINUX=/cSELINUX=disabled' /etc/sysconfig/selinux       //将开头为SELINUX的行整个换成SELINUX=disbaled
sed -ri '/UseDNS/cUseDNS no' /etc/ssh/sshd_config

给文件行增加注释

sed -r '1,5s/(.*)/#\1/' passwd.txt
sed -r '1,5s/.*/#&/' passwd.txt
sed -r '1,5s/^/#$/' passwd.txt
sed -r '1,5s/^#*/#/' passwd.txt           //查找1到5行如果是以0到一个#号卡头的行换成一个#号
sed -ri '1,2s/(.*)/\t#\1/;3s/(.*)/#\1/' passwd.txt        //1,2行增加一个制表符在加一个#号,3行只加一个#号
sed -r '1,3s/^[ \t]*#*/#/' passwd.txt     //将1到3行中以空格或者制表符0个或多个开头的在跟一个#0个或多个替换成#
sed -r '1,3s/^[ \t#]*/#/' passwd.txt      //将以空格制表符#出现0到多次替换成#
删掉一个注释行
sed -ri '1,3s/(.)(.*)/\2/' passwd.txt

sed中引入变量

var=1111jiang           //先定义变量sed -r '3a$var' passwd.txt     //这种方式是错误的,因为单引号是强引用,直接就会追加$var而不是对应的值
sed -r "3a$var" passwd.txt        //使用双引号即可
sed -r 3a$var passwd.txt        //不适用任何引号也可以sed -r "$a$var" passwd.txt        //这里双引号会把$a误以为是变量,也是错误的
sed -r '$a'"$var" passwd.txt        //可以各自使用各自的引号
sed -r "\$a$var" passwd.txt           //也可以使用\进行转义

文件内容倒转

sed -r '1!G;$!h;$!d' 12345.txt

l
var=1111jiang //先定义变量

sed -r '3avar′passwd.txt//这种方式是错误的,因为单引号是强引用,直接就会追加var' passwd.txt //这种方式是错误的,因为单引号是强引用,直接就会追加var′passwd.txt//这种方式是错误的,因为单引号是强引用,直接就会追加var而不是对应的值
sed -r "3avar"passwd.txt//使用双引号即可sed−r3avar" passwd.txt //使用双引号即可 sed -r 3avar"passwd.txt//使用双引号即可sed−r3avar passwd.txt //不适用任何引号也可以

sed -r “aaavar” passwd.txt //这里双引号会把a误以为是变量,也是错误的sed−r′a误以为是变量,也是错误的 sed -r 'a误以为是变量,也是错误的sed−r′a’"$var" passwd.txt //可以各自使用各自的引号
sed -r “$a$var” passwd.txt //也可以使用\进行转义


文件内容倒转```shell
sed -r '1!G;$!h;$!d' 12345.txt

也可以使用tac命令实现倒转

Linux文本处理三剑客sed详解(正则匹配、命令示例)相关推荐

  1. Linux文本编译工具VIM详解

    Linux文本编译工具VIM详解 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.VIM概述 1>.vim简介 1>.vi: 全称Visual editor,即文本编 ...

  2. Linux账号和权限管理详解(超详细示例操作)!

    Linux账号和权限管理详解 一.用户账号和组账号概述 1.1 Linux基于用户身份对资源访问进行控制 1.2 用户账号 1.3 组账号 二.用户账号文件 2.1 用户账号文件 /etc/passw ...

  3. linux教程 sed命令的用法,Linux文本处理三剑客——sed命令使用教程

    SED是一种流编辑器工具,可以根据设置的匹配条件对文件内容进行处理,支持正则表达式.sed每次处理一行数据,和awk处理流程是一样的. sed命令格式: sed [options] '/pattern ...

  4. linux 查看系统组账号密码是什么,Linux 用户与组管理详解(system-config-users 命令行)...

    用户与组管理 用户相关文件 组账号相关文件 用户和组管理软件: 基于命令行的用户和组管理 创建用户 查看用户信息 删除用户 修改用户信息 为用户创建密码 更改用户密码信息 创建组 删除组 查看当前登录 ...

  5. linux终端命令行用户名和密码,Linux入门篇 —— Linux 用户与组管理详解(system-config-users 命令行)| 七日打卡...

    用户与组管理什么是用户,用户是人吗? 用户是干啥的?用户账号超级管理员: root 普通用户: ruochen 系统/程序用户: 系统中为某个程序而产生的用户,这类用户一般不允许登录操作系统 组账号定 ...

  6. linux pscp 上传_详解使用pscp命令Linux文件上传与下载

    (一)上传 2.开始运行cmd进入到dos模式输入以下命令以下是代码片段:pscp D:\java\apache-tomcat-5.5.27\webapps\szfdc.rardev@192.168. ...

  7. 三剑客之 sed详解

      sed 作者:Jack.X 归档:学习笔记 2017/4/13 三剑客之sed 第1章 sed详解: 1.1 sed介绍: sed是linux命令中三剑客的老二,sed命令是操作.过滤和转换文本内 ...

  8. 458-Linux 三剑客实例详解(grep、sed 、awk)

    1.简介 Linux 操作文本的三大利器分别是 grep.sed .awk,简称三剑客. 大师兄 awk:最擅长取列: 二师兄 sed:最擅长取行: 三师兄 grep:最擅长过滤. 2.正则表达式 3 ...

  9. Linux文本处理三剑客之sed

    推荐新手阅读[酷壳]或[骏马金龙]开篇的教程作为入门.骏马兄后面的文章以及官方英文文档较难. [酷壳]:https://coolshell.cn/articles/9104.html [骏马金龙-博客 ...

最新文章

  1. linux uname 命令简介
  2. 网络环境下计算机取证的见解,2018年华医网初级继续教育答案解析
  3. 计算机文化基础教程教案,新版《计算机文化基础》教案.doc
  4. 记录爬取信用中国,里面的行政许可内容,行政处罚,守信激励的内容,并以excel形式显示
  5. HttpClient:绕开https证书(三)
  6. 听技术播客:一边学Python编程一边学英语
  7. 线程间协作的两种方式:wait、notify、notifyAll和Condition
  8. 统计学中【矩】的概念
  9. 域控 只能访问特定网址_开发人员需要了解的特定于域的语言
  10. ECMall插件——余额支付
  11. 工厂智能化远程运营管理系统方案
  12. 7 Papers Radios | 陈丹琦关系抽取新SOTA;上海交大医疗版MNIST数据集
  13. 无法重命名,文件不可信,后台被自动关闭,“Notebook Untitled.ipynb is not trusted jupyter”
  14. UDP用户数据报协议分析
  15. linux中查看磁盘配额的数量,[Linux实用命令]-11-磁盘配额实例详解
  16. 力扣(415.482)补8.28
  17. AI+智能服务机器人应用基础【实践报告】
  18. 针对DDoS攻击异常流量攻击统计
  19. Mac上优质的打字学习软件
  20. 清理服务器多余的图片(文件、数据)

热门文章

  1. 电脑连接WIFI后,只能登录微信QQ,网页其他打不开问题
  2. Veritas针对通用数据保护再出手
  3. python数组中最大元素_Python获取numpy数组中最大的5个元素(保持原顺序)
  4. Python爬虫获取代理ip及端口
  5. win10 Edge关闭smartscreen筛选器
  6. pjsip库简单应用
  7. Mac 安装minikube Error: No available formula with the name “minikube“
  8. 北大青鸟---不怎么样
  9. 通过PS把月亮装进灯泡里打造创意灯泡月亮
  10. 公司上市有几种方式?