Perl 正则表达式

正则表达式(regular expression)描述了一种字符串匹配的模式,可以用来检查一个串是否含有某种子串、将匹配的子串做替换或者从某个串中取出符合某个条件的子串等。

Perl语言的正则表达式功能非常强大,基本上是常用语言中最强大的,很多语言设计正则式支持的时候都参考Perl的正则表达式。

Perl的正则表达式的三种形式,分别是匹配,替换和转化:

  • 匹配:m//(还可以简写为//,略去m)

  • 替换:s///

  • 转化:tr///

这三种形式一般都和 =~ 或 !~ 搭配使用, =~ 表示相匹配,!~ 表示不匹配。


匹配操作符

匹配操作符 m// 用于匹配一个字符串语句或者一个正则表达式,例如,要匹配 标量 $bar 中的 "run",代码如下所示:

实例

#!/usr/bin/perl $bar = "I am runoob site. welcome to runoob site."; if ($bar =~ /run/){ print "第一次匹配\n"; }else{ print "第一次不匹配\n"; } $bar = "run"; if ($bar =~ /run/){ print "第二次匹配\n"; }else{ print "第二次不匹配\n"; }

执行以上程序,输出结果为:

第一次匹配
第二次匹配

模式匹配修饰符

模式匹配有一些常用的修饰符,如下表所示:

修饰符 描述
i 忽略模式中的大小写
m 多行模式
o 仅赋值一次
s 单行模式,"."匹配"\n"(默认不匹配)
x 忽略模式中的空白
g 全局匹配
cg 全局匹配失败后,允许再次查找匹配串

正则表达式变量

perl处理完后会给匹配到的值存在三个特殊变量名:

  • $`: 匹配部分的前一部分字符串
  • $&: 匹配的字符串
  • $': 还没有匹配的剩余字符串

如果将这三个变量放在一起,你将得到原始字符串。

实例如下:

实例

#!/usr/bin/perl $string = "welcome to runoob site."; $string =~ m/run/; print "匹配前的字符串: $`\n"; print "匹配的字符串: $&\n"; print "匹配后的字符串: $'\n";

执行以上程序输出结果为:

匹配前的字符串: welcome to
匹配的字符串: run
匹配后的字符串: oob site.

替换操作符

替换操作符 s/// 是匹配操作符的扩展,使用新的字符串替换指定的字符串。基本格式如下:

s/PATTERN/REPLACEMENT/;

PATTERN 为匹配模式,REPLACEMENT 为替换的字符串。

例如我们将以下字符串的 "google" 替换为 "runoob":

实例

#!/usr/bin/perl $string = "welcome to google site."; $string =~ s/google/runoob/; print "$string\n";

执行以上程序输出结果为:

welcome to runoob site.

替换操作修饰符

替换操作修饰符如下表所示:

修饰符 描述
i 如果在修饰符中加上"i",则正则将会取消大小写敏感性,即"a"和"A" 是一样的。
m 默认的正则开始"^"和结束"$"只是对于正则字符串如果在修饰符中加上"m",那么开始和结束将会指字符串的每一行:每一行的开头就是"^",结尾就是"$"。
o 表达式只执行一次。
s 如果在修饰符中加入"s",那么默认的"."代表除了换行符以外的任何字符将会变成任意字符,也就是包括换行符!
x 如果加上该修饰符,表达式中的空白字符将会被忽略,除非它已经被转义。
g 替换所有匹配的字符串。
e 替换字符串作为表达式

转化操作符

以下是转化操作符相关的修饰符:

修饰符 描述
c 转化所有未指定字符
d 删除所有指定字符
s 把多个相同的输出字符缩成一个

以下实例将变量 $string 中的所有小写字母转化为大写字母:

#!/usr/bin/perl $string = 'welcome to runoob site.';
$string =~ tr/a-z/A-z/;print "$string\n";

执行以上程序输出结果为:

WELCOME TO RUNOOB SITE.

以下实例使用 /s 将变量 $string 重复的字符删除:

实例

#!/usr/bin/perl $string = 'runoob'; $string =~ tr/a-z/a-z/s; print "$string\n";

执行以上程序输出结果为:

runob

更多实例:

$string =~ tr/\d/ /c;     # 把所有非数字字符替换为空格
$string =~ tr/\t //d;     # 删除tab和空格
$string =~ tr/0-9/ /cs    # 把数字间的其它字符替换为一个空格。

更多正则表达式规则

表达式 描述
. 匹配除换行符以外的所有字符
x? 匹配 0 次或一次 x 字符串
x* 匹配 0 次或多次 x 字符串,但匹配可能的最少次数
x+ 匹配 1 次或多次 x 字符串,但匹配可能的最少次数
.* 匹配 0 次或多次的任何字符
.+ 匹配 1 次或多次的任何字符
{m} 匹配刚好是 m 个 的指定字符串
{m,n} 匹配在 m个 以上 n个 以下 的指定字符串
{m,} 匹配 m个 以上 的指定字符串
[] 匹配符合 [] 内的字符
[^] 匹配不符合 [] 内的字符
[0-9] 匹配所有数字字符
[a-z] 匹配所有小写字母字符
[^0-9] 匹配所有非数字字符
[^a-z] 匹配所有非小写字母字符
^ 匹配字符开头的字符
$ 匹配字符结尾的字符
\d 匹配一个数字的字符,和 [0-9] 语法一样
\d+ 匹配多个数字字符串,和 [0-9]+ 语法一样
\D 非数字,其他同 \d
\D+ 非数字,其他同 \d+
\w 英文字母或数字的字符串,和 [a-zA-Z0-9_] 语法一样
\w+ 和 [a-zA-Z0-9_]+ 语法一样
\W 非英文字母或数字的字符串,和 [^a-zA-Z0-9_] 语法一样
\W+ 和 [^a-zA-Z0-9_]+ 语法一样
\s 空格,和 [\n\t\r\f] 语法一样
\s+ 和 [\n\t\r\f]+ 一样
\S 非空格,和 [^\n\t\r\f] 语法一样
\S+ 和 [^\n\t\r\f]+ 语法一样
\b 匹配以英文字母,数字为边界的字符串
\B 匹配不以英文字母,数值为边界的字符串
a|b|c 匹配符合a字符 或是b字符 或是c字符 的字符串
abc 匹配含有 abc 的字符串 (pattern) () 这个符号会记住所找寻到的字符串,是一个很实用的语法.第一个 () 内所找到的字符串变成 $1 这个变量或是 \1 变量,第二个 () 内所找到的字符串变成 $2 这个变量或是 \2 变量,以此类推下去.
/pattern/i i 这个参数表示忽略英文大小写,也就是在匹配字符串的时候,不考虑英文的大小写问题. \ 如果要在 pattern 模式中找寻一个特殊字符,如 "*",则要在这个字符前加上 \ 符号,这样才会让特殊字符失效

更多参考内容

正则表达式:正则表达式 – 教程 | 菜鸟教程

Perl 正则表达式:perlre - Perl regular expressions - Perldoc Browser

Perl 正则表达式相关推荐

  1. perl正则表达式-1

    .代表任何一个单字符,不匹配换行符. *是量词,表示前面内容出现0到多次. +也是量词,表示前面内容出现1到多次. 字符集简写     \d表示一个数字     \w表示一个单词字符()数字,字母,下 ...

  2. perl 正则表达式 引擎_Perl 5引擎概述

    perl 正则表达式 引擎 正如我在" 我的DeLorean运行Perl "中所述,切换到Perl极大地提高了我的开发速度和可能性. 在这里,我将更深入地研究Perl 5的设计,以 ...

  3. perl正则表达式匹配中文

    perl正则表达式匹配中文:/[^u4E00-u9FA5]/ js中正则表达式匹配中文:match(/[\u4E00-\u9FA5]/)

  4. Perl正则表达式讲解

    转载:http://blog.sina.com.cn/s/blog_607254630101cvx3.html 9.3.1 原则1 正则表达式有三种形式:匹配.替换和转换. 在表 9-1 中列有三种正 ...

  5. Perl——正则表达式

    Perl正则表达式 文章目录 Perl正则表达式 一.正则表达式的应用 二.正则表达式之元字符 2.1 转义 2.2 特殊匹配 2.3 匹配次数 2.4 各种括号 ( ),[ ],{ } 三.正则表达 ...

  6. Perl正则表达式(2) - 用正则表达式进行匹配

    Perl正则表达式 2. 用正则表达式进行匹配 2.1 用 m// 进行匹配 到目前为止,我们都是讲正则表达式的内容写在一对斜线内,如/fred/.但其实这是 m// 的简写,其中m代表match,和 ...

  7. Perl正则表达式(1) - 正则表达式基础知识

    Perl正则表达式 1. 基础知识 Perl中正则表达式(regular expression)默认匹配 $_ 中的字符串,匹配成功就返回真,否则返回假: Perl匹配正则表达式时,可以使用变量内插, ...

  8. 在 UltraEdit 和 UEStudio 中开始使用 Perl 正则表达式

    作为 UltraEdit/UEStudio 查找/替换功能中最强大的组件之一,Perl 正则表达式使您能够在一次替换中重新格式化大量非均匀数据,从而为您节省几分钟甚至几小时的手动文本编辑时间! 要搜索 ...

  9. 浅谈Perl正则表达式

    一.简介 Perl正则表达式中模式指在字符串中寻找的特定序列的字符,由反斜线包含:/def/即Perl正则表达式中模式def.其用法如结合函数split将字符串用某Perl正则表达式中模式分成多个单词 ...

最新文章

  1. 皮一皮:直男相亲还想着龙珠...
  2. Crawler:爬虫基于urllib.request库实现获取指定网址上的所有图片
  3. POJ3278Catch That Cow(BFS)
  4. java1234小峰推荐书籍_java1234 webservice 第2 课 cfx实现
  5. 最长非下降子序列(O(nlogn))(offer收割)
  6. 从常识看中国经济社会-再续之续:套利
  7. 当当年中庆典,力度超前,花120买300的硬核书
  8. MySQL性能优化之:索引下推
  9. windows上git clone命令速度过慢问题的解决
  10. redis list放入对象_Redis从入门到入土:详细讲解内存模型以及常用命令
  11. 2-6 hash(1)
  12. spacy存在内存泄露问题
  13. php错误和异常的处理方式
  14. Linux-服务管理命令chkconfig
  15. Oauth2.0如何理解?
  16. 【毕设】知网文献检索列表中的 href 解析为可访问的 URL
  17. Shadow插件化系列(一)简单详解
  18. 【懒人神器,批量src】Serein,一个可以对无数个网站进行漏洞检测的软件
  19. 字节编程题 雀魂启动
  20. 神策面试官的修炼之道,选对人与吸引人 | 神策军

热门文章

  1. Springboot毕设项目农产品销售平台796hzjava+VUE+Mybatis+Maven+Mysql+sprnig)
  2. Linux下查看压缩文件内容的11种方法
  3. Oracle 11g rac 生产环境asm磁盘迁移
  4. matlab 电路编程入门,菜鸟入门Matlab编程
  5. Python学习之集合常用方法
  6. MATLAB 常见离散信号的产生和实现
  7. linux db2 数据源配置文件,为 DB2 UDB 系列配置数据源
  8. Adobe Lightroom Classic CC 2020 Mac(lr cc 2020 mac)
  9. 一名优秀的嵌入式软件工程师所具备知识技能
  10. dwcc怎么设置html默认,Dreamweaver CC2018写div自适应页面布局的教程