正则表达式速查表

字符 描述
\ 将下一个字符标记为一个特殊字符、或一个原义字符、或一个向后引用、或一个八进制转义符。例如,“n“匹配字符”n“。”\n“匹配一个换行符。串行”\\“匹配”\“而”\(“则匹配”(“。
^ 匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n“或”\r“之后的位置。
$ 匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n“或”\r“之前的位置。
* 匹配前面的子表达式零次或多次。例如,zo*能匹配“z“以及”zoo“。*等价于{0,}。
+ 匹配前面的子表达式一次或多次。例如,“zo+“能匹配”zo“以及”zoo“,但不能匹配”z“。+等价于{1,}。
? 匹配前面的子表达式零次或一次。例如,“do(es)?“可以匹配”does“或”does“中的”do“。?等价于{0,1}。
{n} n是一个非负整数。匹配确定的n次。例如,“o{2}“不能匹配”Bob“中的”o“,但是能匹配”food“中的两个o。
{n,} n是一个非负整数。至少匹配n次。例如,“o{2,}“不能匹配”Bob“中的”o“,但能匹配”foooood“中的所有o。”o{1,}“等价于”o+“。”o{0,}“则等价于”o*“。
{n,m} m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“o{1,3}“将匹配”fooooood“中的前三个o。”o{0,1}“等价于”o?“。请注意在逗号和两个数之间不能有空格。
? 当该字符紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如,对于字符串“oooo“,”o+?“将匹配单个”o“,而”o+“将匹配所有”o“。
. 匹配除“\n“之外的任何单个字符。要匹配包括”\n“在内的任何字符,请使用像”(.|\n)“的模式。
(pattern) 匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用0…0…9属性。要匹配圆括号字符,请使用“\(“或”\)“。
(?:pattern) 匹配pattern但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用或字符“(|)“来组合一个模式的各个部分是很有用。例如”industr(?:y|ies)“就是一个比”industry|industries“更简略的表达式。
(?=pattern) 正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)“能匹配”Windows2000“中的”Windows“,但不能匹配”Windows3.1“中的”Windows“。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。
(?!pattern) 正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)“能匹配”Windows3.1“中的”Windows“,但不能匹配”Windows2000“中的”Windows“。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始
(?<=pattern) 反向肯定预查,与正向肯定预查类拟,只是方向相反。例如,“(?<=95|98|NT|2000)Windows“能匹配”2000Windows“中的”Windows“,但不能匹配”3.1Windows“中的”Windows“。
(?<!pattern) 反向否定预查,与正向否定预查类拟,只是方向相反。例如“(?<!95|98|NT|2000)Windows“能匹配”3.1Windows“中的”Windows“,但不能匹配”2000Windows“中的”Windows“。
x|y 匹配x或y。例如,“z|food“能匹配”z“或”food“。”(z|f)ood“则匹配”zood“或”food“。
[xyz] 字符集合。匹配所包含的任意一个字符。例如,“[abc]“可以匹配”plain“中的”a“。
[^xyz] 负值字符集合。匹配未包含的任意字符。例如,“[^abc]“可以匹配”plain“中的”p“。
[a-z] 字符范围。匹配指定范围内的任意字符。例如,“[a-z]“可以匹配”a“到”z“范围内的任意小写字母字符。
[^a-z] 负值字符范围。匹配任何不在指定范围内的任意字符。例如,“[^a-z]“可以匹配任何不在”a“到”z“范围内的任意字符。
\b 匹配一个单词边界,也就是指单词和空格间的位置。例如,“er\b“可以匹配”never“中的”er“,但不能匹配”verb“中的”er“。
\B 匹配非单词边界。“er\B“能匹配”verb“中的”er“,但不能匹配”never“中的”er“。
\cx 匹配由x指明的控制字符。例如,\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则,将c视为一个原义的“c“字符。
\d 匹配一个数字字符。等价于[0-9]。
\D 匹配一个非数字字符。等价于[^0-9]。
\f 匹配一个换页符。等价于\x0c和\cL。
\n 匹配一个换行符。等价于\x0a和\cJ。
\r 匹配一个回车符。等价于\x0d和\cM。
\s 匹配任何空白字符,包括空格、制表符、换页符等等。等价于[ \f\n\r \v]。
\S 匹配任何非空白字符。等价于[^ \f\n\r\t\v]。
\t 匹配一个制表符。等价于\x09和\cI。
\v 匹配一个垂直制表符。等价于\x0b和\cK。
\w 匹配包括下划线的任何单词字符。等价于“[A-Za-z0-9_]“。
\W 匹配任何非单词字符。等价于“[^A-Za-z0-9_]“。
\xn 匹配n,其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,“\x41“匹配”A“。”\x041“则等价于”\x04&1“。正则表达式中可以使用ASCII编码。.
\num 匹配num,其中num是一个正整数。对所获取的匹配的引用。例如,“(.)\1“匹配两个连续的相同字符。
\n 标识一个八进制转义值或一个向后引用。如果\n之前至少n个获取的子表达式,则n为向后引用。否则,如果n为八进制数字(0-7),则n为一个八进制转义值。
\nm 标识一个八进制转义值或一个向后引用。如果\nm之前至少有nm个获得子表达式,则nm为向后引用。如果\nm之前至少有n个获取,则n为一个后跟文字m的向后引用。如果前面的条件都不满足,若n和m均为八进制数字(0-7),则\nm将匹配八进制转义值nm。
\nml 如果n为八进制数字(0-3),且m和l均为八进制数字(0-7),则匹配八进制转义值nml。
\un 匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。例如,\u00A9匹配版权符号(©)。

常用函数:

1.re.match开始位置匹配,没有匹配到就返回(即使正则表达式没有用^声明匹配开头)

input="入门小站"#P<name>分组命名
reg=re.compile(r'(?P<name>入门)')
res=reg.match(input)
if res:print(res.groupdict())print(res.groups())print(res.groups())
{'name': '入门'}
('入门',)
('入门',)

2.re.search搜索整个字符串

# 扫描整个 字符串 找到匹配样式的第一个位置,并返回一个相应的 匹配对象。如果没有匹配,就返回一个 None
input='''
入门小站
入门
入门教程
'''
reg=re.compile(r'入门(?:小站|教程)',re.S)
res=reg.search(input)
if res:print(res.group())
入门小站

3.re.findall查找到字符串所有的匹配项,并返回一个list

input='''
入门小站
入门
入门教程
'''
# re.M多行模式匹配
reg=re.compile(r'^入门(?:小站|教程)$',re.M)
res=reg.findall(input)
if res:print(res)
['入门小站', '入门教程']

4.re.split字符串分割

# split(pattern, string, maxsplit=0, flags=0)
# maxsplit 最大的分割次数
input='''
入门
123
小站
dd
入门
'''reg=re.compile(r'[a-z0-9]+')
res=reg.split(input)
print(res)reg=re.compile(r'[a-z0-9]+')
res=reg.split(input,1)
print(res)
['\n入门\n', '\n小站\n', '\n入门\n']
['\n入门\n', '\n小站\ndd\n入门\n']

5. re.sub字符串替换

# 语法 sub(pattern, repl, string, count=0, flags=0)
# repl 被替换成的字符串
# count指定替换的次数input='''
入门
123
小站
456
dd
入门
'''
reg=re.compile(r'([a-z0-9]{1,})',re.M)
res=reg.sub('11',input)
print(res)# 替换1次
reg=re.compile(r'([a-z0-9]{1,})',re.M)
res=reg.sub('11',input,1)
print(res)
入门
11
小站
11
11
入门


入门
11
小站
456
dd
入门

6. re.subn

# 语法 subn(pattern, repl, string, count=0, flags=0)
# repl 被替换成的字符串
# count指定替换的次数
# 返回结果中包含替换的次数
input='''
入门
123
小站
456
dd
入门
'''
reg=re.compile(r'([a-z0-9]{1,})',re.M)
res=reg.subn('11',input)
print(res)
('\n入门\n11\n小站\n11\n11\n入门\n', 3)

Python3常用正则表达式相关推荐

  1. Python模块之二:Python3 常用模块总结

    Python模块之二:Python3 常用模块总结 一.random模块 提供一些随机数获取的相关方法 1.常用方法 1.random():获取[0.0,1.0)范围内的浮点数 2.randint(a ...

  2. Python3常用系统函数帅哥定制版

    Python3常用系统函数JSON帅哥定制版 没错,这里的帅哥指的就是我自己 安装 安装pip3 wget --no-check-certificate https://pypi.python.org ...

  3. 常用正则表达式合集与工具

    any-rule 维护了一个常用正则表达式合集,并且本身是一个支持 Web/VS Code/idea/Alfred Workflow 多平台的正则表达式工具. image 安装 VS Code 应用商 ...

  4. Python正则匹配HTML,python正则匹配html标签_Python爬虫常用正则表达式及HTML网页标签分析总结...

    这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法.它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~ 当然如果会Selenium基于自动化测试爬 ...

  5. 转载:常用正则表达式大全!(例如:匹配中文、匹配html)

    常用正则表达式大全!(例如:匹配中文.匹配html) 匹配中文字符的正则表达式: [u4e00-u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[ ...

  6. PHP常用正则表达式汇总 [复制链接]

    PHP常用正则表达式汇总 [复制链接] 上一主题下一主题   离线我是小猪头 法师 发帖 539 加关注 发消息 只看楼主 倒序阅读 使用道具楼主  发表于: 2011-06-22 更多 - 本帖被 ...

  7. 前端开发中的 正则表达式 及常用正则表达式大全

    RegExp 是正则表达式(Regular expression)的缩写,就是用一个"字符串"来描述一个特征,然后去验证另一个"字符串"是否符合这个特征.比如 ...

  8. shell 常用正则表达式

    "^\d+$" //非负整数(正整数 + 0)  "^[0-9]*[1-9][0-9]*$" //正整数  "^((-\d+)|(0+))$" ...

  9. 常用正则表达式(包括中文匹配)

    2007-10-24 10:21 常用正则表达式 正则表达式用于字符串处理.表单验证等场合,实用高效.现将一些常用的表达式收集于此,以备不时之需. 匹配中文字符的正则表达式: [\u4e00-\u9f ...

最新文章

  1. Redis运维优化的陷阱及避坑指南
  2. 纤涂覆层材料的研究与总结
  3. ielts writing
  4. 从零开始Bootstrap3
  5. 航院 1874 畅通工程续
  6. VB自定义函数加 和 ;
  7. latex 不等于_生活中养成这8个习惯,就算不运动,照样瘦!
  8. 【转】Word 2010 取消拼写/语法检查,隐藏红线/绿线
  9. mvc3入门 第一个程序Helllo World
  10. lecture 5:Policy Optimization 1
  11. (转)Vsdocman7.2 注册版
  12. 2 str转byte失败_android 4.2的多线程库加载崩溃问题
  13. ofd文件转化成pdf的免费方法
  14. linux设置library path,如何在linux中设置环境变量LD_LIBRARY_PATH
  15. 战略管理与资本运作案例剖析
  16. 资深ios开发工程师收藏的iOS干货文章、大神的blog博客
  17. 苹果 macbookpro m2 pro、m2 max、m1 pro和 m1 max区别
  18. Python中使用BeautifulReport形成测试报告教程
  19. 幂函数的c语言程序,C ++中的幂函数
  20. Ubuntu18.04解决网卡失效的问题

热门文章

  1. Linux源码下Makefile详解(参照Documentation\kbuild\makefiles.txt和资料)-转
  2. mysql5.0无法访问_MYSQL版本升级到后5.0后无法连接的问题
  3. LeetCode 744. Find Smallest Letter Greater Than Target
  4. PAT 1074. 宇宙无敌加法器(20)-PAT乙级真题
  5. 【iOS开发】关于Xcode8后产生的viewForHeaderInSection、viewForFooterInSection设置不产生效果的问题
  6. LeetCode199. Binary Tree Right Side View
  7. 蓝桥杯 BASIC-19 基础练习 完美的代价
  8. jQuery LigerUI 插件介绍及使用之ligerGrid
  9. 简单的学习一下node吧——还在学习中~~~
  10. 摩托罗拉MT788刷机