03-Python正则表达式
文章目录
- 1.常见语法
- 1.1 点-匹配所有字符
- 1.2 星号-重复匹配任意次
- 1.3 加号-重复匹配多次
- 1.4 问号-匹配0-1次
- 1.5 花括号-匹配指定次数
- 1.6 贪婪模式与非贪婪模式
- 1.7 对原字符的转义
- 1.8 匹配某种字符类型
- 1.9 方括号-匹配几个字符之一
- 1.10 起始、结尾、单行、多行
- 1.11 括号-组选择
在线正则表达式网站
1.常见语法
正则表达式中的普通字符都是表示直接匹配,但是有些特殊的字符,术语为metacharacters(元字符)。它们出现在正则表达式字符串中,不是表示直接匹配他们, 而是表达一些特别的含义。这些特殊的元字符包括下面这些:
. * + ? \ [ ] ^ $ { } | ( )
1.1 点-匹配所有字符
.
表示要匹配除了换行符之外的所有单个字符
比如说:
苹果是绿色的
橙子是橙色的
香蕉是黄色的
乌鸦是黑色的
.色
此时表示所有以“色”结尾的单词,其中“.
”表示一个字符
content = '''苹果是绿色的
橙子是橙色的
香蕉是黄色的
乌鸦是黑色的'''import re
p = re.compile(r'.色')
for one in p.findall(content):print(one)
上述代码输出为:
正则表达式前面的r
表示取消所有的转义含义
compile()函数表示产生一个Pattern类的对象
findall()返回的是一个列表,列表中的元素是字符串
1.2 星号-重复匹配任意次
*
表示匹配前面的子表达式任意次,包括0次。
比如说:,.*
表示“,”开头,后面紧跟若干个字符(按行划分)
因为这里“.
”表示任意的一个字符,*
表示任意的次数
1.3 加号-重复匹配多次
+
表示匹配前面的子表达式一次或多次,不包括0次。
注意和*
的区别
和*号的情况略有不同,+号前面的表达式至少出现一次
1.4 问号-匹配0-1次
?
表示匹配前面的子表达式0次或1次。
1.5 花括号-匹配指定次数
上图中表示油至少出现3次,最多出现4次
常常用来匹配电话号码
1.6 贪婪模式与非贪婪模式
* + ?
都是贪婪地,使用他们时,会尽可能多的匹配内容,要想解决这个问题,就需要使用非贪婪模式,也就是在星号后面加上?
,变成这样 .*?
1.7 对原字符的转义
\
表示对后面的.
进行转义
1.8 匹配某种字符类型
反斜杠后面接一些字符,表示匹配 某种类型 的一个字符。比如:
\d 匹配0-9之间任意一个数字字符,等价于表达式 [0-9]
\D 匹配任意一个不是0-9之间的数字字符,等价于表达式 [^0-9]
\s 匹配任意一个空白字符,包括 空格、tab、换行符等,等价于表达式 [\t\n\r\f\v]
\S 匹配任意一个非空白字符,等价于表达式 [^ \t\n\r\f\v]
\w 匹配任意一个文字字符,包括大小写字母、数字、下划线,等价于表达式 [a-zA-Z0-9_]
缺省情况也包括 Unicode文字字符,如果指定 ASCII 码标记,则只包括ASCII字母
\W 匹配任意一个非文字字符,等价于表达式 [^a-zA-Z0-9_]
content = '''
王小五
张小二
tony
'''
import re
p = re.compile(r'\w{2,4}',re.ASCII)
print(p.findall(content))
输出为['tony']
1.9 方括号-匹配几个字符之一
方括号表示要匹配 指定的几个字符之一 。比如:
[abc]
可以匹配 a, b, 或者 c 里面的任意一个字符。等价于[a-c]
。
[a-c]
中间的 - 表示一个范围从a 到 c。
如果你想匹配所有的小写字母,可以使用[a-z]
在方括号里.
表示其本身的含义,不再表示任意字符
如果在方括号中使用 ^
, 表示非方括号里面的字符集合
1.10 起始、结尾、单行、多行
^
表示每行的开头位置(多行模式)
re.compile(r'^\d+', re.M)
中re.M
表示切换到多行模式
$
表示每行结尾
1.11 括号-组选择
content = '''苹果,苹果是绿色的
橙子,橙子是橙色的
香蕉,香蕉是黄色的'''import re
p = re.compile(r'^(.*),', re.MULTILINE)
for one in p.findall(content):print(one)
content = '''苹果,苹果是绿色的
橙子,橙子是橙色的
香蕉,香蕉是黄色的'''import re
p = re.compile(r'^(.*)(,)', re.MULTILINE)
for one in p.findall(content):print(one)
多组时,one返回的是一个元组
03-Python正则表达式相关推荐
- python 正则表达式re 模块的使用
python 正则表达式re 模块的使用 文章目录: 一.re模块介绍 1.re模块说明 2.官方文档给出的文档 3.别人总结的成表格中的内容 二.re模块使用介绍 1.常用函数源码 1.常用的函数介 ...
- 菜鸟教程python正则表达式_python 正则表达式详解
python 正则表达式详解 1. 正则表达式模式 模式描述 ^ 匹配字符串的开头 $ 匹配字符串的末尾. . 匹配任意字符,除了换行符,当re.DOTALL标记被指定时,则可以匹配包括换行符的任意字 ...
- python 结尾回车_理解不了Python正则表达式?我帮你搞定
点击蓝字"python教程"关注我们哟! 在学习Python的过程中,我们难免会遇到比较晦涩.难以理解的内容,比如Python中的正则表达式.面向对象等内容,为了更好地帮助大家理解 ...
- [小小明]Python正则表达式速查表与实操手册
v0.3下载地址:https://download.csdn.net/download/as604049322/14504394 目录 文章目录 文档简介 作者简介 阅读建议 版权声明 Python ...
- Python正则表达式用法详解
搞懂 Python 正则表达式用法 作者:枫叶云 来源:见文末 Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本 ...
- python 逆向生成正则表达式_一篇搞定Python正则表达式
1. 正则表达式语法 1.1 字符与字符类 1 特殊字符:.^$?+*{}[]()| 以上特殊字符要想使用字面值,必须使用进行转义 2 字符类 1. 包含在[]中的一个或者多个字符被称为字符类,字符类 ...
- python正则表达式处理txt,python 正则表达式参数替换实例详解 python使用正则表达式替换txt内容...
Python正则表达式如何进行字符串替换实例 import res = 'adds23dd56'ss = re.sub(r'\d', '*', s)>>> ss'adds**dd** ...
- python正则表达式贪婪匹配_Python正则表达式教程之三:贪婪/非贪婪特性
之前已经简单介绍了Python正则表达式的基础与捕获,那么在这一篇文章里,我将总结一下正则表达式的贪婪/非贪婪特性. 贪婪 默认情况下,正则表达式将进行贪婪匹配.所谓"贪婪",其实 ...
- Python 正则表达式各种特殊符号 重点
Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. r ...
- python 正则表达式 re.compile() 的使用
1 re.compile() 的解释: python 正则表达式 re.compile() 将正则表达式编译成一个Pattern规则对象,单独使用compile 没有意义,他生成的是一个规则,需要ma ...
最新文章
- 终聚.net平台开发
- 用telnet 测试Http协议
- 如何理解卷积神经网络(CNN)中的卷积和池化?
- 盘点3个改变世界的AI项目,NLP/CV/BI,3个方向
- 2019牛客第八场A All-one Matrices(单调栈)
- 计算机的iscsi配置,PC端的iSCSI参数设置方法
- mysql一些基本sql操作_MySql数据库的一些基本操作---------------SQL语法
- Linux防火墙Firewall和Iptables的使用
- 基于Java+Springmvc+vue+element实现大学生科技创新创业项目管理系统
- JAVA项目之房屋出租系统
- LS-DYNA基础理论
- gavin中文是什么意思_Gavin[加文,盖温]英文名的中文翻译意思、发音、来源及流行趋势-千代英文名...
- 没有CUE的情况下APE刻录CD
- 扰动观察法怎么写matlab,扰动观察法
- Android技能树 — 动画小结
- HBase的高表和宽表
- Windows下双显示器截屏方法
- Django打造大型企业官网-项目实战(三)
- A可向容器中放甲乙两种物品,B只取甲种物品,C只取乙种物品,A每次只放一种物用品PV原理实现进程A、B、C 3个并行进程的同步
- 误区:思维中常犯的6个基本错误