Python标准库01 正则表达式(re包)
python正则表达式基础
简单介绍
正则表达式并不是python的一部分。正则表达式是用于处理字符串的强大工具,拥有自己独特的语法及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十分强大。在提供正则表达式的语言里,正则表达式的语法是一样的,区别只在于不同的贬称语言实现支持的语法数量不同;但不用担心,不被支持的语法通常是不常用的的部分。
正则表达式进行匹配的流程
正则表达式引擎“编译”<正则表达式>得到正则表达式对象(正则表达式引擎编译表达式字符串得到的对象,包含应如何进行匹配的信息),正则表达式对象需要匹配的文本进行"匹配",生成匹配结果(正则表达式对象对文本进行匹配后得到的结果,包含了这次成功匹配的信息,如匹配到的字符串、分组以及在文本中的索引)。
匹配大概过程
正则表达式的大致匹配过程是:一次拿出表达式和文本中的字符比较,如果每一个字符都能匹配,则匹配成功;一旦有匹配不成功的字符则匹配失败。如果表达式中有量词或边界,这个过程会稍微有些不同,但也是很好理解的,多看实例多使用几次就能明白。
python支持的正则表达式元字符和语法
语法 说明 表达实例 完整匹配的字符串 一般字符 匹配自身 abc abc . 匹配任意一个字符(除"\n"外) a.c abc \ 转义字符, 使后一个字符改变原来的意思 a\.c a.c [...] 字符集(字符类)对应位置可以是字符集中任意一个字符 a[bcd]e abe ace ade a|b 字符a或字符b <-等价于-> [ab] [0-9] 数字0-9其中一个字符 [a-z] 小写字母a-z其中一个字符 [A-Z] 大写字母A-Z其中一个字符 [^m] 不是字符m --------------------------------------------------------------------------------------------------- \d 数字:[0-9] a\dc a1c \D 非数字:[^\d] a\Dc abc \s 空白字符:[<空格>\t\r\n\f\v] a\sc a c \S 非空白字符:[^\s] a\Sc abc \w 单词字符:[A-Za-z0-9] a\wc abc \W 非单词字符:[^\w] a\Wc a c -------------------------数量词(重复)------------------------------------------------------ * 匹配前一个字符0次或无限次(>=0) abc* ab abc abcc abccc ... + 匹配前一个字符1次或无限次(>=1) abc+ abc abcc abccc ... ? 匹配前一个字符0次或1次 abc? ab abc {m} 匹配前一个字符m次 ab{2}c abbc {m,n} 匹配前一个字符m至n次(m<= >=n); m和n可以省略 ab{1,2}c abc abbc *? +? ?? {m,n}? 使* + ? {m,n}变成非贪婪模式 ------------------------------边界匹配------------------------------------------------------ ^ 匹配字符串开头(在多行模式中匹配每一行的开头) $ 匹配字符串末尾(在多行模式中匹配每一行的末尾) \A 仅匹配字符串开头 这几种匹配模式有点疑惑?????? \Z 仅匹配字符串末尾 \b 匹配\w和\W之间 \B [^\b] ------------------------------逻辑、分组------------------------------------------------------ | |代表左右表达式任意匹配一个(类似短路或,先匹配左边) abc|def abc def (...) 被括起来的表达式将作为分组, 从表达式左边开始每遇到 (abc){2} abcabc 一个分组的左括号'(',编号+1;分组表达式作为一个整体, a(123|456)c a123c a456c 可以后接数量词.表达式中的|仅在该组中有效 (?P<name>...)分组, 除了原有的编号外再指定一个额外的别名 (?P<id>abc){2} abcabc \<number> 引用编号为<number>的分组匹配到的字符串 (\d)abc\1 1abc1 5abc5 (?P=name) 引用别名为<name>的分组匹配到的字符串 (?P<id>\d)abc(?P=id) 1abc1 5abc5 ------------------------------特殊构造(不作为分组)--------------------------------------------------- (?:...) (...)的不分组版本, 用于使用'|'或后接数量词 (?:abc){2} abcabc (?iLmsux) iLmsux的每个字符代表一个匹配模式, 只能用在正则的开头(?i)abc Abc (?#...) #后的内容作为注释被忽略 abc(?#comment)123 abc123 (?=...) 之后的字符串内容需要匹配表达式才能成功匹配,不消耗字符串内容 a(?=\d) 后面是数字的a (?!...) 之后的字符串内容需要不匹配表达式才能成功匹配,不消耗字符串内容a(?!\d) 后面不是数字的a (?<=...) 之前的字符串内容需要匹配表达式才能成功匹配,不消耗字符串内容(?<=\d)a 前面不是数字的a (?<!...) 之前的字符串内容需要不匹配表达式才能成功匹配,不消耗字符串内容(?<!\d)a 前面不是数字的a
参考:
http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html
http://www.runoob.com/python/python-reg-expressions.html
http://www.cnblogs.com/PythonHome/archive/2011/11/19/2255459.html
http://www.cnblogs.com/kaituorensheng/p/3489492.html
转载于:https://www.cnblogs.com/liwei0526vip/p/5096510.html
Python标准库01 正则表达式(re包)相关推荐
- Python标准库01 正则表达式 (re包)
摘要:Python正则表达式标准库介绍 我将从正则表达式开始讲Python的标准库.正则表达式是文字处理中常用的工具,而且不需要额外的系统知识或经验.我们会把系统相关的包放在后面讲解. 正则表达式(r ...
- Python标准库07 信号 (signal包,部分os包)
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 在了解了Linux的信号基础之后,Python标准库中的signal包就很容易学习 ...
- 6.Python标准库_子进程 (subprocess包)
Vamei博客地址:http://www.cnblogs.com/vamei/archive/2012/09/23/2698014.html 这里的内容以Linux进程基础和Linux文本流为基础.s ...
- Python标准库之正则表达式(re库)
目录 正则表达式 正则表达式语法 [] + * ? $ ^ {n} {m,n} \d \D \s \S \w \W \b \B . | () 模块内容 re.match(pattern[过滤模式],s ...
- python信号处理库_Python标准库07 信号 (signal包,部分os包)(转载)
作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! 在了解了Linux的信号基础之后,Python标准库中的signal包就很容易学习 ...
- python标准库有多强大_Python标准库——走马观花
原文:Python标准库--走马观花 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! Python的一大好处在于它有一套很有用的标 ...
- Python标准库简介
很系统的简介了Python标准库的使用方向,对形成知识框架很有帮助. 作者:Vamei 出处:http://www.cnblogs.com/vamei 欢迎转载,也请保留这段声明.谢谢! Python ...
- python链表库_[转]为什么python标准库没有实现链表
实际上刚开始学习一些高级语言的时候我也有同样的疑问,而且即使有链表对应物的语言,链表常常也很少被实际使用. 如果是在国外听数据结构的课,老师一般会警告你这只是一个理论概念,实际应用应该实际考察,在通常 ...
- Python标准库03 路径与文件 (os.path包, glob包)
摘要:Python标准库 文件系统 os.path glob.glob os.path包 os.path包主要是处理路径字符串,比如说'/home/vamei/doc/file.txt',提取出有用信 ...
最新文章
- wpf checkbox选中触发事件_Cypress 可操作事件
- php小结,PHP编程小结
- boost::mpl模块实现pair_view相关的测试程序
- GDCM:gdcm::Item的测试程序
- OSGI嵌入jetty应用服务器
- 如何使用FM RH_STRUC_GET获得user assign的Organization unit
- KBMMW 4.81.00 发布
- jQuery选择器总结[转]
- pytorch中unsqueeze()和squeeze()函数
- ionic3 教程(一)安装和配置
- 人脸识别门禁系统java实现_java实现人脸识别源码【含测试效果图】——前台显示层(index.jsp)...
- 研发项目wbs分解简单案例_2013信息系统项目管理师案例分析之工作分解结构(WBS)案例...
- 如何在码云上面上传本地项目
- 2021年中职组“网络安全”赛项内蒙古自治区竞赛任务书
- 蓝桥杯--算法提高 字符串跳步
- SpringMVC Controller接收普通类型参数 postman配置
- 解决使用ssh工具远程连接到服务器上因为网络波动而需要重连的问题
- 用云服务器搭建虚拟主机,用云服务器搭建虚拟主机
- 卸载k8s和docker
- Google的60款开源项目
热门文章
- 使用 IAsyncResult 进行 .NET 异步编程(转载)
- Java通过JDBC来连接SqlServer数据库
- C#.NET禁止一个程序启动多个实例
- ufs 固态硬盘_NVMe SSD新利器?WTG最高级别评分 阿卡西斯NVMe M.2移动固态硬盘盒评测...
- Linux RPM 相关
- oracle json 搜索,oracle 正则查询json返回报文中某个字段的值
- linux 内核网络协议栈--IP层开始直到包被处理(三)
- leetcode算法题--不同路径2
- 怎么给电脑设密码_怎么给电脑中重要的文件夹设置密码?
- linux中EOF的用法梳理