Python正则表达式书写容易碰到的陷阱:\W*和\W*?匹配过程遇到的问题
老猿在分析《Python正则表达式\W+和\W*匹配过程的深入分析》中的问题时,想到一个问题,如果“re.split(’(\W*)’,‘Hello,world’)”的处理如果换成非贪婪模式会怎么样,根据老猿的预测,由于在’Hello,world’中没有连续的非单词字符,因此贪婪模式处理和非贪婪模式结果应该一样,如是测试了一下看看效果:
>>> re.split('(\W*)','Hello,world') #贪婪模式
['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', ',', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', '']
>>> re.split('(\W*?)','Hello,world') #非贪婪模式
['Hello,world']
>>>
看到这结果老猿完全懵圈了,这完全推翻了《Python正则表达式\W+和\W*匹配过程的深入分析》的分析过程。但执行结果肯定是正常的,肯定是老猿自己的问题,大家觉得问题出在哪里呢?
不卖关子了,《Python正则表达式\W+和\W*匹配过程的深入分析》的分析过程应该是没有问题的,问题出在输入的问号上,半角的问号被输入成了全角问号,导致匹配不到对应的搜索文本,所以就将原串作为列表的元素整个返回了。其实结果也告诉我们没有分割成功,结果中的元素只有一个,而不是两个,因为它们是一个单引号标记的字符串。只是才开始老猿没仔细看,把字符串中间的逗号看成了元素分割的逗号,才闹了这么个乌龙。上述语句真正的非贪婪模式执行结果如下:
>>> re.split('(\W*?)','Hello,world') #非贪婪模式
['', '', 'H', '', 'e', '', 'l', '', 'l', '', 'o', '', '', ',', '', '', 'w', '', 'o', '', 'r', '', 'l', '', 'd', '', '']
看起来与“re.split(’(\W*)’,‘Hello,world’)”贪婪模式的结果相同,其实还是有些不同的,这个不同点正好体现出贪婪模式和非贪婪模式的区别,具体是怎么回事感兴趣的可以分析一下。
这个案例类似的场景老猿遇到过多次,写出来聊博大家一笑。
老猿Python,跟老猿学Python!
博客地址:https://blog.csdn.net/LaoYuanPython
请大家多多支持,点赞、评论和加关注!谢谢!
Python正则表达式书写容易碰到的陷阱:\W*和\W*?匹配过程遇到的问题相关推荐
- python 正则表达式 断言 不定长表达式_【教程】详解Python正则表达式之: (?!…) negative lookahead assertion 前向否定匹配 /前向否定断言...
Python 2.7的官网文档中的解释是:(?!...)Matches if ... doesn't match next. This is a negative lookahead assertio ...
- Python正则表达式初识(十)附正则表达式总结
今天分享正则表达式最后一个特殊字符"\d",具体的教程如下. 1.特殊字符"\d"十分常用,其代表的意思是数字.代码演示如下图所示. 其中"+&quo ...
- 详解Python正则表达式之: (?Pname…) named group 带命名的组
2019独角兽企业重金招聘Python工程师标准>>> Python 2.7的手册中的解释: (?P<name>...) Similar to regular paren ...
- Python实用技法第26篇:定义实现最短匹配的正则表达式
上一篇文章:Python实用技法第25篇:正则:以不区分大小写的方式对文本做查找和替换 下一篇文章:Python实用技法第27篇:编写多行模式的正则表达式 1.需求? 我们正在尝试用正则表达式对文本模 ...
- Python正则表达式\W+和\W*匹配过程的深入分析
在学习re.split函数的处理过程中,发现执行如下语句及返回与老猿预想的不一致: >>> re.split('\W*','Hello,world') ['', 'H', 'e', ...
- python正则表达式\s \S \w \W区别
\s:用于匹配单个空格符,包括tab键和换行符: \S:用于匹配除单个空格符之外的所有字符: \d:用于匹配从0到9的数字: \w:用于匹配字母,数字或下划线字符: \W:用于匹配所有与\w不 ...
- python正则表达式\d 匹配数字\D 匹配非数字\w 匹配单词\W 匹配非单词字符
一个\d代表一个数字.开头没匹配到,即使字符串其他部分包含需要匹配的内容,.match也会返回none import re a = re.match('\d\d','23es12testasdtest ...
- python正则表达式操作指南_Python正则表达式操作指南
原文作者:A.M. Kuchling (amk@amk.ca) 翻译人员:FireHare 校对人员:Leal 适用版本:Python 1.5 及后续版本 摘要 本文是通过Python的 re 模块来 ...
- python 正则表达式 sub_python 正则表达式 re.sub re.subn
python正则表达式模块简介 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式.Python 1.5之前版本则是通过 regex 模块提供 Emacs 风格的模式 ...
最新文章
- redis windows版本的使用
- linux命令行ps1变量_利用Shell中变量PS1定制Linux Shell命令主提示符
- JVM从入门到精通(九):JVM调优实战 - arthas 的使用
- 最简单的Angular Route hello world场景都跑不通的一个原因
- java自适应table_Java 设置Word中的表格自适应的3种方式
- 学习《html5.css3.0》网页布局和样式精粹(第一天)
- 10款常用Java测试工具
- DotNetBar 教程
- VC++ IE缓存管理研究
- 碰撞检测 :Separating Axis Theorem
- iOS 地图坐标系转换
- lgv30刷android10,记一次LG V30系列手机完美刷入MIUI12系统和Flyme刷机教程
- 数字化时代的数据安全与治理
- 箭头跳动动画效果和圆盘动画效果
- 计算机c盘加容量,win7 增加c盘空间方法_win7 如何增加c盘容量-win7之家
- Mini-USB、Micro-USB(Micro-B)、Type-C等接口
- nrf52在未配对的情况下使用白名单广播,指定安卓手机允许连接
- JUDE-UML工具软件介绍
- Arduino实现压力传感器(使用HX711模块)
- WIN10手动添加开机启动项,自己测试可用
热门文章
- 高考415分能上计算机网络的学校吗,2021高考415分能上什么学校 可以报哪些学校...
- 【零基础学PS】第一弹:色彩模式的选择
- 记录遇到的问题之---把16进制的颜色rgb转换成‘#’形式
- 【LaTex树状图】LaTex画树状图_编译原理语法树_直角分叉_Forking links
- java 导出订单明细_订单导出pdf文件
- 用VMware导入.ova文件
- 计算机控制求输出递推计算题,2020计算思维复习
- SEV/WFE/WFI
- 360极速浏览器 谷歌浏览器 关闭 双指左滑右滑 页面前进后退 手势
- 基于JAVA疗养院管理计算机毕业设计源码+数据库+lw文档+系统+部署