python中re模块的match、search、findall、sub方法使用
正则表达式
正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。(来自百度)
正则表达式语法
(图片资料转自https://www.cnblogs.com/chengege/p/11190782.html)
re模块
re模块是python中内置的,支持正则匹配的模块。
match方法
match方法的语法为:re.match(pattern,string,[flags=0])
pattern表示要匹配的字符串,string表示原始字符串。flags为标志位,控制正则匹配格式,如忽略大小写。默认值是0,代表无特殊匹配。
需要注意的是,match方法在匹配时,是从头开始匹配的,如果是从中间截取一段字符,进行匹配,是匹配不到的。
下面一段代码:
# 原始字符串
old_str = '{"phone_num":"${not_exist_num}","pwd":"123456"}'# 要匹配的字符串中${not_exist_num}
replace_str = '${not_exist_num}'
# 要匹配的字符串 {"phone_num":
replace_str1 = '{"phone_num":'# 使用match方法进行分别匹配两个字符
res = re.match(replace_str, old_str)
res1 = re.match(replace_str1, old_str)
进行调试,可发现,匹配replace_str时,返回的是None, 匹配replace_str1时,返回的是Match对象。
可以通过match对象的group方法,获取匹配结果:
由上面测试结果可知,match的方法的特点:
- match方法是从头开始匹配的,从中间截取字符串,是无法匹配到的。这也是match方法的局限性。
- match方法匹配不到结果时,返回的是None,匹配到结果时,返回的是match对象。
- match方法匹配到结果时,使用match对象的group方法,获取匹配结果。
search方法
search方法的语法为:re.search(pattern,string,[flags=0])
pattern 表示要匹配的正则表达式, string 表示要匹配的字符串, flags为标志位,用于控制正则表达式的匹配方式,如是否区分大小写,多行匹配等等,默认为0,代表无特殊匹配。
search方法与match方法有些类似。search是在整个原始字符串查找匹配,匹配到第一个之后,就不会再继续了。
举例:
import re# 原始字符串
old_str = '{"phone_num1":"${not_exist_num}", "phone_num2":"${not_exist_num}", "pwd":"123456"}'# 要查找字符串中的${not_exist_num},原始字符串中有两处, 因为字符串中有特殊字符,所以需要r转义,$在正则中有特殊含义,所以还需要使用\进行转义
replace_str = r'\${not_exist_num}'
replace_str1 = '1111'# 使用search方法
res = re.search(replace_str, old_str)
res1 = re.search(replace_str1, old_str)# 使用group()获取匹配结果
s = res.group()
匹配上则返回match对象,使用group方法获取匹配字符串,匹配不到返回None。(这一点与match一样)
由上面测试结果可知,search的方法的特点:
- search方法是全字符串匹配的,匹配到第一个结果,即返回结果,不再继续。
- search方法匹配不到结果时,返回的是None,匹配到结果时,返回的是match对象。
- search方法匹配到结果时,使用match对象的group方法,获取匹配结果。
findall方法
findall方法的语法是:re.findall(pattern, string, flags=0)
pattern 表示要匹配的正则表达式, string 表示要匹配的字符串, flags为标志位,用于控制正则表达式的匹配方式,如是否区分大小写,多行匹配等等,默认为0,代表无特殊匹配。
findall是查找字符串中所有可匹配的,并将匹配结果以列表的形式返回。如果匹配不到,则返回一个空列表。
import re# 原始字符串
old_str = '{"phone_num1":"${not_exist_num}", "phone_num2":"${not_exist_num}", "pwd":"123456"}'# 要查找字符串中的${not_exist_num},原始字符串中有两处, 因为字符串中有特殊字符,所以需要r转义,$在正则中有特殊含义,所以还需要使用\进行转义
replace_str = r'\${not_exist_num}'
replace_str1 = '1111'# 使用findall方法
res = re.findall(replace_str, old_str)
res1 = re.findall(replace_str1, old_str)
sub方法
sub方法的格式为:re.sub(pattern, repl, string[, count])
pattern为匹配字符,可以是一串字符,也可以是正则表达式,repl要替换的字符串, string为原始字符串, count为替换次数,默认为0。
sub方法使用repl替换string中每一个匹配的子串后返回替换后的字符串。
比如下面一段代码,使用sub实现替换:
import re# 原始字符串
old_str = '{"phone_num1":"${not_exist_num}", "phone_num2":"${not_exist_num}", "pwd":"123456"}'# 要查找字符串中的${not_exist_num},原始字符串中有两处, 因为字符串中有特殊字符,所以需要r转义,$在正则中有特殊含义,所以还需要使用\进行转义
replace_str = r'\${not_exist_num}'
replace_str1 = '111'# 使用sub方法
resu = re.sub(replace_str, "138098776754", old_str) # count 默认为0
res = re.sub(replace_str, "13544567865", old_str, count=1)
res1 = re.sub(replace_str, "13489778966", old_str, count=2)
res2 = re.sub(replace_str1, '222', old_str)
通过调试可知:
- count默认为0时,会默认替换全部,指定count值时,则按照指定次数替换。
- 可匹配到时,则返回匹配到的字符串。
- 无法匹配到时,则返回原始的字符串。
上面这段代码,是直接替换的字符串,还可以通过正则表达式进行替换:
import re# 原始字符串
old_str = 'a123b'# 要替换字符串中的数字,在正则表达式中,\d代表0-9 , 使用r进行转义
replace_str = r'\d'# 使用sub方法
res = re.sub(replace_str, "o", old_str)pass
上面代码进行调试后,原始字符串中的123,均被替换为o:
python中re模块的match、search、findall、sub方法使用相关推荐
- Python中Pickle模块的dump()方法和load()方法
Python中的Pickle模块实现了基本的数据序列与反序列化. 一.dump()方法 pickle.dump(obj, file, [,protocol]) 注释:序列化对象,将对象obj保存到文件 ...
- 使用python中openpyxl模块操作excel文件,计算单元格分子式的相对分子质量(一)
背景:本人是力学专业博士,从事分子动力学模拟,最近需要对结果进行数据分析,其中一项就是计算每一时刻的不同分子式的相对分子质量并将最大相对分子质量输出,换出曲线图.已知,分子式数据均保存在excel文件 ...
- python sys模块作用_浅谈Python中的模块
模块 为了编写可维护的代码,我们把很多函数分组,分别放到不同的文件里,这样,每个文件包含的代码就相对较少,很多编程语言都采用这种组织代码的方式.在Python中,一个.py文件就称之为一个模块(Mod ...
- python中Scipy模块求取积分
python中Scipy模块求取积分的方法: SciPy下实现求函数的积分的函数的基本使用,积分,高等数学里有大量的讲述,基本意思就是求曲线下面积之和. 其中rn可认为是偏差,一般可以忽略不计,wi可 ...
- python中的time库安装步骤-python中time模块需要安装么
time是python自带的模块,用于处理时间问题,提供了一系列的操作时间的函数. time模块中时间表现的格式主要有三种:(推荐学习:Python视频教程) timestamp时间戳,是以秒表示从& ...
- 关于python中requests模块导入问题-python中requests模块的使用方法
本文实例讲述了python中requests模块的使用方法.分享给大家供大家参考.具体分析如下: 在HTTP相关处理中使用python是不必要的麻烦,这包括urllib2模块以巨大的复杂性代价获取综合 ...
- python哪里下载import包-详解python中的模块及包导入
python中的导入关键字:import 以及from import 1.import import一般用于导入包以及模块. 不过有个小问题: (1)当导入的是模块的时候是可以直接可以使用模块内的函数 ...
- python中copy模块的使用,深拷贝和浅拷贝
python中copy模块的使用,深拷贝和浅拷贝 文章目录: 一.copy模块的介绍 1.copy模块 二.copy模块的使用 拓展说明: 1.id( )函数的使用 2.is和== 的区别 pytho ...
- python中的模块和包
模块 一 什么是模块 模块就是一组功能的集合体,可以通过导入模块来复用模块的功能. 比如我在同一个文件夹定义两个.py文件,分别命名为A.py和B.py,那么可以通过在A文件里通过import B来使 ...
最新文章
- System.Diagnostics.Process启动Civil 3D及AutoCAD
- C++指针数组、数组指针、数组名及二维数组技巧汇总
- keras从入门到放弃(三)逻辑回归 softmax
- 【Python】表白代码
- 在STM8单片机中自己实现 printf()函数功能
- ORACLE LATERAL-SQL-INJECTION 个人见解
- Hibernate初次搭建与第一个测试例子
- feignclient url_Feign-自定义FeignClient
- 市民卡怎么登录显示服务器繁忙,2分钟办理一笔业务 杭州网记者体验最具人气的“市民卡”窗口服务...
- 卸载北信源内网桌面监控的完全攻略
- 解决Mac电脑连接校园网不弹出登陆窗口问题汇总
- 洛谷:P1653 猴子(图存储、逆向思维 删边 -->加边)
- 【Python3笔记】五、Python 字符串
- 人脸检测库libfacedetection使用方法
- 一种三分频电路的实现与仿真
- PLP: 4.2/4.3 Attribute Gramma阅读笔记3
- AOJ 2543 Ancient Scrolls
- Codeforces 1546 D. AquaMoon and Chess —— 组合数学,一点点想法
- 借壳上市案例解析-容易理解
- 手机充电器DOE能效认证流程