1、match

re.match(pattern, string[, flags])

从首字母开始开始匹配,string如果包含pattern子串,则匹配成功,返回Match对象,失败则返回None,若要完全匹配,pattern要以$结尾。

2、search

re.search(pattern, string[, flags])

若string中包含pattern子串,则返回Match对象,否则返回None,注意,如果string中存在多个pattern子串,只返回第一个。

3、findall

re.findall(pattern, string[, flags])

返回string中所有与pattern相匹配的全部字串,返回形式为数组。

4、finditer

 re.finditer(pattern, string[, flags])

返回string中所有与pattern相匹配的全部字串,返回形式为迭代器。

若匹配成功,match() / search()返回的是Match对象,finditer()返回的也是Match对象的迭代器,获取匹配结果需要调用Match对象的group()groupsgroup(index)方法。

group()groups()group(index)的区别,如下所示:

>>> import re
>>> s = '23432werwre2342werwrew'
>>> p = r'(\d*)([a-zA-Z]*)'
>>> m = re.match(p,s)
>>> m.group()
'23432werwre'
>>> m.group(0)
'23432werwre'
>>> m.group(1)
'23432'
>>> m.group(2)
'werwre'
>>> m.groups()
('23432', 'werwre')
>>> m = re.findall(p,s)
>>> m
[('23432', 'werwre'), ('2342', 'werwrew'), ('', '')]
>>> p=r'(\d+)'
>>> m=re.match(p,s)
>>> m.group()
'23432'
>>> m.group(0)
'23432'
>>> m.group(1)
'23432'
>>> m.groups()
('23432',)
>>> m=re.findall(p,s)
>>> m
['23432', '2342']
  • group():母串中与模式pattern匹配的子串;
  • group(0):结果与group()一样;
  • groups():所有group组成的一个元组,group(1)是与patttern中第一个group匹配成功的子- 串,group(2)是第二个,依次类推,如果index超了边界,抛出IndexError;
  • findall():返回的就是所有groups的数组,就是group组成的元组的数组,母串中的这一撮组成一个元组,那一措组成一个元组,这些元组共同构成一个list,就是findall()的返回结果。另,如果groups是只有一个元素的元组,findall的返回结果是子串的list,而不是元组的list了。

例子

s ="1113446777"

用正则表达式把s分为1111, 3, 44, 6, 777

import  re
s ="1113446777"
m=re.findall(r'(\d)\1*',s)
print(m)
#['1', '3', '4', '6', '7']m = re.search(r'(\d)\1*',s)
print(m.group())        #111
print(m.groups())       #('1',)
print(m.groups(0))      #('1',)
print(m.groups(1))      #('1',)
>>> m.group(2)
Traceback (most recent call last):File "<stdin>", line 1, in <module>
IndexError: no such group
>>> m=re.finditer(r'(\d)\1*',s)
>>> m.next().group()
'111'
>>> m.next().group()
'3'
>>> m.next().group()
'44'
>>> m.next().group()
'6'
>>> m.next().group()
'777'
>>> m.next().group()
Traceback (most recent call last):File "<stdin>", line 1, in <module>
StopIteration
>>> p = r'(\d)\1+([a-zA-Z]+)'
>>> s = '1111werwrw3333rertert4444'
>>> p = r'(\d)\1+([a-zA-Z]*)'
>>> import re
>>> re.findall(p,s)
[('1', 'werwrw'), ('3', 'rertert'), ('4', '')]
>>> m = re.search(p,s)
>>> m.group()
'1111werwrw'
>>> m.group(1)
'1'
>>> m.group(2)
'werwrw'
>>> m.groups()
('1', 'werwrw')
>>> m = re.finditer(p,s)
>>> m.next().group()
'1111werwrw'
>>> m.next().group()
'3333rertert'
>>> m.next().group()
'4444'
>>> m.next().group()
Traceback (most recent call last):File "<stdin>", line 1, in <module>
StopIteration

Python:正则表达式match、search、findall、finditer区别,group()、groups()与group(index)的区别相关推荐

  1. Python 正则表达式 match、findall、search

    今天在练习爬虫的时候,居然发现不会用python正则提取数据,特地来总结一下python的常用三个数据提取函数 先来看一下 match 和 search 的区别:match 并不会扫描整个字符串,只会 ...

  2. Python正则表达式中使用findall函数遇到括号嵌套的小坑

    1.findall函数 我们都知道括号在正则表达式中起到了分类的作用,但当定义好一个自己的字符匹配模式(含有括号)后,使用findall()函数会遇到一点小坑. 具体来说就是: 可以发现是否将整个正则 ...

  3. python 正则表达式 re.search

    1 #coding:utf-8 2 import re 3 4 #将正则表达式编译为pattern对象 5 #compile(pattern, flags=0) 6 #Compile a regula ...

  4. python 正则表达式 re.search() 的使用

    1 re.search() 的作用: re.search会匹配整个字符串,并返回第一个成功的匹配.如果匹配失败,则返回None 从源码里面可以看到re.search()方法里面有3个参数 patter ...

  5. Python正则表达式介绍 re.findall(pattern, str, flag=0)/re.I re.L re.M

    Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. re.findall(pattern, str, flag=0) 共三个参数,patter ...

  6. Python正则表达式:match(),search(),findall()与finditer()的用法

    https://blog.csdn.net/qq_39521554/article/details/79462405

  7. python search返回值_python正则表达式--match search方法

    1.re.match函数 re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回None. (1)函数语法: re.match(pattern,str ...

  8. python正则表达式match,search,find的使用方法

    1.使用match()匹配字符串: match()函数试图从字符串的开始部分对模式进行匹配, 匹配对象的group()方法能够用于显示那个成功的匹配. >>>import re &g ...

  9. python正则表达式查找(findall)

    在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表. 注意: match 和 search 是匹配一次 findall 匹配所有. 语法格式为: findall ...

最新文章

  1. 使用 Smartmontools 检测硬盘坏道
  2. 连这几个源码都没啃透,那面试高级开发的事等等再来!
  3. Spring之DAO二
  4. PHP-7.1 源代码学习:虚拟机字节码
  5. 去除EditPlus自动备份功能. bak
  6. 先滑窗后时空联合处理MATLAB,时空联合优化重建方法及系统与流程
  7. resultMap与resultType、parameterMap与 parameterType的区别
  8. 字符串模式匹配(bf+KMP)
  9. 2018年春季软件工程教学设计(初稿)
  10. Flutter安装、配置、初体验 windows 版
  11. 2022年湖北师范大学招生简章--成人高等教育高起专、专升本学历提升
  12. HTTPS 免费证书,免费 ssl 证书,FreeSSL.org 申请多种免费证书
  13. 介绍一个免费的开源网站(BootCDN)
  14. Keras深度学习实战——信用预测
  15. 一种灵活可靠的工作方式:组件化设计与开发
  16. zxl-机器学习-01
  17. 从原始文档到KNN分类算法实现(一)
  18. 串口流控(CTS/RTS)使用详解
  19. 需要证件照怎么办?教你如何自己在线做照片
  20. 4月8日--Date的使用方法

热门文章

  1. v512工作室_Java高端培训系列视频--2010年4月12日最新更新
  2. easy excel生成简单表格
  3. Django多表操作
  4. 胜利考科目二,彭州考科目三
  5. AD生成BOM表/元器件清单
  6. 树状数组uva12086
  7. 前后台Base64加密解密
  8. java创建临时文件的路径问题
  9. 谷歌个人pin码验证
  10. nupt-acm1011