• \n:表示第 n 个捕获:

    >> s = "<html><h1>what the fuck!</h1></html>"
    >> p = r"<(.+)><(.+)>(.+)</\2></\1>"# \2 对应第二个捕获,也即 h1,则 </\2> 为:</h1># \1 对应第一个捕获,也即 html,则 </\1> 为:</html>
    >> re.match(p, s).group(3)
    'what the fuck!'

1. 匹配邮箱与html标签

  • 匹配邮箱:

    >> mail = 'zch921005@126.com'
    >> reg = r"(\w{4,20})@(126|qq|gmail|163|outlook)\.(com)"# 正则表达式中不要出现无意义的空格
    >> re.match(reg, mail).group(1)
    'zch921005'
    >> re.match(reg, mail).group(2)
    '126'
    >> 
  • 匹配 html 标签:

    >> s='<div><a href="https://support.google.com/chrome/?p=ui_hotword_search" rel="external nofollow" target="_blank">更多</a><p>dfsl</p></div>'
    >> re.search(r'<a.*>(.*)</a>', s).group(1)
    '更多'

2. 起别名

https://blog.csdn.net/HeatDeath/article/details/70171569

>>> s = '<html><h1>what the fuck!</h1></html>'
>>> p = r"<(?P<key1>.+)><(?P<key2>.+)>(.+)</(?P=key2)></(?P=key1)>"
>> re.match(p, s).group(1)
'html'
>> re.match(p, s).group(2)
'h1'
>> re.match(p, s).group(3)
'what the fuck!'

转载于:https://www.cnblogs.com/mtcnn/p/9420949.html

Python 正则 —— 捕获与分组相关推荐

  1. python正则_Python基础12之Python正则

    上图施工计划,已完成专题: 1.数字专题 2.字符串专题 3.列表专题 4.流程控制专题 5.编程风格专题 6.函数使用专题 7.面向对象编程(上篇) 8.面向对象编程(下篇) 9.Python基础9 ...

  2. python正则匹配_python 正则表达式详解

    正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技能,正则表达式的在不同的语言中使用方式可能 ...

  3. python 基础系列(十二) — python正则

    python 基础系列(十二) - python正则 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独 ...

  4. 「Python ​正则」使用专题总结

    Python实战社群 Java实战社群 长按识别下方二维码,按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群▲ 作者丨zhenguo 来源丨Python与算法社区 ...

  5. python正则模块re

    python正则模块re 一.re模块内置的函数方法 re.compile(pattern, flags=0) https://cdn.analyticsvidhya.com/wp-content/u ...

  6. python 正则指北之我的总结

    本文经本人搜索网络加上个人理解整理而成,如有侵权,请告知,会立即删除! 正则引擎大体上可分为不同的两类:DFA和NFA,而NFA又基本上可以分为传统型NFA和POSIX NFA.DFA Determi ...

  7. re Python正则

    re.compile() 生成正则对象效率最高 # encoding: UTF-8 import re # 将正则表达式编译成Pattern对象 pattern = re.compile(r'hell ...

  8. python 正则学习笔记

    python 正则学习笔记 官方document #1.0 import re m=re.search('(?<=abc)def','cxabcdefgb')print(m.group(0))# ...

  9. python正则表达regex_Python 正则表达式(RegEx)

    版权所有,未经许可,禁止转载 正则表达式是组成搜索模式的字符序列. 正则表达式用于按指定的搜索模式搜索字符串. 正则表达式(RegEx)模块 Python有一个名为re的内置包,用来处理正则表达式. ...

最新文章

  1. C++面试中string类的一种正确写法
  2. php插件 pycharm_原来Pycharm中有这么多好用的插件|Pycharm精选插件
  3. js判断对象还是数组
  4. ubuntu编译ubus及相关依赖库
  5. 单目可见光静默活体检测 Binary or Auxiliary Supervision论文解读
  6. 关于音乐中气息的练习
  7. 获取mysql系统时间
  8. lwip netbuf
  9. 2020年到2021年计算机技术,2020年读计算机技术专业好不好
  10. Shiro框架(一)-Shiro概述
  11. 一键式安装Ubuntu 18.04和Win10双系统并超频的防坑指南
  12. 【工作周报】2019年7月 前端开发工作周报汇总
  13. 封装Selenium2Library
  14. 测试驱动开发之初窥门径
  15. 奥维互动地图如何删除标签_奥维互动地图浏览器标签附件添加设置方法
  16. linux用for循环写九九乘法表,写一个方法,用一个for循环打印九九乘法表
  17. 【List】个人 常用学习工作软件清单
  18. C++学习系列(三)—— 泛型编程(STL)
  19. 2022 中小企业快成长之年,上云 选对平台是关键,这次我站华为云
  20. 一招解决LoadRunner不能录制脚本(录制脚本为空)问题

热门文章

  1. Linux多个端口组合,iptables使用multiport 添加多个不连续端口
  2. c语言创建链表存储10个数,C语言编写的建立单向int链表,连续输入10个结点创建链表,并实现在原链表中插入数字、删除数字、查找数字的功能...
  3. typescript用什么软件写_为什么都2019年了大家还喜欢用TypeScript?
  4. nginx: [emerg] duplicate “log_format“ name “main“ in /usr/local/phpstudy/vhost/sys/nginx/sys.conf:11
  5. form表单中,file选择图片后预览
  6. 【spring-session】 1.x与2.x 不兼容
  7. Java的org.apache.commons.lang3.StringUtils
  8. 计算机组成原lta,计算机组成原理实验三运算器
  9. win7访问linux共享路径不存在,win7系统访问网络共享找不到网络路径如何解决
  10. java中构造器快捷方式_java 构造器 (构造方法)