Python 正则 —— 捕获与分组
\n:表示第 n 个捕获:
>> s = "<html><h1>what the fuck!</h1></html>" >> p = r"<(.+)><(.+)>(.+)</\2></\1>"# \2 对应第二个捕获,也即 h1,则 </\2> 为:</h1># \1 对应第一个捕获,也即 html,则 </\1> 为:</html> >> re.match(p, s).group(3) 'what the fuck!'
1. 匹配邮箱与html标签
匹配邮箱:
>> mail = 'zch921005@126.com' >> reg = r"(\w{4,20})@(126|qq|gmail|163|outlook)\.(com)"# 正则表达式中不要出现无意义的空格 >> re.match(reg, mail).group(1) 'zch921005' >> re.match(reg, mail).group(2) '126' >>
匹配 html 标签:
>> s='<div><a href="https://support.google.com/chrome/?p=ui_hotword_search" rel="external nofollow" target="_blank">更多</a><p>dfsl</p></div>' >> re.search(r'<a.*>(.*)</a>', s).group(1) '更多'
2. 起别名
https://blog.csdn.net/HeatDeath/article/details/70171569
>>> s = '<html><h1>what the fuck!</h1></html>'
>>> p = r"<(?P<key1>.+)><(?P<key2>.+)>(.+)</(?P=key2)></(?P=key1)>"
>> re.match(p, s).group(1)
'html'
>> re.match(p, s).group(2)
'h1'
>> re.match(p, s).group(3)
'what the fuck!'
转载于:https://www.cnblogs.com/mtcnn/p/9420949.html
Python 正则 —— 捕获与分组相关推荐
- python正则_Python基础12之Python正则
上图施工计划,已完成专题: 1.数字专题 2.字符串专题 3.列表专题 4.流程控制专题 5.编程风格专题 6.函数使用专题 7.面向对象编程(上篇) 8.面向对象编程(下篇) 9.Python基础9 ...
- python正则匹配_python 正则表达式详解
正则表达式是一个很强大的字符串处理工具,几乎任何关于字符串的操作都可以使用正则表达式来完成,作为一个爬虫工作者,每天和字符串打交道,正则表达式更是不可或缺的技能,正则表达式的在不同的语言中使用方式可能 ...
- python 基础系列(十二) — python正则
python 基础系列(十二) - python正则 1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独 ...
- 「Python 正则」使用专题总结
Python实战社群 Java实战社群 长按识别下方二维码,按需求添加 扫码关注添加客服 进Python社群▲ 扫码关注添加客服 进Java社群▲ 作者丨zhenguo 来源丨Python与算法社区 ...
- python正则模块re
python正则模块re 一.re模块内置的函数方法 re.compile(pattern, flags=0) https://cdn.analyticsvidhya.com/wp-content/u ...
- python 正则指北之我的总结
本文经本人搜索网络加上个人理解整理而成,如有侵权,请告知,会立即删除! 正则引擎大体上可分为不同的两类:DFA和NFA,而NFA又基本上可以分为传统型NFA和POSIX NFA.DFA Determi ...
- re Python正则
re.compile() 生成正则对象效率最高 # encoding: UTF-8 import re # 将正则表达式编译成Pattern对象 pattern = re.compile(r'hell ...
- python 正则学习笔记
python 正则学习笔记 官方document #1.0 import re m=re.search('(?<=abc)def','cxabcdefgb')print(m.group(0))# ...
- python正则表达regex_Python 正则表达式(RegEx)
版权所有,未经许可,禁止转载 正则表达式是组成搜索模式的字符序列. 正则表达式用于按指定的搜索模式搜索字符串. 正则表达式(RegEx)模块 Python有一个名为re的内置包,用来处理正则表达式. ...
最新文章
- C++面试中string类的一种正确写法
- php插件 pycharm_原来Pycharm中有这么多好用的插件|Pycharm精选插件
- js判断对象还是数组
- ubuntu编译ubus及相关依赖库
- 单目可见光静默活体检测 Binary or Auxiliary Supervision论文解读
- 关于音乐中气息的练习
- 获取mysql系统时间
- lwip netbuf
- 2020年到2021年计算机技术,2020年读计算机技术专业好不好
- Shiro框架(一)-Shiro概述
- 一键式安装Ubuntu 18.04和Win10双系统并超频的防坑指南
- 【工作周报】2019年7月 前端开发工作周报汇总
- 封装Selenium2Library
- 测试驱动开发之初窥门径
- 奥维互动地图如何删除标签_奥维互动地图浏览器标签附件添加设置方法
- linux用for循环写九九乘法表,写一个方法,用一个for循环打印九九乘法表
- 【List】个人 常用学习工作软件清单
- C++学习系列(三)—— 泛型编程(STL)
- 2022 中小企业快成长之年,上云 选对平台是关键,这次我站华为云
- 一招解决LoadRunner不能录制脚本(录制脚本为空)问题
热门文章
- Linux多个端口组合,iptables使用multiport 添加多个不连续端口
- c语言创建链表存储10个数,C语言编写的建立单向int链表,连续输入10个结点创建链表,并实现在原链表中插入数字、删除数字、查找数字的功能...
- typescript用什么软件写_为什么都2019年了大家还喜欢用TypeScript?
- nginx: [emerg] duplicate “log_format“ name “main“ in /usr/local/phpstudy/vhost/sys/nginx/sys.conf:11
- form表单中,file选择图片后预览
- 【spring-session】 1.x与2.x 不兼容
- Java的org.apache.commons.lang3.StringUtils
- 计算机组成原lta,计算机组成原理实验三运算器
- win7访问linux共享路径不存在,win7系统访问网络共享找不到网络路径如何解决
- java中构造器快捷方式_java 构造器 (构造方法)