python中re模块_python之re模块
python 中使用正则表达式需要引入re模块,用来匹配处理字符串
如:
import re #第一步,要引入re模块
a = re.findall("匹配规则", "要匹配的字符串") #第二步,调用模块函数
以列表形式返回匹配到的字符串
1、普通字符和11个元字符:
普通字符匹配自身abcabc.匹配任意除换行符"\n"外的字符(在DOTALL模式中也能匹配换行符a.cabc
\转义字符,使后一个字符改变原来的意思a\.c;a\\ca.c;a\c
*匹配前一个字符0或多次abc*ab;abccc
+匹配前一个字符1次或无限次abc+abc;abccc
?匹配一个字符0次或1次abc?ab;abc
^匹配字符串开头。在多行模式中匹配每一行的开头^abcabc
$匹配字符串末尾,在多行模式中匹配每一行的末尾abc$abc
|或。匹配|左右表达式任意一个,从左到右匹配,如果|没有包括在()中,则它的范围是整个正则表达式abc|defabc
def
{}{m}匹配前一个字符m次,{m,n}匹配前一个字符m至n次,若省略n,则匹配m至无限次ab{1,2}cabc
abbc
[]字符集。对应的位置可以是字符集中任意字符。字符集中的字符可以逐个列出,也可以给出范围,如[abc]或[a-c]。[^abc]表示取反,即非abc。所有特殊字符在字符集中都失去其原有的特殊含义。用\反斜杠转义恢复特殊字符的特殊含义。a[bcd]eabe
ace
ade
()被括起来的表达式将作为分组,从表达式左边开始没遇到一个分组的左括号“(”,编号+1.分组表达式作为一个整体,可以后接数量词。表达式中的|仅在该组中有效。(abc){2}a(123|456)cabcabc
a456c
2、预定义字符集(可以写在字符集[...]中)
\d数字:[0-9]a\bca1c\D非数字:[^\d]a\Dcabc
\s匹配任何空白字符:[<空格>\t\r\n\f\v]a\sca c
\S非空白字符:[^\s]a\Scabc
\w匹配包括下划线在内的任何字字符:[A-Za-z0-9_]a\wcabc
\W匹配非字母字符,即匹配特殊字符a\Wca c
\A仅匹配字符串开头,同^\Aabcabc
\Z仅匹配字符串结尾,同$abc\Zabc
\b匹配\w和\W之间,即匹配单词边界匹配一个单词边界,也就是指单词和空格间的位置。例如, 'er\b' 可以匹配"never" 中的 'er',但不能匹配 "verb" 中的 'er'。\babc\ba\b!bc空格abc空格a!bc
\B[^\b]a\Bbcabc
模块函数:
1、compile()
编译正则表达式字符串,返回一个对象。该对象可以直接以 . 的方式访问模块函数
格式:
re.compile(pattern,flags=0)
pattern: 编译时用的表达式字符串。
flags 编译标志位,用于修改正则表达式的匹配方式,如:是否区分大小写,多行匹配等。
2、match()
从字符串头部开始匹配。//注:这个方法并不是完全匹配。当pattern结束时若string还有剩余字符,仍然视为成功。想要完全匹配,可以在表达式末尾加上边界匹配符'$'
格式:
re.match(pattern, string, flags=0)
3、search()
格式:
re.search(pattern, string, flags=0)
re.search函数会在字符串内查找模式匹配,只要找到第一个匹配然后返回,如果字符串没有匹配,则返回None。
4、findall()
re.findall遍历匹配,获取字符串中所有匹配的子串,返回一个列表。
格式:
re.findall(pattern, string, flags=0)
python中re模块_python之re模块相关推荐
- python中options类_Python的OptionParser模块
Python中强大的选项处理模块. 示例 #!/usr/bin/pythonfrom optparse import OptionParser parser = OptionParser() pars ...
- Python中import导入上一级目录模块及循环import问题的解决
Python中import导入上一级目录模块及循环import问题的解决 参考文章: (1)Python中import导入上一级目录模块及循环import问题的解决 (2)https://www.cn ...
- Python中第三方的库(library)、模块(module),包(package)的安装方法以及ImportError: No module named...
Python中,想要安装第三方安装包,即third library,package等,对于熟悉的人来说,很简单. 但是对于新手,至少对于之前的我,很难,往往只是安装一个很小的包,都被搞得一头雾水. 现 ...
- python中使用sys模板和logging模块获取行号和函数名的方法
From: http://www.jb51.net/article/49026.htm 这篇文章主要介绍了python中使用sys模板和logging模块获取行号和函数名的方法,需要的朋友可以参考下 ...
- python保存模块_Python使用Pickle模块进行数据保存和读取的讲解
pickle 是一个 python 中, 压缩/保存/提取 文件的模块,字典和列表都是能被保存的. 但必须注意的是python2以ASCII形式保存,而在python3中pickle是使用转换二进制的 ...
- python内建模块_Python 内建模块
1.内建模块: 在Python中,有一个内建模块,该模块中有一些常用函数;而该模块在Python启动后.且没有执行程序员所写的任何代码前,Python会首先加载该内建函数到内存.另外,该内建模块中的功 ...
- python中文件分类_Python中的类是否在不同的文件中?
在Python中,一个文件称为 module.一个模块可以由多个类或函数组成. 由于Python不仅仅是一种OO语言,所以没有规则说明,一个文件只能包含一个类. 一个文件(模块)应该包含属于一起的类/ ...
- python中options类_python中的optionParser模块
Python 有两个内建的模块用于处理命令行参数: 一个是 getopt,<Deep in python>一书中也有提到,只能简单处理 命令行参数: 另一个是 optparse,它功能强大 ...
- python中sys用法_python中os和sys模块的区别与常用方法总结
python 的 python中os和sys模块的区别与常用方法总结 前言 本文主要介绍了关于python中os和sys模块区别与常用方法的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看 ...
最新文章
- 牛客国庆集训派对Day2 F、平衡二叉树 【构造+记忆化搜索】
- Java把以0结尾的字符串_Java中字符串为什么不以\0结尾
- linux常见命令_Linux系统常见命令
- springboot整合shiro地址栏JSESSIONID问题
- system.gc 性能_使用这些先进的GC技术提高应用程序性能
- C语言运算符及其优先级汇总表口诀
- 利用jquery修改elment的自定义组件多选框el-select(修改多选框的颜色)
- php mail centos_centos怎么发送邮件
- python安装后无法使用_Python在终端通过pip安装好包以后在Pycharm中依然无法使用的问题(三种解决方案)...
- POJ3342 Party at Hali-Bula(树型DP求最大独立集+唯一解判断)
- web之JavaScript
- Sql查找断号区间...
- 【跃迁之路】【590天】程序员高效学习方法论探索系列(实验阶段347-2018.09.18)...
- 学习乔布斯的成功方法
- 5-2 jmu-java-m05-自定义Judgeable接口 (10分)
- README.md的内容格式
- 凭算法突围,一战赚了 1090 亿,“恐怖” 的张一鸣!
- 1178_hardware_basic_什么是高阻态
- 关爱亚孤儿 我们在行动——九巨龙肥城市京欣学校走进聊城市东昌府区
- 网站如何引入外部字体 [可自定义]/个人博客/爱骇客
热门文章
- python字典遍历 没有顺序_Python中字典的顺序问题(为什么实践发现字典的遍历和方法popitem并不是随机的?)...
- 18张颠覆三观的照片!
- CVPR 2021 | 跨模态点云补全新框架ViPC:用单一视图推断完整信息
- 吉林大学不如温州大学,泰晤士最新世界大学排名引发争议
- 高铁是如何跑起来?列车头顶高压线为什么磨不坏?
- 办学10年,进入全国前10名!这所神奇的高校,迎来10岁生日
- 斯坦福华人教授:声波、光波,其实都是RNN!机器学习模型对应
- 博士生的deadline血泪史,这是一份来自Nature的避坑指南
- 理工男最该死的十二个瞬间
- 用人工智能来喂鱼:喂多少智能算法说了算