字符串是我们在编程的时候经常用到的一种数据类型,检查会在字符串里面查找一些内容,对于比较简单的查找,字符串的一些内置的方法就可以处理,对于比较复杂的字符串,或者有一些内容经常变化的字符串查找,那么我们就要引用正则表达式了,正则表达式就是用来匹配一些比较复杂的字符串

re 模块

在python中,如果使用正则表达式的话,需要导入re模块,re模块是一个内置模块,直接import就可以使用。

import re

s = 'be is good is int is '

匹配字符串的几个方法

re.match :

方法接受3个参数,第一个是匹配的规则,也就是正则表达式,第二个就是要查找的字符串,第三个参数不是必填的,用于匹配正则表达式的匹配方式,文章末尾有正则表达式的匹配模式的讲述。

match方法是从字符串中第一个单词中匹配字符串,匹配到就返回一个对象,如果匹配不到,则返回None,而且

必须匹配上第一个单词才行,不然就会报错

e.g

print(re.match(r"be",s).group()) 加上group才能输出显示结果

运行结果:be

print(re.match(r"good",s).group())

运行结果:报错

re.search:

search方法的参数和match一样,和match不一样的是match是从字符串里卖弄的第一个单词里面找,search方法则是从字符串的整个内容找,如果找到了了只返回第一个,找不到就返回None。

print(re.search(r"is",s).group())

运行结果:is

re.findall:

findall方法在参数上和match和search一样,和他们不一样的是,findall会返回所有结果到一个list里面,把所有匹配到的字符串,放到list里,如果找到了只返回第一个,找不到就返回一个空的list

print(re.findall('is',s))

运行结果:['is']

re.sub:

sub 方法和字符串的replace方法一样,是用来替换字符串的,把匹配到的值替换成一个新的字符串,接受3个参数,第一个是正则表达式,第二个是要替换成什么,第三个就要查找的字符串,如果匹配不到的话,返回原来的字符串

print(re.sub(r"good","bad",s))

re.split

split方法和字符串的split方法一样是用来分割字符的,按照匹配的字符串进行分割,返回一个list,如果匹配不到的话,那就返回list中的原来的字符串

print(re.split(',',s))

运行结果:['be is good is in is']

常用的正则表达式符号

数量词

'' 匹配前的字符0次或者多次,只是*前一个字符

print(re.findall(r'be*','very ve v verrrrrr best b'))

运行结果:['be', 'b']

'+' 匹配前一个字符1次或者多次,只是+前面的一个字符

print(re.findall(r'st+','be stt est is best'))

运行结果:['stt', 'st', 'st']

'?' 匹配前一个字符一次或者0次,只是?前面的一个字符

print(re.findall(r'st?','be is best sttt'))

运行结果:['s', 'st', 'st']

'{m}' 匹配前一个字符m次

print(re.findall(r't{2}er','be is bestt better better'))

['tter', 'tter']

'{n,m}' 匹配前一个字符n到m次

print(re.findall(r't{1,3}','sttestttt is best'))

['tt', 'ttt', 't', 't']

一般字符

'.' 默认匹配除\n之外的任意一个字符

print(re.findall(r'b.','be is good ba bg bf bt'))

运行结果:['be', 'ba', 'bg', 'bf', 'bt']

'' 转译符,前面的* + ?这样的字符都有特殊含义了,如果你想就想找它的话,那就得转译了

意思就是说如果你想让特殊字符失去以前的含义,那么就得给它前面加上\

print(re.findall(r'?','besttest is best????'))

运行结果:['?', '?', '?', '?']

'|' 匹配|左或|右的字符

print(re.findall(r'niuhanyang|best','niuhanyang is best'))

['niuhanyang', 'best']

'[]' 字符集合,某些字符的集合,匹配的时候是这个集合里面的任意一个就行

[A-z]大小写字母 [a-z]小写字母 [A-Z]大写字母 [0-9]所有的数字

print(re.findall(r'be[stat]','niuhanyang is best '))

运行结果:['bes']

在[]里面如果用^ 的话代表取反,也就是不包括的这些字符串的

print(re.findall(r'be[^stac]','niuhanyang is best bejson'))

运行结果:['bej']

.就是任意字符串

.+出现一次或者多次的字符串

.?非贪婪模式

边界匹配

'^' 匹配以什么字符开头,多行情况下匹配每一行的开头

print(re.findall(r'^ni','niuhan is good'))

运行结果:['ni']

print(re.findall(r'^b','niuhanyang is good\nbest'))

运行结果:['b']

print(re.findall(r'^b','niuhanyang is good\nbest',re.M))#多行模式

运行结果:['b','b']

'$' 匹配以什么字符结尾,多行情况下匹配每一行的结尾

print(re.findall(r'd$','niuhanyang is good'))

运行结果['d']

priint(re.findall(r'd$','bestbest t is good\nbest is good',re.M))#多行模式 >>>['d','d']

\A' 仅以什么字符开头,和^不同的是它不能用多行模式

print(re.findall(r'\Ayy','yy is good'))

运行结果:['yy']

'\Z' 仅以什么字符结尾,和$不同的是它不能用多行模式

print(re.findall(r'd\Z','jjj is good'))

运行结果:['d']

预定义字符集合

'\d' 匹配数字0-9

print(re.findall(r'\d+','sdf2342312sdfs'))

运行结果:['2342312']

'\D' 匹配非数字

print(re.findall(r'\D','sdf2342312sdfs'))

运行结果:['sdf', 'sdfs']

'\w' 匹配[A-Za-z0-9],也就是所有的字母和数字和中文

print(re.findall(r'\w','sdf234%^2312sdfs&你好'))

运行结果:['sdf234', '2312sdfs,'你好']

'\W' 匹配不是[A-Za-z0-9],也就是不是字母和数字

print(re.findall(r'\W','sdf234%^2312sdfs&'))

运行结果:['%', '^', '&']

'\s' 匹配空白字符、\t、\n、\r,空格

print(re.findall('\s','axss\n\tsdf\t\r\t'))

运行结果:['\n', '\t', '\t', '\r', '\t']

'\S'匹配非空白字符,不是\t、\n、\r,空格

print(re.findall('\S','axss\n\tsdf\t\r\t'))

运行结果:['a', 'x', 's', 's', 's', 'd', 'f']

分组匹配

'(...)' 分组匹配,把某些规则写成在一个组里,这样就可以直接对这个进行一些匹配了,举个例子的话,如果要匹配ip地址的话

ip地址是类似这样的192.168.5.1,每一位都是1位或者3位的数字然后后面有个点正常写的话,得这么写

print(re.findall(r'\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}',"192.168.1.3"))

运行结果: ['192.168.1.3']

这样写的话,有点麻烦了,通过上面的我们可以发现规律,除了第一个后面的全都是'.\d{1,3}',写重复的代码就是低级的,这样的话就可以用分组了

就把'.\d{1,3}'当做一个整体,然后让他们出现3次就ok了,可以改成下面这样的

print(re.search(r'\d{1,3}(.\d{1,3}){3}',"192.168.1.3").group())这个是用search方法的,结果和上面的一样的

运行结果:192.168.1.3

print(re.findall(r'\d{1,3}(.\d{1,3}){3}',"192.168.1.3"))咱们继续用findall方法,发现结果是下面的

运行结果: ['.3']

为啥会这样呢,用match方法和search方法都是正常的,findall方法这里有个坑,就是如果findall方法里面有分组的话,那结果就只是分组里面的内容

,如果想让结果正确的话就在分组最前面写上'?:',一个问号和一个冒号就好了,启用“不捕捉模式”

print(re.findall(r'\d{1,3}(?:.\d{1,3}){3}',"192.168.1.3"))

这么写结果就对了

url = 'vi常用操作'

url='

使用Python生成双色球号码

'

print(re.findall(r'

(.*)

python 正则表达式生成_python正则表达式相关推荐

  1. python 正则表达式生成_Python Create Re Project (python自动生成正则表达式项目)

    CreateRe Python生成正则表达式模块,此模块用来逆向的生成正则表达式.只需要传入待匹配的字符串,以及预期想要匹配出的结果列表,即可以生成一个正则表达式. 当然目前模块还不够成熟,具体表现在 ...

  2. python正则表达式操作指南_Python正则表达式操作指南

    原文作者:A.M. Kuchling (amk@amk.ca) 翻译人员:FireHare 校对人员:Leal 适用版本:Python 1.5 及后续版本 摘要 本文是通过Python的 re 模块来 ...

  3. python正则表达式代码_python正则表达式的使用(实验代码)

    正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配. Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式. re 模块使 Python ...

  4. python findall函数_Python正则表达式

    什么是正则表达式 •正则表达式是字符串处理的有力工具,比字符串自身提供的方法提供了更强大的处理功能. •例如判断一个字符串是否是合法的Email地址,可以通过构造一个规则(正则表达式),去判断字符串是 ...

  5. python正则库_python 正则表达式第三方库 re的基本使用

    re模块简介: 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配,而re模块就是python中实现正则的模块 正则表达式简介: 非打印字符: 非打印字符也可以是正则表达 ...

  6. python 正则表达式判断_Python 正则表达式

    跟随练习: import re original_string = r"ABC\-001" rexp_string = r'\w{3}\\\-\d{3}' result = re. ...

  7. python 正则表达式方法_Python正则表达式一: 基本使用方法

    学习python的正则表达式,主要有两个方面学习: 第一,学习如何写正则表达式,主要是掌握其语法规范.正则表达式的语法规范是通用的,对各种开发语言都是一致的. 第二,学习如何使用正则表达式,也就是掌握 ...

  8. python正则表达式模块_Python正则表达式函数模块

    今天学习了Python中有关正则表达式的知识.关于正则表达式的语法,不作过多解释,网上有许多学习的资料.这里主要介绍python中常用的正则表达式处理函数. 方法/属性 作用 match() 决定 R ...

  9. python正则表达式指南_Python正则表达式指南(转)

    1. 正则表达式基础 1.1. 简单介绍 正则表达式并不是Python的一部分.正则表达式是用于处理字符串的强大工具,拥有自己独特的语法以及一个独立的处理引擎,效率上可能不如str自带的方法,但功能十 ...

最新文章

  1. Google DeepMind围棋程序AlphaGo的分析
  2. imread函数 matlab_地理人,你会用Matlab吗?
  3. zabbix监控系统时间的问题
  4. Javascript 中 JSON 与对象 的相互转换
  5. json解析数组 nlohmann_json解析数组 nlohmann_Nlohmann json学习
  6. java与c语言_Java与C语言的区别之我见
  7. 修改Android Studio默认的gradle配置文件
  8. oracle查询结果怎么去掉重复的,怎么去除重复的查询结果
  9. visual什么颜色好用_口红哪个牌子好用?浓郁显白的口红超合适你der
  10. 税控盘系统参数设置服务器,税控盘设置服务器地址
  11. 自建cdn搭建_在自己的服务器上搭建CDN加速服务的教程
  12. 【经典面试题】css如何画一个三角形?
  13. 如何从一个XtraBackup完整备份中恢复一个InnoDB表
  14. 采用Fuel Gauge可能出现的几种电量现象及解释
  15. Jenkins定时发布项目
  16. C语言noip复赛知识点,NOIP复赛知识点简述及复赛算法总结!
  17. 报错java找不到符号 符号:类xxx位置xxxx
  18. 数据结构实验六 图的综合应用
  19. 微信公众号二次开发 新浪云应用SAE Token验证失败
  20. 手机抓包的两种方法:wireshark抓包和fiddler抓包

热门文章

  1. 小U管家如何加入联盟?
  2. react加水印_React水印组件,支持图片水印,文字水印
  3. 武汉大学计算机系王侃,武汉大学信息管理学院
  4. Android 源码 Camera2 预览流程分析一
  5. Spring Security认证_Remember Me
  6. Api-gateway服务网关gravitee.io的探索之路(一)
  7. 十五天学会Autodesk Inventor,看完这一系列就够了(七),工程图纸
  8. 新款智能枕头为人们的生活带来更佳体验
  9. 1. 响应式编程的前世今生及实践
  10. python+PIL批量制作淘宝主图(头图)及满屏水印添加