写在前面:
此博客仅用于记录个人学习进度,学识浅薄,若有错误观点欢迎评论区指出。欢迎各位前来交流。(部分材料来源网络,若有侵权,立即删除)
传送门:

day01基础知识
day02知识分类
day03运算符
day04数字与字符串
day05列表
day06元组与字典
day07条件与循环
day08函数概念
day09数据结构
day10模块介绍
day11文件操作
day12编程学习
day13编程学习
day14编程学习
day15编程学习
day16编程学习
day17编程学习
day18编程学习

Python学习:day21

  • Python正则表达式
      • 定位符
    • 选择
    • 反向引用

Python正则表达式

  • / * 和 + 限定符都是贪婪的,因为它们会尽可能多的匹配文字,只有在它们的后面加上一个 ? 就可以实现非贪婪或最小匹配。
/<.*>/
  • 贪婪:表达式匹配从开始小于符号 (<) 到关闭 h1 标记的大于符号 (>) 之间的所有内容。
  • 通过在 *、+ 或 ? 限定符之后放置 ?,该表达式从"贪婪"表达式转换为"非贪婪"表达式或者最小匹配。

定位符

  • 定位符使您能够将正则表达式固定到行首或行尾。它们还使您能够创建这样的正则表达式,这些正则表达式出现在一个单词内、在一个单词的开头或者一个单词的结尾。
  • 定位符用来描述字符串或单词的边界,^ 和 $ 分别指字符串的开始与结束,\b 描述单词的前或后边界,\B 表示非单词边界。
  • 正则表达式的定位符有:
字符 描述
^ 匹配输入字符串开始的位置。如果设置了 RegExp 对象的 Multiline 属性,^ 还会与 \n 或 \r 之后的位置匹配。
$ 匹配输入字符串结尾的位置。如果设置了 RegExp 对象的 Multiline 属性,$ 还会与 \n 或 \r 之前的位置匹配。
\b 匹配一个单词边界,即字与空格间的位置。
\B 非单词边界匹配。
  • 能将限定符与定位符一起使用。由于在紧靠换行或者单词边界的前面或后面不能有一个以上位置,因此不允许诸如 ^* 之类的表达式。
  • 若要匹配一行文本开始处的文本,请在正则表达式的开始使用 ^ 字符。不要将 ^ 的这种用法与中括号表达式内的用法混淆。
  • 若要匹配一行文本的结束处的文本,请在正则表达式的结束处使用 $ 字符。
  • 若要在搜索章节标题时使用定位点,下面的正则表达式匹配一个章节标题,该标题只包含两个尾随数字,并且出现在行首:
/^Chapter [1-9][0-9]{0,1}/
  • 真正的章节标题不仅出现行的开始处,而且它还是该行中仅有的文本。它即出现在行首又出现在同一行的结尾。下面的表达式能确保指定的匹配只匹配章节而不匹配交叉引用。通过创建只匹配一行文本的开始和结尾的正则表达式,就可做到这一点。
/^Chapter [1-9][0-9]{0,1}$/
  • 匹配单词边界稍有不同,但向正则表达式添加了很重要的能力。单词边界是单词和空格之间的位置。非单词边界是任何其他位置。下面的表达式匹配单词 Chapter 的开头三个字符,因为这三个字符出现在单词边界后面:
/\bCha/
  • \b 字符的位置是非常重要的。如果它位于要匹配的字符串的开始,它在单词的开始处查找匹配项。如果它位于字符串的结尾,它在单词的结尾处查找匹配项。例如,下面的表达式匹配单词 Chapter 中的字符串 ter,因为它出现在单词边界的前面:
/ter\b/
  • 下面的表达式匹配 Chapter 中的字符串 apt,但不匹配 aptitude 中的字符串 apt:
/\Bapt/
  • 字符串 apt 出现在单词 Chapter 中的非单词边界处,但出现在单词 aptitude 中的单词边界处。对于 \B 非单词边界运算符,位置并不重要,因为匹配不关心究竟是单词的开头还是结尾。

选择

  • 用圆括号将所有选择项括起来,相邻的选择项之间用|分隔。但用圆括号会有一个副作用,使相关的匹配会被缓存,此时可用?:放在第一个选项前来消除这种副作用。
  • 其中 ?: 是非捕获元之一,还有两个非捕获元是 ?= 和 ?!,这两个还有更多的含义,前者为正向预查,在任何开始匹配圆括号内的正则表达式模式的位置来匹配搜索字符串,后者为负向预查,在任何开始不匹配该正则表达式模式的位置来匹配搜索字符串。

反向引用

  • 对一个正则表达式模式或部分模式两边添加圆括号将导致相关匹配存储到一个临时缓冲区中,所捕获的每个子匹配都按照在正则表达式模式中从左到右出现的顺序存储。缓冲区编号从 1 开始,最多可存储 99 个捕获的子表达式。每个缓冲区都可以使用 \n 访问,其中 n 为一个标识特定缓冲区的一位或两位十进制数。
  • 可以使用非捕获元字符 ?:、?= 或 ?! 来重写捕获,忽略对相关匹配的保存。
  • 反向引用的最简单的、最有用的应用之一,是提供查找文本中两个相同的相邻单词的匹配项的能力。
    以下面的句子为例:

Is is the cost of of gasoline going up up?

var str = "Is is the cost of of gasoline going up up";
var patt1 = /\b([a-z]+) \1\b/ig;
document.write(str.match(patt1));
  • 捕获的表达式,正如 [a-z]+ 指定的,包括一个或多个字母。正则表达式的第二部分是对以前捕获的子匹配项的引用,即,单词的第二个匹配项正好由括号表达式匹配。\1 指定第一个子匹配项。
  • 单词边界元字符确保只检测整个单词。否则,诸如 “is issued” 或 “this is” 之类的词组将不能正确地被此表达式识别。
  • 正则表达式后面的全局标记 g 指定将该表达式应用到输入字符串中能够查找到的尽可能多的匹配。
  • 表达式的结尾处的不区分大小写 i 标记指定不区分大小写。
  • 多行标记指定换行符的两边可能出现潜在的匹配。
  • 反向引用还可以将通用资源指示符 (URI) 分解为其组件。假定您想将下面的 URI 分解为协议(ftp、http 等等)、域地址和页/路径:
    http://www.runoob.com:80/html/html-tutorial.html
var str = "http://www.runoob.com:80/html/html-tutorial.html";
var patt1 = /(\w+):\/\/([^/:]+)(:\d*)?([^# ]*)/;
arr = str.match(patt1);
for (var i = 0; i < arr.length ; i++) {document.write(arr[i]);document.write("<br>");
}
  • 第三行代码 str.match(patt1) 返回一个数组,实例中的数组包含 5 个元素,索引 0 对应的是整个字符串,索引 1 对应第一个匹配符(括号内),以此类推。
  • 第一个括号子表达式捕获 Web 地址的协议部分。该子表达式匹配在冒号和两个正斜杠前面的任何单词。
  • 第二个括号子表达式捕获地址的域地址部分。子表达式匹配非 : 和 / 之后的一个或多个字符。
  • 第三个括号子表达式捕获端口号(如果指定了的话)。该子表达式匹配冒号后面的零个或多个数字。只能重复一次该子表达式。
  • 最后,第四个括号子表达式捕获 Web 地址指定的路径和 / 或页信息。该子表达式能匹配不包括 # 或空格字符的任何字符序列。
  • 将正则表达式应用到上面的 URI,各子匹配项包含下面的内容:
    第一个括号子表达式包含 http
    第二个括号子表达式包含 www.runoob.com
    第三个括号子表达式包含 :80
    第四个括号子表达式包含 /html/html-tutorial.html

end
明天继续

Python学习:day21正则表达式相关推荐

  1. python 学习总结----正则表达式

    python 学习总结----正则表达式 正则表达式应用场景- 特定规律字符串的查找,切割,替换 - 邮箱格式:URl,IP地址等的校验 - 爬虫项目中,特定内容的提取使用原则- 只要使用字符串等函数 ...

  2. python学习笔记 正则表达式 详解2

    python学习笔记 正则表达式 详解 行定位符 行定位符就是用来描述子串的边界."^"表示行的开始:"$"表示行的结尾 ^tm:匹配以子串tm的开始位置是行头 ...

  3. 菜菜的Python学习日记 | 正则表达式你必须了解的知识点

    系列索引:菜菜的Python学习日记 | Python从入门到入土详解 文章目录 常用规则 Python对正则表达式的支持 常用规则 符号 解释 示例 说明 . 匹配任意字符 b.t 可以匹配bat ...

  4. 【python学习】正则表达式入门

    python正则表达式入门学习 前言 今天进入python正则表达式的入门学习 学习正则表达式的初衷还是为了awd比赛做准备 (好吧,其实学习python都是为了ctf啊) 学习的目的就是为了可以提取 ...

  5. Python学习16 正则表达式2 re模块

    re 模块 re 模块: Python的 re 模块实现了正则表达式处理的功能. 导入re模块后,使用findall.search函数可以进行匹配 查找:match和search 多个匹配上的,也只会 ...

  6. Python学习 Day30 正则表达式(二)

    正则表达式(二) (一)预定义类 预定义类:这个术语,这些特定符号只能在正则表达式中使用 预定义类 作用 \d [0-9] \d可以匹配任意[一个]数字字符 \D 非[0-9] \D匹配任意[一个]不 ...

  7. python学习之 ---正则表达式规则与正则表达式在python的应用

    正则表达式 概述 正则表达式30分钟快速入门 正则表达式是文本处理极为重要的技术,用它可以对字符串按照某种规则进行检索,替换 分类 BRE 基本正则表达式,grep.sed.vi等软件支持.vim有扩 ...

  8. python学习之正则表达式练习:编写一个计算器

    #!/usr/bin/env python import re def deal_negative_issue(calc_list):     new_calc_list=[]    #定义一个新的空 ...

  9. Python学习15 正则表达式1

    网址 正则表达式测试网址:https://regex101.com/ 概述 正则表达式: 正则表达式(Regular Expression)是一种文本模式,包括普通字符(例如,a 到 z 之间的字母) ...

  10. Python学习 Day29 正则表达式(一)

    正则表达式(一) (一)正则的基本使用方法 正则表达式是用于匹配字符串的一种模式.方法 正则表达式:regular expression,简称RegExp 正则表达式定义最常用的方法是字面量,写法// ...

最新文章

  1. R语言dplyr包获取dataframe分组聚合的最大值实战(Maximum Value by Group)
  2. 【Python-ML】自适应线性神经网络(Adaline)
  3. 车载安卓导航一键root_听说比Carplay牛 率先体验华为HiCar车载互联
  4. 用栈实现括号匹配的检验
  5. 【简便代码】1082 射击比赛 (20分)_17行代码AC
  6. linux如何切换到光盘,怎么刻录cd光盘-Linux切换目录之cd命令详解
  7. win下python2,3和pip2,3双版本共存
  8. 并行开发 —— 第六篇 异步编程模型
  9. 前端学习(1974)vue之电商管理系统电商系统之完成删除的操作
  10. Python与数据库[2] - 关系对象映射/ORM[4] - sqlalchemy 的显式 ORM 访问方式
  11. java基础面试题之:String 类的常用方法都有那些?
  12. mysql5.1免安装版配置_mysql5.1免安装版配置
  13. 如何把程序挂在远端服务器python_Pycharm连接远程服务器并实现远程调试的实现...
  14. 随想录(平台软件和项目代码)
  15. spring security3.x学习(3)_初探过滤器机制和auto-config用法
  16. Xcode Message from debugger: Terminated due to memory issue
  17. java 大小写转换函数_java字符串大小写转换的两种方法
  18. 97. Interleaving String
  19. Java手机验证码的实现
  20. 第一次开发EOS区块链的经验总结

热门文章

  1. tensorflow没有代码提示的问题
  2. VMware player桥接模式不能联网的解决方法
  3. 泰克示波器截屏软件-Tektronix示波器上位机-OpenChoice安装。示波器波形发文章论文
  4. 区分PO,VO,DAO,BO,POJO
  5. 20180908 2018-2019-2 《密码与安全新技术专题》第3周作业
  6. Codeforces - 814B - An express train to reveries - 构造
  7. angular.forEach()
  8. javaweb课程PSP(1)
  9. NYOJ 1077 【博弈+大整数取模】
  10. django 指令  基于the django book