Python中正则表达式findall用法
一:前言
在写着自动化测试的脚本时,重新复习了一下正则表达式findall()方法。为了深化印象,输出点东西,就来写个通过正则表达式爬取菜鸟教程标题的小案例。
参考教程:菜鸟教程之Python正则表达式
二:操作
目标:
爬取菜鸟教程首页所有小标题,并输出在控制台。
目标标题:(红色方框那些,爬取页面全部的小标题)
笔者默认大家都安装了python和安装了谷歌的驱动了。
再看看小标题的组成规律:(H4和“【】”)
上代码:
#!/usr/bin/env python3
# -*- coding:utf-8 -*-from selenium import webdriver
import re
import timeclass runoob():def __init__(self):#获取驱动self.browser = webdriver.Chrome()#确定目标网站self.browser.get("https://www.runoob.com/")#窗口最大化self.browser.maximize_window()#隐性等待3秒,打不开页面才报错self.browser.implicitly_wait(3)def close_window(self):#静待5秒time.sleep(5)#退出页面self.browser.quit()def get_title(self):#获取页面源码self.page = self.browser.page_source#匹配标题。小标题都是H4大小的,并且都被“【】”包围着self.titles = re.findall(r'【(.*?)】</h4>', self.page)#循环输出在控制台for title in self.titles:print(title)if __name__ == '__main__':#创建类runoob = runoob()#调用获取小标题方法runoob.get_title()#调用退出窗口方法runoob.close_window()
三:尾言
笔者演示了正则表达式中findall方法比较常见的用法,如果还想深入了解此方法或其它方法,请多看看菜鸟教程。
Python中正则表达式findall用法相关推荐
- 常用正则表达式锦集与Python中正则表达式的用法
1.常用正则表达式 最简单的正则表达式是普通字符串,只能匹配自身 '[pjc]ython'可以匹配'python'.'jython'.'cython' '[a-zA-Z0-9]'可以匹配一个任意大小写 ...
- python中re findall用法_Python---re.findall的用法
re.findall的用法 在import re中,(re.findall(pattern, string, flags=0)):返回string中所有与pattern相匹配的全部字符串,得到数组 r ...
- Python中正则表达式用法 重点格式以这个为准_首看_各种问题
20210811 https://www.jb51.net/article/101258.htm 一.惰性模式的概念: 此模式和贪婪模式恰好相反,它尽可能少的匹配字符以满足正则表达式即可,例如: va ...
- python中max函数用法_Python中max函数用法实例分析
Python中max函数用法实例分析 更新时间:2015年07月17日 15:45:09 作者:优雅先生 这篇文章主要介绍了Python中max函数用法,实例分析了Python中max函数的功能与使用 ...
- python中正则表达式_Python中正则表达式详解
正则表达式是用来简洁表达一组字符串的表达式,本文主要和大家分享Python 中正则表达式知识详解,希望能帮助到大家.操作符说明实例.表示任何单个字符 [ ]字符集,单个字符取值范围[abc]表示a或b ...
- python中正则表达式的简单应用_Python正则表达式详细应用
原文地址:http://www.jb51.net/article/65286.htm 1.了解正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合, ...
- count在python中的作用,Python中这个count用法是啥
Python中这个count用法是啥意思 count 在这里只是一个变量名,你把它换成adict就很好理解了:关于python的一段代码,谁给具体解析一下,特别是 count+=number,在下初中 ...
- 五分钟理解yield在python中的简单用法,让你不再迷惑
很多同学无论是在学习python还是使用python的过程中,都会遇到yield关键字,这个让人头大的问题,今天,就给大家分享一下我自学yield的心路历程 基本概念: (1)在 Python 中,使 ...
- format函数python的顺序_[转载] Python中format函数用法
Python中format函数用法 format优点 format是python2.6新增的格式化字符串的方法,相对于老版的%格式方法,它有很多优点. 1.不需要理会数据类型的问题,在%方法中%s只能 ...
最新文章
- 中国最大的python社区-python最大并发
- ajax省市联动案例,AJAX案例四:省市联动(示例代码)
- Kafka入门教程(转载)
- 微信小程序开发02-小程序基本介绍
- 启明云端分享| 彩屏化的86控制面板(简称86盒)怎么选型硬件和对比
- 网页上有错误(类不能支持 Automation 操作)解决方法
- 一个DotNetNuke 皮肤设计参考网站
- 支付宝王益:40岁写30年代码是一种什么体验?
- 清空邮件队列中的邮件
- springcloud使用restTemplate进行服务调用
- javascript 原生事件综合查询
- 在 Windows Azure 虚拟机上运行 SQL Server 工作负荷的十大注意事项
- 安装软件提示计算机管理员权限,安装需要管理员权限怎么办 设置安装软件需要管理员权限的方法教程...
- Android进阶之路 - 病毒检测工具
- 计算机有文件无法删除,w7文件夹删不掉如何删掉_win7电脑有的文件夹删不掉怎么办...
- C++博客十八罗汉造像
- C语言基础之汉语拼音读数字
- 使用redis实现秒杀功能
- Ubuntu安装配置谷歌拼音输入法
- 老调重弹之ffmpeg视频时间同步