一:前言

在写着自动化测试的脚本时,重新复习了一下正则表达式findall()方法。为了深化印象,输出点东西,就来写个通过正则表达式爬取菜鸟教程标题的小案例。
参考教程:菜鸟教程之Python正则表达式

二:操作

目标:
爬取菜鸟教程首页所有小标题,并输出在控制台。

目标标题:(红色方框那些,爬取页面全部的小标题)

笔者默认大家都安装了python和安装了谷歌的驱动了。

再看看小标题的组成规律:(H4和“【】”)

上代码:

#!/usr/bin/env python3
# -*- coding:utf-8 -*-from selenium import webdriver
import re
import timeclass runoob():def __init__(self):#获取驱动self.browser = webdriver.Chrome()#确定目标网站self.browser.get("https://www.runoob.com/")#窗口最大化self.browser.maximize_window()#隐性等待3秒,打不开页面才报错self.browser.implicitly_wait(3)def close_window(self):#静待5秒time.sleep(5)#退出页面self.browser.quit()def get_title(self):#获取页面源码self.page = self.browser.page_source#匹配标题。小标题都是H4大小的,并且都被“【】”包围着self.titles = re.findall(r'【(.*?)】</h4>', self.page)#循环输出在控制台for title in self.titles:print(title)if __name__ == '__main__':#创建类runoob = runoob()#调用获取小标题方法runoob.get_title()#调用退出窗口方法runoob.close_window()

三:尾言

笔者演示了正则表达式中findall方法比较常见的用法,如果还想深入了解此方法或其它方法,请多看看菜鸟教程。

Python中正则表达式findall用法相关推荐

  1. 常用正则表达式锦集与Python中正则表达式的用法

    1.常用正则表达式 最简单的正则表达式是普通字符串,只能匹配自身 '[pjc]ython'可以匹配'python'.'jython'.'cython' '[a-zA-Z0-9]'可以匹配一个任意大小写 ...

  2. python中re findall用法_Python---re.findall的用法

    re.findall的用法 在import re中,(re.findall(pattern, string, flags=0)):返回string中所有与pattern相匹配的全部字符串,得到数组 r ...

  3. Python中正则表达式用法 重点格式以这个为准_首看_各种问题

    20210811 https://www.jb51.net/article/101258.htm 一.惰性模式的概念: 此模式和贪婪模式恰好相反,它尽可能少的匹配字符以满足正则表达式即可,例如: va ...

  4. python中max函数用法_Python中max函数用法实例分析

    Python中max函数用法实例分析 更新时间:2015年07月17日 15:45:09 作者:优雅先生 这篇文章主要介绍了Python中max函数用法,实例分析了Python中max函数的功能与使用 ...

  5. python中正则表达式_Python中正则表达式详解

    正则表达式是用来简洁表达一组字符串的表达式,本文主要和大家分享Python 中正则表达式知识详解,希望能帮助到大家.操作符说明实例.表示任何单个字符 [ ]字符集,单个字符取值范围[abc]表示a或b ...

  6. python中正则表达式的简单应用_Python正则表达式详细应用

    原文地址:http://www.jb51.net/article/65286.htm 1.了解正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符.及这些特定字符的组合, ...

  7. count在python中的作用,Python中这个count用法是啥

    Python中这个count用法是啥意思 count 在这里只是一个变量名,你把它换成adict就很好理解了:关于python的一段代码,谁给具体解析一下,特别是 count+=number,在下初中 ...

  8. 五分钟理解yield在python中的简单用法,让你不再迷惑

    很多同学无论是在学习python还是使用python的过程中,都会遇到yield关键字,这个让人头大的问题,今天,就给大家分享一下我自学yield的心路历程 基本概念: (1)在 Python 中,使 ...

  9. format函数python的顺序_[转载] Python中format函数用法

    Python中format函数用法 format优点 format是python2.6新增的格式化字符串的方法,相对于老版的%格式方法,它有很多优点. 1.不需要理会数据类型的问题,在%方法中%s只能 ...

最新文章

  1. 中国最大的python社区-python最大并发
  2. ajax省市联动案例,AJAX案例四:省市联动(示例代码)
  3. Kafka入门教程(转载)
  4. 微信小程序开发02-小程序基本介绍
  5. 启明云端分享| 彩屏化的86控制面板(简称86盒)怎么选型硬件和对比
  6. 网页上有错误(类不能支持 Automation 操作)解决方法
  7. 一个DotNetNuke 皮肤设计参考网站
  8. 支付宝王益:40岁写30年代码是一种什么体验?
  9. 清空邮件队列中的邮件
  10. springcloud使用restTemplate进行服务调用
  11. javascript 原生事件综合查询
  12. 在 Windows Azure 虚拟机上运行 SQL Server 工作负荷的十大注意事项
  13. 安装软件提示计算机管理员权限,安装需要管理员权限怎么办 设置安装软件需要管理员权限的方法教程...
  14. Android进阶之路 - 病毒检测工具
  15. 计算机有文件无法删除,w7文件夹删不掉如何删掉_win7电脑有的文件夹删不掉怎么办...
  16. C++博客十八罗汉造像
  17. C语言基础之汉语拼音读数字
  18. 使用redis实现秒杀功能
  19. Ubuntu安装配置谷歌拼音输入法
  20. 老调重弹之ffmpeg视频时间同步

热门文章

  1. 新手小白学JAVA 面向对象之多态
  2. android开发板配ip,itop4412开发板-Android4.4-设置静态IP
  3. php的数组排序方法,PHP 数组排序方法总结 推荐收藏
  4. UE4 Niagara学习笔记
  5. 神奇的三次握手和四次挥手详解
  6. 《效率人生》-读书笔记
  7. STM32 四轴无人机的设计——处理遥控器PPM信号
  8. 开车适合戴什么款式的耳机,几款适合在开车佩戴的骨传导耳机
  9. css背景图片全屏显示加居中显示
  10. 使用xlsxwriter库将数据存储到excel