Python + Selenium 练习篇 - 获取页面所有邮箱
代码如下:
# coding=utf-8
import re #python中利用正则,需要导入re模块
from selenium import webdriver
driver = webdriver.Chrome()
driver.maximize_window()
url = ("http://home.baidu.com/contact.html")
driver.get(url)
doc = driver.page_source #获得页面源代码
emails = re.findall(r'[\w]+@[\w\.-]+',doc) #正则表达式,找出xxx@xxx.xxx的字段并保存
for email in emails: #循环打印匹配的邮箱
print (email)
注意:在python正则表达式语法中,python中字符串前面加上r表示原生字符串,用\w表示匹配字母数字及下划线。re模块下findall方法返回的是一个匹配子字符串的列表
转载于:https://www.cnblogs.com/AmyHu/p/8821255.html
Python + Selenium 练习篇 - 获取页面所有邮箱相关推荐
- python selenium定位元素方法,python + selenium 练习篇 - 定位元素的方法
1.利用ID定位元素(能直接通过ID来定位的元素比较少) # coding=utf-8 from selenium import webdriver driver = webdriver.Chrome ...
- Python selenium根据class定位页面元素,xpath定位
Python selenium根据class定位页面元素 在日常的网页源码中,我们基于元素的id去定位是最万无一失的,id在单个页面中是不会重复的.但是实际工作中,很多前端开发人员并未给每个元素都编写 ...
- python+selenium+webdriver 截取全页面长图
有的时候我们要截取整个页面,而不是当前的屏幕. python+selenium+webdriver 截取全页面长图: from selenium import webdriver import tim ...
- Python+Selenium自动化篇-5-获取页面信息
1.获取页面title title:获取当前页面的标题显示的字段 from selenium import webdriver import time browser = webdriver.Chro ...
- 使用Selenium含蓄等待获取页面元素(附带实际业务需求情景)
Hello,大家好,又到了小猿分享技术的时间了.这回带来的是使用Selenium去网站上获取部分信息并且执行部分操作以及"含蓄"等待元素加载完成以及截取图片和网页刷新机制的技术点. ...
- python selenium 元素定位和页面操作
目录 一.浏览器操作 二.简单对象的定位 三.操作测试对象 四.鼠标事件 五.键盘事件 六.获取页面的title和url 七.设置等待时间 八.定位一组对象 九.层级定位 十.多表单切换 十一.多窗口 ...
- python selenium根据url获取cookie信息
在python中如何用 selenium获取指定页面的cookie信息呢? 注意:本实例仅适用于Chrome浏览器,其它浏览器不支持,需要下载对应Chrome浏览器版本的浏览器驱动包. 目录 1.查看 ...
- Python+Selenium练习篇之2-利用ID定位元素
在前面一篇文章,我们介绍了如何摘取页面字段,通过正则进行匹配符合要求的字段.如果感觉有点困难,不能立马理解,没有关系.把字符串摘取放到第一篇,是因为自动化测试脚本,经常要利用字符串操作,字符串切割,查 ...
- python selenium 下拉框 页面变化_python-selenium之select下拉框
注意哦,这里的下拉框是select 属性,小伙伴们别看见下拉框就觉得是select 总结 select 选择:select_by_index() :通过索引定位 select_by_value() ...
最新文章
- 滑动返回类库SwipeBackLayout的使用问题,解决返回黑屏,和看到桌面
- HTML数字自动排序,jquery – HTML中的数字嵌套排序列表
- Java线程池框架核心代码分析
- 面试python开发_python开发面试问题
- 8月| R社区原创作者免费赠书
- SAP ABAP开发实战——从入门到精通系列教程目录
- IDEA 强大文件对比功能
- Java三大体系JavaSE、JavaEE、JavaME的区别
- 畅捷通(chanjet)T3各版本
- 【Word】快速插入参考文献
- unity游戏开发学习笔记
- 更新win7原版镜像中添加usb3.0驱动
- c语言九宫格的递归算法,九宫格 数独 求解 算法 栈实现
- 微型计算机中的rom跟ram关系,STC单片机内部扩展RAM的应用
- Qt Excel进行新增、删除、修改读取从入门到精通
- 解析范式(1NF-4NF)
- 信捷plc c 语言全局变量,三菱PLC编程中,跳转指令CJ、子程序调用CALL和中断指令有什么区别?...
- 在Word里怎么设置每页不同的页眉
- PaddleRec与Milvus深度结合,手把手带你体验工业级推荐系统召回速度
- 编译原理——词法分析(3)有穷自动机中DFA与NFA的理解