selenium提取数据的方法总结
总结下selenium提取数据的几种方法:
1.通过元素标签名提取
driver.find_element_by_tag_name()
2.通过元素class属性
driver.find_element_by_class_name()
3.通过元素id属性
driver.find_element_by_id()
4.通过元素name属性
driver.find_element_by_name()
5.通过链接文本获取超链接
driver.find_element_by_link_text()
比如
笨小孩的博客
提取超链接可以
driver.find_element_by_link_text(‘笨小孩的博客’)
6.通过部分链接文本获取超链接
driver.find_element_by_partial_link_text()
比如
笨小孩的博客
提取超链接可以
driver.find_element_by_partial_link_text(‘笨小孩’)
7.如果要提取属性数据的话,我们可以通过WebElement.get_attribute()
比如:
怎么提取style属性里的值?
我们可以通过提取tag_name【div】 或者id,class属性定位蓝色部分的WebElement,然后附上【.get_attribute(‘style’)】,见代码
from selenium import webdriver
driver=webdriver.Chrome()
style=driver.find_element_by_id('ibm-leadspace-head').get_attribute("style")
8.超实用的xpath提取
登录,翻页,搜索这些功能的实现,无法简单的使用class=’xx’,或id=’xxx’准确定位到需要的元素,这就涉及到Xpath的使用。Xpath 的获取有很多方法,这里详细讲讲最简单的方法——使用Chorme得到Xpath的定位。Chorme浏览器功能很强大,能很好的实现Xpath定位,建议大家使用爬虫的时候优先考虑它。
以拉勾网网址https://www.lagou.com/为例:
单击鼠标右键,选择检查。进入开发者界面,点选左上角网页元素选择。
鼠标移到左边登录键,我们就能看到左边的代码定位了。
按住ctrl+f,调出搜索框。
观察父级子级关系,a标签在li标签之下,class属性为login。
在搜索框中输入验证下,看能否找到。
很好,能找到。我们就可以带入到selenium里面,让selenium和Xpath合作啦~
#登录
login=driver.find_element_by_xpath('//li/a[@class="login"]')
login.click()
以上就是selenium获取数据方法的总结。
————————————————
最后推广下我的wx公众号:BXH_data
selenium提取数据的方法总结相关推荐
- selenium提取数据之driver对象的常用属性和方法
selenium提取数据之driver对象的常用属性和方法 在使用selenium过程中,实例化driver对象后,driver对象有一些常用的属性和方法 driver.page_source 当前标 ...
- selenium提取数据之driver对象定位标签元素获取标签对象的方法
selenium提取数据之driver对象定位标签元素获取标签对象的方法 在selenium中可以通过多种方式来定位标签,返回标签元素对象 find_element_by_id (返回一个元素) fi ...
- Selenium提取数据之标签对象提取文本内容和属性值
Selenium提取数据之标签对象提取文本内容和属性值 find_element仅仅能够获取元素,不能够直接获取其中的数据,如果需要获取数据需要使用以下方法 对元素执行点击操作element.clic ...
- python json接口数据提取_返回数据中提取数据的方法(JSON数据取其中某一个值的方法)...
返回数据中提取数据的方法 比如下面的案例是,取店铺名称 接口返回数据如下: {"Code":0,"Msg":"ok","Data& ...
- python+selenium提取数据
当通过python+selenium在抓取数据的时候,获取不到相应数据时,可以尝试先检查抓出数据的分析界面 html = browser.page_sourcedoc = pq(html)d = do ...
- python获取json中的某个值_json文件返回数据中提取数据的方法(JSON数据取其中某一个值的方法)...
比如下面的案例是,取店铺名称 接口返回数据如下:{"Code":0,"Msg":"ok","Data":{"S ...
- python网络爬虫系列(七)——selenium的介绍 selenium定位获取标签对象并提取数据 selenium的其它使用方法
一.selenium的介绍 知识点: 了解 selenium的工作原理 了解 selenium以及chromedriver的安装 掌握 标签对象click点击以及send_keys输入 1. sele ...
- python爬虫获取标签规则_Python爬虫之数据提取-selenium定位获取标签对象并提取数据...
## selenium提取数据 知识点:了解 driver对象的常用属性和方法 掌握 driver对象定位标签元素获取标签对象的方法 掌握 标签对象提取文本和属性值的方法 1. driver对象的常 ...
- olap 多维分析_如何通过依赖T-SQL从OLAP多维数据集有效地提取数据
olap 多维分析 介绍 (Introduction) Last month I ran two Business Intelligence pre-conferences in South Afri ...
最新文章
- “科研女神”颜宁当选美国科学院外籍院士
- NTU 课程 7454 (5) CNN进阶
- 一款jquery实现的整屏切换特效
- win32中如何使用CString
- vb 打印机 任意尺寸_创新小黑管“省心省力”惠普Laser NS 1020 智能闪充激光打印机...
- android uber源码,Uber SDK in android
- 双极结型三极管的结构、特性、参数
- 大白菜linux系统安装步骤,GRUB简单入门教程
- 380免费云存储_从四个方面分析:云存储服务的特点、影响
- 996工作的人,下班后还有时间锻炼身体和学习吗?还有娱乐生活吗?
- Xencrypt:反病毒绕过工具
- 中国顶级程序员图鉴,最后一个厉害了!
- Linux下为空白SD卡建立BOOT,rootfs分区
- 哥德尔:伟大的数学家与饱受精神疾病折磨的患者
- 网页字体弄成微软雅黑html,网页字体替换为微软雅黑
- Apache 错误日记(Error Log)记录分析
- 1024程序员节最新福利之2018最全java资料集合
- 每日词根——sol(完整可靠安慰,太阳严肃)
- TSN-工业通信的未来在这里?
- 长度厘米转换c语言程序,标准长度单位换算c程序设计.doc