Selenium 获取文本信息方法+select(定位)
1.通过先定位到具体的元素然后通过text方法获取文本信息,如获取控件名称等
driver.find_element_by_xpath("//div[/h1").text
2.直接通过定位到的元素的属性直接获取属性名称,如输入框提示信息等
driver.find_element_by_id("XXX").get_attribute(YYY)
启发:元素的定位可以先定位到大的颗粒度,在向小的颗粒度定位,例如先定位到table,在定位到table中的行和列
代码如下:
此处为写的获取第一列元素的list的方法
- def listcontent(driver, path):
- table = driver.find_element_by_xpath(path)
- rows = table.find_elements_by_tag_name("tr")
- rowname = []
- for row in rows[1:]:
- col = row.find_element_by_xpath("td[1]/a")
- rowname.append(col)
如果得到的文本只为空,而非我们期望的baidu,那么当前定位的元素可能被隐藏了。
1.判断是否被隐藏 。 driver.find_element_by_xx().is_displayed()
打印结果,如果得到 false的结果.那就说明被隐藏了
2.怎么解决?
方法一: 修改页面当前定位元素,或者当前元素父元素的CSS,使元素的is_displayed() 值为true.
方法二: is_displayed() 为false的元素,依然可以通过getAttribute()方法获取元素的属性.
由于
webdriver spec
的定义,Selenium WebDriver 只会与可见元素交互,所以获取隐藏元素的文本总是会返回空字符串。
可是,在某些情况下,我们需要获取隐藏元素的文本。这些内容可以使用element.attribute('attributeName')
, 通过textContent
,innerText
,innerHTML
等属性获 取。(划重点)innerHTML
会返回元素的内部 HTML, 包含所有的HTML标签。
例如,<div>Hello <p>World!</p></div>
的innerHTML
会得到Hello <p>World!</p>
textContent
和innerText
只会得到文本内容,而不会包含 HTML 标签。textContent
是 W3C 兼容的文字内容属性,但是 IE 不支持innerText
不是 W3C DOM 的指定内容,FireFox不支持
1、Select元素
1.打开百度-设置-搜索设置界面,如下图所示
2.箭头所指位置,就是 select 选项框,打开页面元素定位,下方红色框框区域,可以看到 select 标签属性:
<select id="nr" name="NR">
3.选项有三个
<option selected="" value="10">每页显示 10 条</option>
<option value="20">每页显示 20 条</option>
<option value="50">每页显示 50 条</option>2、定位select
定位select有多种方法,下面进行一一介绍
2.1 二次定位
1.定位 select 里的选项有多种方式,这里先介绍一种简单的方法:二次定位
2.基本思路,先定位 select 框,再定位 select 里的选项完整代码如下:
123456789101112131415# coding:utf-8
from
selenium
import
webdriver
from
selenium.webdriver.common.action_chains
import
ActionChains
driver
=
webdriver.Firefox()
driver.get(
"https://www.baidu.com/"
)
driver.implicitly_wait(
20
)
mouse
=
driver.find_element_by_link_text(
"设置"
)
ActionChains(driver).move_to_element(mouse).perform()
driver.find_element_by_link_text(
"搜索设置"
).click()
s
=
driver.find_element_by_id(
"nr"
)
s.find_element_by_xpath(
"//option[@value='50']"
).click()
# 二次定位另外一种写法
driver.find_element_by_id(
"nr"
).find_element_by_xpath(
"//option[@value='50']"
).click()
3.还有另外一种写法也是可以的,把最下面两步合并成为一步:
driver.find_element_by_id("nr").find_element_by_xpath("//option[@value='50']").click()
2.2 直接定位
1.有很多小伙伴说 firebug 只能定位到 select 框,还能定位里面的选项。
2.用 direbug 定位到 select 后,下方查看元素属性地方,点 select 标签前面的+号,就可以展开里面的选项内容了。3.然后自己写 xpath 定位或者 css,一次性直接定位到 option 上的内容。
完整代码如下:
12345678910111213# coding:utf-8
from
selenium
import
webdriver
from
selenium.webdriver.common.action_chains
import
ActionChains
driver
=
webdriver.Firefox()
driver.get(
"https://www.baidu.com/"
)
driver.implicitly_wait(
20
)
mouse
=
driver.find_element_by_link_text(
"设置"
)
ActionChains(driver).move_to_element(mouse).perform()
driver.find_element_by_link_text(
"搜索设置"
).click()
# 直接点位
driver.find_element_by_xpath(
".//*[@id='nr']/option[2]"
).click()
2.3 Select 模块(index)点位
1.除了上面介绍的两种简单的方法定位到 select 选项,selenium 还提供了更高级的玩法,导入 Select 模块。直接根据属性或索引定位。
2.先要导入 select 方法:
from selenium.webdriver.support.select import Select
3.然后通过 select 选项的索引来定位选择对应选项(从 0 开始计数),如选择第三个选项:select_by_index(2)
完整代码如下:123456789101112131415# coding:utf-8
from
selenium
import
webdriver
from
selenium.webdriver.common.action_chains
import
ActionChains
from
selenium.webdriver.support.select
import
Select
driver
=
webdriver.Firefox()
driver.get(
"https://www.baidu.com/"
)
driver.implicitly_wait(
20
)
mouse
=
driver.find_element_by_link_text(
"设置"
)
ActionChains(driver).move_to_element(mouse).perform()
driver.find_element_by_link_text(
"搜索设置"
).click()
# 通过索引:select_by_index()
s
=
driver.find_element_by_id(
"nr"
)
Select(s).select_by_index(
2
)
2.4 Select 模块(value)定位
1.Select 模块里面除了 index 的方法,还有一个方法,通过选项的 value值来定位。每个选项,都有对应的 value 值,如
<select id="nr" name="NR">
<option selected="" value="10">每页显示 10 条</option>
<option value="20">每页显示 20 条</option>
<option value="50">每页显示 50 条</option>
2.第二个选项对应的 value 值就是“20”:select_by_value(2)完整代码如下:
123456789101112131415# coding:utf-8
from
selenium
import
webdriver
from
selenium.webdriver.common.action_chains
import
ActionChains
from
selenium.webdriver.support.select
import
Select
driver
=
webdriver.Firefox()
driver.get(
"https://www.baidu.com/"
)
driver.implicitly_wait(
20
)
mouse
=
driver.find_element_by_link_text(
"设置"
)
ActionChains(driver).move_to_element(mouse).perform()
driver.find_element_by_link_text(
"搜索设置"
).click()
# 通过value定位:select_by_value()
s
=
driver.find_element_by_id(
"nr"
)
Select(s).select_by_value(
20
)
2.5 Select 模块(text)定位
1.Select 模块里面还有一个更加高级的功能,可以直接通过选项的文本内容来定位。
2.定位“每页显示 50 条”:select_by_visible_text("每页显示 50 条")完整代码如下:
123456789101112131415# coding:utf-8
from
selenium
import
webdriver
from
selenium.webdriver.common.action_chains
import
ActionChains
from
selenium.webdriver.support.select
import
Select
driver
=
webdriver.Firefox()
driver.get(
"https://www.baidu.com/"
)
driver.implicitly_wait(
20
)
mouse
=
driver.find_element_by_link_text(
"设置"
)
ActionChains(driver).move_to_element(mouse).perform()
driver.find_element_by_link_text(
"搜索设置"
).click()
# 通过select_by_visible_text定位
s
=
driver.find_element_by_id(
"nr"
)
Select(s).select_by_visible_text(
"每页显示50条"
)
3.Select 模块其它方法
1.select 里面方法除了上面介绍的三种,还有更多的功能如下
select_by_index() :通过索引定位
select_by_value() :通过 value 值定位
select_by_visible_text() :通过文本值定位
deselect_all() :取消所有选项
deselect_by_index() :取消对应 index 选项
deselect_by_value() :取消对应 value 选项
deselect_by_visible_text() :取消对应文本选项
first_selected_option() :返回第一个选项
all_selected_options() :返回所有的选项------------------------------------------签名---------------------------------------心简单,世界就简单,幸福才会生长;心自由,生活就自由,到哪都有快乐。-------------------------------------------------------------------------------------
转载于:https://www.cnblogs.com/klb561/p/9332968.html
Selenium 获取文本信息方法+select(定位)相关推荐
- Selenium 获取文本信息方法总结
1.通过先定位到具体的元素然后通过text方法获取文本信息,如获取控件名称等 driver.find_element_by_xpath("//div[/h1").text 2 ...
- 爬虫(二):新浪财经爬虫(获取文本信息)
新浪财经爬虫(获取文本信息) BiuBiu,接上一篇文章,这一次,我并没有用东方财富网站,而是新浪财经网,当然,也是因为个人需要啦.但是我看了一下,大差不差,只要看懂那些div,就能够爬取. 首先给大 ...
- selenium获取元素信息的常用方法
selenium获取标签内信息 selenium获取元素信息的常用方法 elem = driver.find_element_by_* #获取元素属性(textContent.innerHTML.ou ...
- sdk数值与android版本,Android SdkVersion的区别及获取版本信息方法
1.minSdkVersion,targetSdkVersion,maxSdkVersion,compileSdkVersion四个数值之间有什么区别? • minSdkVersion,maxSdkV ...
- 计算机获取文本的方法有哪些,文本挖掘的方法主要有哪些?
文本挖掘一直是十分重要的信息处理领域,因为不论是推荐系统.搜索系统还是其它广泛性应用,我们都需要借助文本挖掘的力量.每天所产生的信息量正在迅猛增加,而这些信息基本都是非结构化的海量文本,它们无法轻易由 ...
- linux80瑞口提权口今,史上最全Linux提权后获取敏感信息方法
在本文开始之前,我想指出我不是专家.据我所知,在这个庞大的区域,没有一个"神奇"的答案.分享,共享(我的出发点).下面是一个混合的命令做同样的事情,在不同的地方,或只是一个不同的眼 ...
- python网络爬虫系列(七)——selenium的介绍 selenium定位获取标签对象并提取数据 selenium的其它使用方法
一.selenium的介绍 知识点: 了解 selenium的工作原理 了解 selenium以及chromedriver的安装 掌握 标签对象click点击以及send_keys输入 1. sele ...
- 爬虫系列教程二:如何获取网页信息并定位信息所处位置
在爬虫中如何获取并定位网页的信息 由于我们获取网页的类型的不同,我们希望爬取的信息的定位方法也有很大差别,但总体来说我们想要爬取的网页可以分为静态和动态,下面讲述在不同的情况下如何爬取这些信息: 网页 ...
- 最新小程序获取个人信息头像名称openid等方法
最新小程序获取个人信息头像名称openid等方法 一.利用标签显示头像和用户名(用于展示微信开放的数据) <open-data type="userNickName"> ...
最新文章
- Python list排序
- 代码 抠图_憋再PS抠图了,3行代码给你安排的明明白白!
- ECSHOP商品详情页”增加自定义TITLE
- C语言头文件为什么要加#ifndef #define #endif(防止头文件重复包含)
- 揭秘ASP.NET 2.0的Eval方法(转)
- 【Redis学习】redis通讯协议
- 如何区分两列中不同数据_如何区分原装数据线和山寨数据线
- Linux下c语言实现通讯录,学生通讯录管理系统linux下C语言
- 安装Ubuntu时,提示“没有根文件系统 ”
- PSP3000终于可以放心的关机了!
- 模拟集成电路设计基础知识(二):MOS管二级效应及其小信号等效
- python 显示gif_使用tkinter显示动态gif
- 舵机工作原理及STM32驱动代码
- 自定义SeekBar 带文字
- 《论文阅读》THE CURIOUS CASE OF NEURAL TEXT DeGENERATION
- 自己的第一份保险(均来自太平):“福禄康瑞2018重疾险” + “医无忧” + “爱无忧”(状态:已退,20190530)...
- 如何全网智能识别文章页,识别正文和标题
- 《 降伏其心(一)》
- 大数据开发:大数据背景下的数据库选型
- 那些困扰你多年的项目管理问题,终于有解决方案了!
热门文章
- 如何能让mediawiki实现共享
- 在Windows 7 下使用Visual Studio 2010 编写自动申请管理员权限运行的程序
- Spring Boot + JSP 创建web项目
- 安装 | R2021a链接及Matlab运行图
- OpenCV | opencv数据结构中的CvScalar(代码类)
- 程序猿们,别着急入手区块链,先给自己选好武林门派再练功不迟
- VS2010MFC - TeeChart经验总结(零基础入门到动态创建)
- php中提示注意怎么解决,PHP中操作MySQL时一定要注意
- mybatis与mysql调优_MySQL + mybatis的SQL优化方案
- 正则表达式python实例_常见的python正则用法实例讲解