1.通过先定位到具体的元素然后通过text方法获取文本信息,如获取控件名称等

driver.find_element_by_xpath("//div[/h1").text

2.直接通过定位到的元素的属性直接获取属性名称,如输入框提示信息等

driver.find_element_by_id("XXX").get_attribute(YYY)

启发:元素的定位可以先定位到大的颗粒度,在向小的颗粒度定位,例如先定位到table,在定位到table中的行和列

代码如下:

此处为写的获取第一列元素的list的方法

  1. def listcontent(driver, path):
  2. table = driver.find_element_by_xpath(path)
  3. rows = table.find_elements_by_tag_name("tr")
  4. rowname = []
  5. for row in rows[1:]:
  6. col = row.find_element_by_xpath("td[1]/a")
    1. rowname.append(col)

      如果得到的文本只为空,而非我们期望的baidu,那么当前定位的元素可能被隐藏了。

      1.判断是否被隐藏 。 driver.find_element_by_xx().is_displayed()  

        打印结果,如果得到 false的结果.那就说明被隐藏了

      2.怎么解决?

      方法一:   修改页面当前定位元素,或者当前元素父元素的CSS,使元素的is_displayed()  值为true.

      方法二:  is_displayed()  为false的元素,依然可以通过getAttribute()方法获取元素的属性.

      由于webdriver spec的定义,Selenium WebDriver 只会与可见元素交互,所以获取隐藏元素的文本总是会返回空字符串。 
          可是,在某些情况下,我们需要获取隐藏元素的文本。这些内容可以使用element.attribute('attributeName'), 通过textContentinnerTextinnerHTML等属性获 取。(划重点)

      • innerHTML 会返回元素的内部 HTML, 包含所有的HTML标签。 
        例如,<div>Hello <p>World!</p></div>innerHTML会得到Hello <p>World!</p>
      • textContent 和 innerText 只会得到文本内容,而不会包含 HTML 标签。 
        • textContent 是 W3C 兼容的文字内容属性,但是 IE 不支持
        • innerText 不是 W3C DOM 的指定内容,FireFox不支持
        •   

      1、Select元素

      1.打开百度-设置-搜索设置界面,如下图所示

      2.箭头所指位置,就是 select 选项框,打开页面元素定位,下方红色框框区域,可以看到 select 标签属性:

      <select id="nr" name="NR">
      3.选项有三个
      <option selected="" value="10">每页显示 10 条</option>
      <option value="20">每页显示 20 条</option>
      <option value="50">每页显示 50 条</option>

      2、定位select

      定位select有多种方法,下面进行一一介绍

      2.1 二次定位

      1.定位 select 里的选项有多种方式,这里先介绍一种简单的方法:二次定位
      2.基本思路,先定位 select 框,再定位 select 里的选项

      完整代码如下:

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      # coding:utf-8
      from selenium import webdriver
      from selenium.webdriver.common.action_chains import ActionChains
      driver = webdriver.Firefox()
      driver.get("https://www.baidu.com/")
      driver.implicitly_wait(20)
      mouse = driver.find_element_by_link_text("设置")
      ActionChains(driver).move_to_element(mouse).perform()
      driver.find_element_by_link_text("搜索设置").click()
      = driver.find_element_by_id("nr")
      s.find_element_by_xpath("//option[@value='50']").click()
      # 二次定位另外一种写法
      driver.find_element_by_id("nr").find_element_by_xpath("//option[@value='50']").click()

      3.还有另外一种写法也是可以的,把最下面两步合并成为一步:

      driver.find_element_by_id("nr").find_element_by_xpath("//option[@value='50']").click()

      2.2 直接定位

      1.有很多小伙伴说 firebug 只能定位到 select 框,还能定位里面的选项。
      2.用 direbug 定位到 select 后,下方查看元素属性地方,点 select 标签前面的+号,就可以展开里面的选项内容了。

      3.然后自己写 xpath 定位或者 css,一次性直接定位到 option 上的内容。

      完整代码如下:

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      # coding:utf-8
      from selenium import webdriver
      from selenium.webdriver.common.action_chains import ActionChains
      driver = webdriver.Firefox()
      driver.get("https://www.baidu.com/")
      driver.implicitly_wait(20)
      mouse = driver.find_element_by_link_text("设置")
      ActionChains(driver).move_to_element(mouse).perform()
      driver.find_element_by_link_text("搜索设置").click()
      # 直接点位
      driver.find_element_by_xpath(".//*[@id='nr']/option[2]").click()

      2.3  Select  模块(index)点位  

      1.除了上面介绍的两种简单的方法定位到 select 选项,selenium 还提供了更高级的玩法,导入 Select 模块。直接根据属性或索引定位。
      2.先要导入 select 方法:
      from selenium.webdriver.support.select import Select
      3.然后通过 select 选项的索引来定位选择对应选项(从 0 开始计数),如选择第三个选项:select_by_index(2)
         完整代码如下:

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      # coding:utf-8
      from selenium import webdriver
      from selenium.webdriver.common.action_chains import ActionChains
      from selenium.webdriver.support.select import Select
      driver = webdriver.Firefox()
      driver.get("https://www.baidu.com/")
      driver.implicitly_wait(20)
      mouse = driver.find_element_by_link_text("设置")
      ActionChains(driver).move_to_element(mouse).perform()
      driver.find_element_by_link_text("搜索设置").click()
      # 通过索引:select_by_index()
      = driver.find_element_by_id("nr")
      Select(s).select_by_index(2)

      2.4 Select  模块(value)定位

      1.Select 模块里面除了 index 的方法,还有一个方法,通过选项的 value值来定位。每个选项,都有对应的 value 值,如
      <select id="nr" name="NR">
      <option selected="" value="10">每页显示 10 条</option>
      <option value="20">每页显示 20 条</option>
      <option value="50">每页显示 50 条</option>
      2.第二个选项对应的 value 值就是“20”:select_by_value(2)

      完整代码如下:

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      # coding:utf-8
      from selenium import webdriver
      from selenium.webdriver.common.action_chains import ActionChains
      from selenium.webdriver.support.select import Select
      driver = webdriver.Firefox()
      driver.get("https://www.baidu.com/")
      driver.implicitly_wait(20)
      mouse = driver.find_element_by_link_text("设置")
      ActionChains(driver).move_to_element(mouse).perform()
      driver.find_element_by_link_text("搜索设置").click()
      # 通过value定位:select_by_value()
      = driver.find_element_by_id("nr")
      Select(s).select_by_value(20)

      2.5  Select  模块(text)定位

      1.Select 模块里面还有一个更加高级的功能,可以直接通过选项的文本内容来定位。
      2.定位“每页显示 50 条”:select_by_visible_text("每页显示 50 条")

      完整代码如下:

      1
      2
      3
      4
      5
      6
      7
      8
      9
      10
      11
      12
      13
      14
      15
      # coding:utf-8
      from selenium import webdriver
      from selenium.webdriver.common.action_chains import ActionChains
      from selenium.webdriver.support.select import Select
      driver = webdriver.Firefox()
      driver.get("https://www.baidu.com/")
      driver.implicitly_wait(20)
      mouse = driver.find_element_by_link_text("设置")
      ActionChains(driver).move_to_element(mouse).perform()
      driver.find_element_by_link_text("搜索设置").click()
      # 通过select_by_visible_text定位
      = driver.find_element_by_id("nr")
      Select(s).select_by_visible_text("每页显示50条")

      3.Select  模块其它方法

      1.select 里面方法除了上面介绍的三种,还有更多的功能如下

      select_by_index() :通过索引定位
      select_by_value() :通过 value 值定位
      select_by_visible_text() :通过文本值定位
      deselect_all() :取消所有选项
      deselect_by_index() :取消对应 index 选项
      deselect_by_value() :取消对应 value 选项
      deselect_by_visible_text() :取消对应文本选项
      first_selected_option() :返回第一个选项
      all_selected_options() :返回所有的选项

      ------------------------------------------签名---------------------------------------
      心简单,世界就简单,幸福才会生长;心自由,生活就自由,到哪都有快乐。
      -------------------------------------------------------------------------------------

转载于:https://www.cnblogs.com/klb561/p/9332968.html

Selenium 获取文本信息方法+select(定位)相关推荐

  1. Selenium 获取文本信息方法总结

     1.通过先定位到具体的元素然后通过text方法获取文本信息,如获取控件名称等 driver.find_element_by_xpath("//div[/h1").text 2 ...

  2. 爬虫(二):新浪财经爬虫(获取文本信息)

    新浪财经爬虫(获取文本信息) BiuBiu,接上一篇文章,这一次,我并没有用东方财富网站,而是新浪财经网,当然,也是因为个人需要啦.但是我看了一下,大差不差,只要看懂那些div,就能够爬取. 首先给大 ...

  3. selenium获取元素信息的常用方法

    selenium获取标签内信息 selenium获取元素信息的常用方法 elem = driver.find_element_by_* #获取元素属性(textContent.innerHTML.ou ...

  4. sdk数值与android版本,Android SdkVersion的区别及获取版本信息方法

    1.minSdkVersion,targetSdkVersion,maxSdkVersion,compileSdkVersion四个数值之间有什么区别? • minSdkVersion,maxSdkV ...

  5. 计算机获取文本的方法有哪些,文本挖掘的方法主要有哪些?

    文本挖掘一直是十分重要的信息处理领域,因为不论是推荐系统.搜索系统还是其它广泛性应用,我们都需要借助文本挖掘的力量.每天所产生的信息量正在迅猛增加,而这些信息基本都是非结构化的海量文本,它们无法轻易由 ...

  6. linux80瑞口提权口今,史上最全Linux提权后获取敏感信息方法

    在本文开始之前,我想指出我不是专家.据我所知,在这个庞大的区域,没有一个"神奇"的答案.分享,共享(我的出发点).下面是一个混合的命令做同样的事情,在不同的地方,或只是一个不同的眼 ...

  7. python网络爬虫系列(七)——selenium的介绍 selenium定位获取标签对象并提取数据 selenium的其它使用方法

    一.selenium的介绍 知识点: 了解 selenium的工作原理 了解 selenium以及chromedriver的安装 掌握 标签对象click点击以及send_keys输入 1. sele ...

  8. 爬虫系列教程二:如何获取网页信息并定位信息所处位置

    在爬虫中如何获取并定位网页的信息 由于我们获取网页的类型的不同,我们希望爬取的信息的定位方法也有很大差别,但总体来说我们想要爬取的网页可以分为静态和动态,下面讲述在不同的情况下如何爬取这些信息: 网页 ...

  9. 最新小程序获取个人信息头像名称openid等方法

    最新小程序获取个人信息头像名称openid等方法 一.利用标签显示头像和用户名(用于展示微信开放的数据) <open-data type="userNickName"> ...

最新文章

  1. Python list排序
  2. 代码 抠图_憋再PS抠图了,3行代码给你安排的明明白白!
  3. ECSHOP商品详情页”增加自定义TITLE
  4. C语言头文件为什么要加#ifndef #define #endif(防止头文件重复包含)
  5. 揭秘ASP.NET 2.0的Eval方法(转)
  6. 【Redis学习】redis通讯协议
  7. 如何区分两列中不同数据_如何区分原装数据线和山寨数据线
  8. Linux下c语言实现通讯录,学生通讯录管理系统linux下C语言
  9. 安装Ubuntu时,提示“没有根文件系统 ”
  10. PSP3000终于可以放心的关机了!
  11. 模拟集成电路设计基础知识(二):MOS管二级效应及其小信号等效
  12. python 显示gif_使用tkinter显示动态gif
  13. 舵机工作原理及STM32驱动代码
  14. 自定义SeekBar 带文字
  15. 《论文阅读》THE CURIOUS CASE OF NEURAL TEXT DeGENERATION
  16. 自己的第一份保险(均来自太平):“福禄康瑞2018重疾险” + “医无忧” + “爱无忧”(状态:已退,20190530)...
  17. 如何全网智能识别文章页,识别正文和标题
  18. 《 降伏其心(一)》
  19. 大数据开发:大数据背景下的数据库选型
  20. 那些困扰你多年的项目管理问题,终于有解决方案了!

热门文章

  1. 如何能让mediawiki实现共享
  2. 在Windows 7 下使用Visual Studio 2010 编写自动申请管理员权限运行的程序
  3. Spring Boot + JSP 创建web项目
  4. 安装 | R2021a链接及Matlab运行图
  5. OpenCV | opencv数据结构中的CvScalar(代码类)
  6. 程序猿们,别着急入手区块链,先给自己选好武林门派再练功不迟
  7. VS2010MFC - TeeChart经验总结(零基础入门到动态创建)
  8. php中提示注意怎么解决,PHP中操作MySQL时一定要注意
  9. mybatis与mysql调优_MySQL + mybatis的SQL优化方案
  10. 正则表达式python实例_常见的python正则用法实例讲解