总结下selenium提取数据的几种方法:

1.通过元素标签名提取
driver.find_element_by_tag_name()

2.通过元素class属性
driver.find_element_by_class_name()

3.通过元素id属性
driver.find_element_by_id()

4.通过元素name属性
driver.find_element_by_name()

5.通过链接文本获取超链接
driver.find_element_by_link_text()
比如
笨小孩的博客
提取超链接可以
driver.find_element_by_link_text(‘笨小孩的博客’)

6.通过部分链接文本获取超链接
driver.find_element_by_partial_link_text()
比如
笨小孩的博客
提取超链接可以
driver.find_element_by_partial_link_text(‘笨小孩’)

7.如果要提取属性数据的话,我们可以通过WebElement.get_attribute()
比如:

怎么提取style属性里的值?
我们可以通过提取tag_name【div】 或者id,class属性定位蓝色部分的WebElement,然后附上【.get_attribute(‘style’)】,见代码

from selenium import webdriver
driver=webdriver.Chrome()
style=driver.find_element_by_id('ibm-leadspace-head').get_attribute("style")

8.超实用的xpath提取
登录,翻页,搜索这些功能的实现,无法简单的使用class=’xx’,或id=’xxx’准确定位到需要的元素,这就涉及到Xpath的使用。Xpath 的获取有很多方法,这里详细讲讲最简单的方法——使用Chorme得到Xpath的定位。Chorme浏览器功能很强大,能很好的实现Xpath定位,建议大家使用爬虫的时候优先考虑它。
以拉勾网网址https://www.lagou.com/为例:
单击鼠标右键,选择检查。进入开发者界面,点选左上角网页元素选择。

鼠标移到左边登录键,我们就能看到左边的代码定位了。

按住ctrl+f,调出搜索框。

观察父级子级关系,a标签在li标签之下,class属性为login。

在搜索框中输入验证下,看能否找到。

很好,能找到。我们就可以带入到selenium里面,让selenium和Xpath合作啦~

#登录
login=driver.find_element_by_xpath('//li/a[@class="login"]')
login.click()

以上就是selenium获取数据方法的总结。

————————————————
最后推广下我的wx公众号:BXH_data

selenium提取数据的方法总结相关推荐

  1. selenium提取数据之driver对象的常用属性和方法

    selenium提取数据之driver对象的常用属性和方法 在使用selenium过程中,实例化driver对象后,driver对象有一些常用的属性和方法 driver.page_source 当前标 ...

  2. selenium提取数据之driver对象定位标签元素获取标签对象的方法

    selenium提取数据之driver对象定位标签元素获取标签对象的方法 在selenium中可以通过多种方式来定位标签,返回标签元素对象 find_element_by_id (返回一个元素) fi ...

  3. Selenium提取数据之标签对象提取文本内容和属性值

    Selenium提取数据之标签对象提取文本内容和属性值 find_element仅仅能够获取元素,不能够直接获取其中的数据,如果需要获取数据需要使用以下方法 对元素执行点击操作element.clic ...

  4. python json接口数据提取_返回数据中提取数据的方法(JSON数据取其中某一个值的方法)...

    返回数据中提取数据的方法 比如下面的案例是,取店铺名称 接口返回数据如下: {"Code":0,"Msg":"ok","Data& ...

  5. python+selenium提取数据

    当通过python+selenium在抓取数据的时候,获取不到相应数据时,可以尝试先检查抓出数据的分析界面 html = browser.page_sourcedoc = pq(html)d = do ...

  6. python获取json中的某个值_json文件返回数据中提取数据的方法(JSON数据取其中某一个值的方法)...

    比如下面的案例是,取店铺名称 接口返回数据如下:{"Code":0,"Msg":"ok","Data":{"S ...

  7. python网络爬虫系列(七)——selenium的介绍 selenium定位获取标签对象并提取数据 selenium的其它使用方法

    一.selenium的介绍 知识点: 了解 selenium的工作原理 了解 selenium以及chromedriver的安装 掌握 标签对象click点击以及send_keys输入 1. sele ...

  8. python爬虫获取标签规则_Python爬虫之数据提取-selenium定位获取标签对象并提取数据...

    ## selenium提取数据 知识点:了解 driver对象的常用属性和方法 掌握 driver对象定位标签元素获取标签对象的方法 掌握 标签对象提取文本和属性值的方法 1. driver对象的常 ...

  9. olap 多维分析_如何通过依赖T-SQL从OLAP多维数据集有效地提取数据

    olap 多维分析 介绍 (Introduction) Last month I ran two Business Intelligence pre-conferences in South Afri ...

最新文章

  1. “科研女神”颜宁当选美国科学院外籍院士
  2. NTU 课程 7454 (5) CNN进阶
  3. 一款jquery实现的整屏切换特效
  4. win32中如何使用CString
  5. vb 打印机 任意尺寸_创新小黑管“省心省力”惠普Laser NS 1020 智能闪充激光打印机...
  6. android uber源码,Uber SDK in android
  7. 双极结型三极管的结构、特性、参数
  8. 大白菜linux系统安装步骤,GRUB简单入门教程
  9. 380免费云存储_从四个方面分析:云存储服务的特点、影响
  10. 996工作的人,下班后还有时间锻炼身体和学习吗?还有娱乐生活吗?
  11. Xencrypt:反病毒绕过工具
  12. 中国顶级程序员图鉴,最后一个厉害了!
  13. Linux下为空白SD卡建立BOOT,rootfs分区
  14. 哥德尔:伟大的数学家与饱受精神疾病折磨的患者
  15. 网页字体弄成微软雅黑html,网页字体替换为微软雅黑
  16. Apache 错误日记(Error Log)记录分析
  17. 1024程序员节最新福利之2018最全java资料集合
  18. 每日词根——sol(完整可靠安慰,太阳严肃)
  19. TSN-工业通信的未来在这里?
  20. 长度厘米转换c语言程序,标准长度单位换算c程序设计.doc

热门文章

  1. ARGB 转换为十六进制值
  2. 2007年世界杀毒软件排行榜
  3. MAC 修改环境变量
  4. 基于Python的指数基金量化投资 ——A股所有个股名称和证券代码获取
  5. php redis中set、setex、setnx、getSet的区别
  6. 香港银行账户主要用途
  7. 大英百科挂了,维基百科赢了
  8. 对线性时不变系统(LTI)中时不变(Time Invariant)的一点点理解
  9. Android JNI之pthread_create的失败(1)
  10. android选择相册图片并显示