写在最前面:

一点selenium自动化测试的常用技巧介绍,小白专用。

我邮的研究生网站上的一个table,想要把所有的信息扒下来,怎么处理呢?

<tr height="19"><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:110px;height:76px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" rowspan="5" width="110" colspan="1">0810z1</td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:162px;height:76px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" rowspan="5" width="162" colspan="1">信息安全</td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:109px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="109"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=19980003">陈丹伟</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20120102">何利文</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20120081">蒋国平</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20070009">荆晓远</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20020022">孙国梓</a></td></tr>

这是一个html页面,很显然只有一个tr-代表一行,td-代表一列,那么我们不需要遍历所有行,只需找到一行的所有列即可。

由于该table没有id之类的,我们用xpath找到table所在位置,然后找到该行所有列,遍历即可。

首先copy该table的xpath

然后通过tag_name = 'td'遍历所有列

from selenium import webdriver
import timeif __name__ == "__main__":driver = webdriver.Chrome()driver.get('http://cs.njupt.edu.cn/2010/0510/c9392a110578/page.htm')trs = driver.find_element_by_xpath('/html/body/div[4]/div/div[2]/div/div/div/div/table[1]')tds = trs.find_elements_by_tag_name('td')print(trs)print(tds)time.sleep(3)info = []for td in tds:info.append(td.text)print(info)

最后打印结果:

['0810z1', '信息安全', '陈丹伟', '何利文', '蒋国平', '荆晓远', '孙国梓',
'吴\u3000蒙', '杨 \u3000庚', '张  伟', '张迎周', '曹晓梅',
'陈  伟', '鲁蔚锋', '任勋益', '张  洁', '王少辉',
'王志伟', '张  琳', ' 陈国良', ' 许\u3000建', ' 王化群',
'宋玉蓉', '操晓春*', '', '', '']

如果有多行的话,再遍历一次行即可:

for tr in trs:for td in tr.find_elements_by_tag_name('td'):info.append(td.text)
print(info)

Mac下python+selenium【2】获取表格所有元素相关推荐

  1. mac 搭建python+selenium+chromedriver环境

    mac 搭建python+selenium+chromedriver环境 有关配置默认python3,请查看:https://blog.csdn.net/qq_35098526/article/det ...

  2. Mac下python初学之Image库(PIL)

    Mac下python 使用Image库 安装PIL,下载http://www.pythonware.com/products/pil/ 解压PIL源码包,阅读README知道需要使用python se ...

  3. Mac下python升级

    对Mac下python自带的2.7版本进行升级 Mac下自带的2.7版本对于一些新学python的然来说有点老,所以可以进行简单的版本升级: 1.首先进入 python官网 进行下载,根据你所需的版本 ...

  4. Python selenium根据class定位页面元素,xpath定位

    Python selenium根据class定位页面元素 在日常的网页源码中,我们基于元素的id去定位是最万无一失的,id在单个页面中是不会重复的.但是实际工作中,很多前端开发人员并未给每个元素都编写 ...

  5. Python+selenium自动获取Web端斗鱼直播信息

    环境准备 Python 谷歌浏览器或其他浏览器的Driver驱动,最好设置下环境变量(全局驱动),或者使用局部的驱动也可以 安装 selenium库 实现 打开浏览器 定位元素 打开页面调试,即可发现 ...

  6. selenium+linux+python,Linux下Python+selenium自动化环境搭建

    selenium介绍 Selenium自动化测试工具,主要是用于web应用程序的自动化UI测试,是目前主流的自动化测试工具,主要特点为开源,跨平台,支持主流的浏览器,支持多种编程语言并且支持支持分布式 ...

  7. Mac 下 python 环境问题

    一.Mac下,可能存在的 python 环境: 1.Mac系统自带的python环境在(由于不同的 mac 系统,默认自带的 python 版本可能不一样): Python 2.7.10: /Syst ...

  8. 使用Pyecharts进行全国水质TDS地图可视化全过程6:利用Python+Selenium自动化获取页面信息

    本文是扩展文,介绍利用Selenium模拟人工操作,从网页上自动获取信息.这样一种方法可以处理重复性工作,解放双手,提高工作效率.属于使用Pyecharts做可视化之前的一些其他探索. 在利用Exce ...

  9. python selenium chrome获取每个请求内容_python+selenium调用chrome打开网址获取内容

    通过selenium库,python可以调用chrome打开指定网页并获取网页内容或者模拟登陆获取网页内容 1,安装selenium和配置chromedriver 安装selenium C:\User ...

最新文章

  1. wampserver修改mysql用户密码
  2. 产品经理真的是「背锅侠」吗?
  3. oracle中dbms_如何在DBMS中找到关系的最高范式?
  4. Java final修饰符的作用,Java中的final修饰符
  5. 没有桌面体验功能就不能进行图片打印
  6. openstack pike版本安装笔记8(Orchestration Server:heat组件,模板服务)
  7. Dev--Config Files
  8. SpringBoot中是如何创建WebServer的?
  9. [面试必考]OSI 网络七层协议以及各层的功能
  10. 美光称对华为恢复部分芯片出货 股价一度上涨10%
  11. 远程VPS和本地电脑之间无法粘贴复制及分享文件
  12. FPGA中LUT初步学习
  13. mongodb数据迁移设置方法
  14. 揭阳学计算机的好学校,揭阳中学排名前十名,2021年揭阳中学排名一览表
  15. 揭秘支撑百度搜索、Feed、小程序三大业务的MVVM框架设计思想,San 核心人员倾力打造...
  16. mysql 分钟转小时_将分钟转化为**小时**分钟,,将秒转化为**天**小时**分钟**秒...
  17. redis-shake 同步redis数据
  18. mysql插入中文报错
  19. 嵌入式SQL数据库连接简便操作
  20. Macbook matlab启动无响应问题解决方案

热门文章

  1. 打工皇帝唐骏做局 紫金庄家出货手法大曝光
  2. 不是封闭也不是开放 创新封闭式基金迎来变种
  3. Android录音,PCM音频数据打包成AAC
  4. 自定义Windows 10开始菜单的10种方法
  5. 升级你的 Flutter 版本
  6. 零售行业数据分析运用
  7. 我的世界java版特别卡怎么办_我的世界卡顿延迟怎么办
  8. 《C++ Primer》学习笔记
  9. Python爬虫实战--(四)爬取58同城的商品数据
  10. SpringCloud-Gataway网关的使用