Mac下python+selenium【2】获取表格所有元素
写在最前面:
一点selenium自动化测试的常用技巧介绍,小白专用。
我邮的研究生网站上的一个table,想要把所有的信息扒下来,怎么处理呢?
<tr height="19"><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:110px;height:76px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" rowspan="5" width="110" colspan="1">0810z1</td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:162px;height:76px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" rowspan="5" width="162" colspan="1">信息安全</td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:109px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="109"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=19980003">陈丹伟</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20120102">何利文</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20120081">蒋国平</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20070009">荆晓远</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20020022">孙国梓</a></td></tr>
这是一个html页面,很显然只有一个tr-代表一行,td-代表一列,那么我们不需要遍历所有行,只需找到一行的所有列即可。
由于该table没有id之类的,我们用xpath找到table所在位置,然后找到该行所有列,遍历即可。
首先copy该table的xpath
然后通过tag_name = 'td'遍历所有列
from selenium import webdriver
import timeif __name__ == "__main__":driver = webdriver.Chrome()driver.get('http://cs.njupt.edu.cn/2010/0510/c9392a110578/page.htm')trs = driver.find_element_by_xpath('/html/body/div[4]/div/div[2]/div/div/div/div/table[1]')tds = trs.find_elements_by_tag_name('td')print(trs)print(tds)time.sleep(3)info = []for td in tds:info.append(td.text)print(info)
最后打印结果:
['0810z1', '信息安全', '陈丹伟', '何利文', '蒋国平', '荆晓远', '孙国梓',
'吴\u3000蒙', '杨 \u3000庚', '张 伟', '张迎周', '曹晓梅',
'陈 伟', '鲁蔚锋', '任勋益', '张 洁', '王少辉',
'王志伟', '张 琳', ' 陈国良', ' 许\u3000建', ' 王化群',
'宋玉蓉', '操晓春*', '', '', '']
如果有多行的话,再遍历一次行即可:
for tr in trs:for td in tr.find_elements_by_tag_name('td'):info.append(td.text)
print(info)
Mac下python+selenium【2】获取表格所有元素相关推荐
- mac 搭建python+selenium+chromedriver环境
mac 搭建python+selenium+chromedriver环境 有关配置默认python3,请查看:https://blog.csdn.net/qq_35098526/article/det ...
- Mac下python初学之Image库(PIL)
Mac下python 使用Image库 安装PIL,下载http://www.pythonware.com/products/pil/ 解压PIL源码包,阅读README知道需要使用python se ...
- Mac下python升级
对Mac下python自带的2.7版本进行升级 Mac下自带的2.7版本对于一些新学python的然来说有点老,所以可以进行简单的版本升级: 1.首先进入 python官网 进行下载,根据你所需的版本 ...
- Python selenium根据class定位页面元素,xpath定位
Python selenium根据class定位页面元素 在日常的网页源码中,我们基于元素的id去定位是最万无一失的,id在单个页面中是不会重复的.但是实际工作中,很多前端开发人员并未给每个元素都编写 ...
- Python+selenium自动获取Web端斗鱼直播信息
环境准备 Python 谷歌浏览器或其他浏览器的Driver驱动,最好设置下环境变量(全局驱动),或者使用局部的驱动也可以 安装 selenium库 实现 打开浏览器 定位元素 打开页面调试,即可发现 ...
- selenium+linux+python,Linux下Python+selenium自动化环境搭建
selenium介绍 Selenium自动化测试工具,主要是用于web应用程序的自动化UI测试,是目前主流的自动化测试工具,主要特点为开源,跨平台,支持主流的浏览器,支持多种编程语言并且支持支持分布式 ...
- Mac 下 python 环境问题
一.Mac下,可能存在的 python 环境: 1.Mac系统自带的python环境在(由于不同的 mac 系统,默认自带的 python 版本可能不一样): Python 2.7.10: /Syst ...
- 使用Pyecharts进行全国水质TDS地图可视化全过程6:利用Python+Selenium自动化获取页面信息
本文是扩展文,介绍利用Selenium模拟人工操作,从网页上自动获取信息.这样一种方法可以处理重复性工作,解放双手,提高工作效率.属于使用Pyecharts做可视化之前的一些其他探索. 在利用Exce ...
- python selenium chrome获取每个请求内容_python+selenium调用chrome打开网址获取内容
通过selenium库,python可以调用chrome打开指定网页并获取网页内容或者模拟登陆获取网页内容 1,安装selenium和配置chromedriver 安装selenium C:\User ...
最新文章
- wampserver修改mysql用户密码
- 产品经理真的是「背锅侠」吗?
- oracle中dbms_如何在DBMS中找到关系的最高范式?
- Java final修饰符的作用,Java中的final修饰符
- 没有桌面体验功能就不能进行图片打印
- openstack pike版本安装笔记8(Orchestration Server:heat组件,模板服务)
- Dev--Config Files
- SpringBoot中是如何创建WebServer的?
- [面试必考]OSI 网络七层协议以及各层的功能
- 美光称对华为恢复部分芯片出货 股价一度上涨10%
- 远程VPS和本地电脑之间无法粘贴复制及分享文件
- FPGA中LUT初步学习
- mongodb数据迁移设置方法
- 揭阳学计算机的好学校,揭阳中学排名前十名,2021年揭阳中学排名一览表
- 揭秘支撑百度搜索、Feed、小程序三大业务的MVVM框架设计思想,San 核心人员倾力打造...
- mysql 分钟转小时_将分钟转化为**小时**分钟,,将秒转化为**天**小时**分钟**秒...
- redis-shake 同步redis数据
- mysql插入中文报错
- 嵌入式SQL数据库连接简便操作
- Macbook matlab启动无响应问题解决方案