Mac下python+selenium【2】获取表格所有元素

写在最前面：

一点selenium自动化测试的常用技巧介绍，小白专用。

我邮的研究生网站上的一个table，想要把所有的信息扒下来，怎么处理呢？

<tr height="19"><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:110px;height:76px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" rowspan="5" width="110" colspan="1">0810z1</td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:162px;height:76px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" rowspan="5" width="162" colspan="1">信息安全</td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:109px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="109"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=19980003">陈丹伟</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20120102">何利文</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20120081">蒋国平</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20070009">荆晓远</a></td><td style="border-bottom:#000000 1px solid;text-align:center;border-left:#000000 1px solid;font-style:normal;width:72px;height:19px;color:#000000;font-size:13px;vertical-align:middle;border-top:#000000 1px solid;font-weight:400;border-right:#000000 1px solid;text-decoration:none;mso-protection:locked visible" class="et3" height="19" width="72"><a href="http://yjs.njupt.edu.cn/epstar/web/outer/dsfc_ny_.jsp?dsgh=20020022">孙国梓</a></td></tr>

这是一个html页面，很显然只有一个tr-代表一行，td-代表一列，那么我们不需要遍历所有行，只需找到一行的所有列即可。

由于该table没有id之类的，我们用xpath找到table所在位置，然后找到该行所有列，遍历即可。

首先copy该table的xpath

然后通过tag_name = 'td'遍历所有列

from selenium import webdriver
import timeif __name__ == "__main__":driver = webdriver.Chrome()driver.get('http://cs.njupt.edu.cn/2010/0510/c9392a110578/page.htm')trs = driver.find_element_by_xpath('/html/body/div[4]/div/div[2]/div/div/div/div/table[1]')tds = trs.find_elements_by_tag_name('td')print(trs)print(tds)time.sleep(3)info = []for td in tds:info.append(td.text)print(info)

最后打印结果：

['0810z1', '信息安全', '陈丹伟', '何利文', '蒋国平', '荆晓远', '孙国梓',
'吴\u3000蒙', '杨 \u3000庚', '张  伟', '张迎周', '曹晓梅',
'陈  伟', '鲁蔚锋', '任勋益', '张  洁', '王少辉',
'王志伟', '张  琳', ' 陈国良', ' 许\u3000建', ' 王化群',
'宋玉蓉', '操晓春*', '', '', '']

如果有多行的话，再遍历一次行即可：

for tr in trs:for td in tr.find_elements_by_tag_name('td'):info.append(td.text)
print(info)

Mac下python+selenium【2】获取表格所有元素相关推荐

mac 搭建python+selenium+chromedriver环境
mac 搭建python+selenium+chromedriver环境有关配置默认python3,请查看:https://blog.csdn.net/qq_35098526/article/det ...
Mac下python初学之Image库（PIL)
Mac下python 使用Image库安装PIL,下载http://www.pythonware.com/products/pil/ 解压PIL源码包,阅读README知道需要使用python se ...
Mac下python升级
对Mac下python自带的2.7版本进行升级 Mac下自带的2.7版本对于一些新学python的然来说有点老,所以可以进行简单的版本升级: 1.首先进入 python官网进行下载,根据你所需的版本 ...
Python selenium根据class定位页面元素，xpath定位
Python selenium根据class定位页面元素在日常的网页源码中,我们基于元素的id去定位是最万无一失的,id在单个页面中是不会重复的.但是实际工作中,很多前端开发人员并未给每个元素都编写 ...
Python+selenium自动获取Web端斗鱼直播信息
环境准备 Python 谷歌浏览器或其他浏览器的Driver驱动,最好设置下环境变量(全局驱动),或者使用局部的驱动也可以安装 selenium库实现打开浏览器定位元素打开页面调试,即可发现 ...
selenium+linux+python,Linux下Python+selenium自动化环境搭建
selenium介绍 Selenium自动化测试工具,主要是用于web应用程序的自动化UI测试,是目前主流的自动化测试工具,主要特点为开源,跨平台,支持主流的浏览器,支持多种编程语言并且支持支持分布式 ...
Mac 下 python 环境问题
一.Mac下,可能存在的 python 环境: 1.Mac系统自带的python环境在(由于不同的 mac 系统,默认自带的 python 版本可能不一样): Python 2.7.10: /Syst ...
使用Pyecharts进行全国水质TDS地图可视化全过程6：利用Python+Selenium自动化获取页面信息
本文是扩展文,介绍利用Selenium模拟人工操作,从网页上自动获取信息.这样一种方法可以处理重复性工作,解放双手,提高工作效率.属于使用Pyecharts做可视化之前的一些其他探索. 在利用Exce ...
python selenium chrome获取每个请求内容_python+selenium调用chrome打开网址获取内容
通过selenium库,python可以调用chrome打开指定网页并获取网页内容或者模拟登陆获取网页内容 1,安装selenium和配置chromedriver 安装selenium C:\User ...

Mac下python+selenium【2】获取表格所有元素

Mac下python+selenium【2】获取表格所有元素相关推荐

最新文章

热门文章