【xpath】多个xpath Element对象,提取结果是一样的
every blog every motto: What doesn’t kill you makes you stronger.
0. 前言
用xpath提取,获取多个element对象,循环遍历提取其中内容结果是一样的,记录。
1. 正文
1.1 方法一:
comment_xpath = html.xpath('//div[@node-type="root_comment"]')
# 遍历每个评论块
for ele in comment_xpath:# t = etree.tostring(ele,encoding='utf-8')# print(t.decode('utf-8'))# print('----'*100)# 评论人昵称nick_name = ele.xpath('//div[@class="WB_text"]/a/text()')[0]print(nick_name)
1.2 方法二(加了一个.)
comment_xpath = html.xpath('//div[@node-type="root_comment"]')
# 遍历每个评论块
for ele in comment_xpath:# t = etree.tostring(ele,encoding='utf-8')# print(t.decode('utf-8'))# print('----'*100)# 评论人昵称nick_name = ele.xpath('.//div[@class="WB_text"]/a/text()')[0]print(nick_name)
1.3 分析(待解)
- 取消注释for循环中三条语句,将每个ele转成字符,可以发现结果都是不同的。不知道为什么不能正确提取其中的昵称(总是提取第一个)
- for循环内的xpath加“.”,表示“选取当前节点”,既然每个ele都不一样,为什么需要加"."呢?
1.4 原因
- // 默认从根路径开始匹配,所以出现了上面的结果
- 如果想匹配当前路径ele下的东西,前面要"."
【xpath】多个xpath Element对象,提取结果是一样的相关推荐
- python 爬虫(七)lxml模块 + lxml数据提取(字符串的xml/html文件--转换--element对象--转换--字符串)调用XPath方法筛选数据 + 案例(扇贝 酷狗 网易云音乐)
爬虫小知识:爬取网站流程 确定网站哪个url是数据的来源. 简要分析一下网站结构,查看数据一般放在哪里. 查看是否有分页,解决分页的问题. 发送请求,查看response.text里面是否有我们想要的 ...
- QTP11使用DOM XPath以及CSS识别元素对象
QTP11使用DOM XPath以及CSS识别元素对象 我们知道,像DOM,Html,CSS,XPath等对对象的识别策略广泛运用于一些开源的工具,例如:Selenium,Watir,Watir-We ...
- Selenium提取数据之标签对象提取文本内容和属性值
Selenium提取数据之标签对象提取文本内容和属性值 find_element仅仅能够获取元素,不能够直接获取其中的数据,如果需要获取数据需要使用以下方法 对元素执行点击操作element.clic ...
- python xpath语法-Python Xpath语法
一.python数据提取xpath 1.beautifulsoup xpath 正则表达式 2.xpath是一种在XML和HTML文档中查找信息的语言,可用来在XML和HTML中对元素进行遍历 Chr ...
- python xpath语法-Python xpath表达式如何实现数据处理
xpath表达式 1. xpath语法 ? 1 2 3 4 5 6 7 8 9 10 Harry Potter 999 Learning XML 888 1.1 选取节点 XPath 使用路径表达式来 ...
- python xpath语法-python xpath 基本用法
发布时间: pythonercn 8 months, 3 weeks ago 在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也 ...
- python中xpath用法_python xpath 基本用法
发布时间: pythonercn 8 months, 3 weeks ago 在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也 ...
- element select 不回显_Jsoup中Element对象的使用
<?xml version="1.0" encoding="UTF-8" ?> <students ><student numbe ...
- Element 对象表示 XML 文档中的元素。
Element 对象 Element 对象表示 XML 文档中的元素.元素可包含属性.其他元素或文本.如果元素含有文本,则在文本节点中表示该文本. 重要事项:文本永远存储在文本节点中.在 DOM 处理 ...
- HTML DOM Element 对象
TML DOM 节点 在 HTML DOM (文档对象模型)中,每个部分都是节点: 文档本身是文档节点 所有 HTML 元素是元素节点 所有 HTML 属性是属性节点 HTML 元素内的文本是文本节点 ...
最新文章
- leetcode 839 Similar String Groups
- python applymap_运行Python Applymap需要时间
- 进程间通信 - 邮槽实现
- impala sql清单
- mysql数据库管理维护_(转)Mysql数据库管理 表的维护
- 如何才能CentOS终端输入中文
- Vue实战(六)通用Table组件
- ajax在php中使用方法,在项目中如何使用ajax请求
- GWAS meta分析
- 百度文库免积分免费下载工具的原理与实现
- 不用百度网盘客户端下载文件
- linux配置文件前面有分号,linux中的分号 ||
- C1见习工程师能力认证 考纲
- 周超臣:支付宝的套路是我走过最长的路
- centos7 无网络 安装oracle 脚本静默安装
- mysql-mmm 故障_mysql-mmm故障解决一例
- 谷歌程序员年薪高达25万美元以上
- AMD cpu黑苹果 修改补丁 OpenCore教程
- 【历史上的今天】3 月 21 日:世界上第一条推文发布;雅虎收购 Flickr;Megaupload 上线
- 如何找计算机配置文件,怎么查看电脑系统配置
热门文章
- Python基础知识笔记(二)
- java 对象快速赋值_JavaWeb学习笔记:简单JavaBean对象的快速赋值与获取
- :没有此sdk或暂不支持此sdk模拟_即构SDK7月迭代:新增支持按通道设置延迟模式,大大减少卡顿...
- python按钮代码_Python QPalette.Button方法代码示例
- python 代码分块_python大数据分块处理
- mysql所选路径已经存在_MySQL 入门知识(下) | 周末送资料
- Java进阶:SpringMVC中获取web.xml中的全局参数
- .net导出Excel设置颜色font.ColorIndex 各颜色编号
- C++_数据结构_堆用法详解
- 科研_今天,我们怎么做科研?