every blog every motto: What doesn’t kill you makes you stronger.

0. 前言

用xpath提取,获取多个element对象,循环遍历提取其中内容结果是一样的,记录。

1. 正文

1.1 方法一:

comment_xpath = html.xpath('//div[@node-type="root_comment"]')
# 遍历每个评论块
for ele in comment_xpath:# t = etree.tostring(ele,encoding='utf-8')# print(t.decode('utf-8'))# print('----'*100)# 评论人昵称nick_name = ele.xpath('//div[@class="WB_text"]/a/text()')[0]print(nick_name)

1.2 方法二(加了一个.)

comment_xpath = html.xpath('//div[@node-type="root_comment"]')
# 遍历每个评论块
for ele in comment_xpath:# t = etree.tostring(ele,encoding='utf-8')# print(t.decode('utf-8'))# print('----'*100)# 评论人昵称nick_name = ele.xpath('.//div[@class="WB_text"]/a/text()')[0]print(nick_name)

1.3 分析(待解)

  1. 取消注释for循环中三条语句,将每个ele转成字符,可以发现结果都是不同的。不知道为什么不能正确提取其中的昵称(总是提取第一个)
  2. for循环内的xpath加“.”,表示“选取当前节点”,既然每个ele都不一样,为什么需要加"."呢?

1.4 原因

  1. // 默认从路径开始匹配,所以出现了上面的结果
  2. 如果想匹配当前路径ele下的东西,前面要"."

【xpath】多个xpath Element对象,提取结果是一样的相关推荐

  1. python 爬虫(七)lxml模块 + lxml数据提取(字符串的xml/html文件--转换--element对象--转换--字符串)调用XPath方法筛选数据 + 案例(扇贝 酷狗 网易云音乐)

    爬虫小知识:爬取网站流程 确定网站哪个url是数据的来源. 简要分析一下网站结构,查看数据一般放在哪里. 查看是否有分页,解决分页的问题. 发送请求,查看response.text里面是否有我们想要的 ...

  2. QTP11使用DOM XPath以及CSS识别元素对象

    QTP11使用DOM XPath以及CSS识别元素对象 我们知道,像DOM,Html,CSS,XPath等对对象的识别策略广泛运用于一些开源的工具,例如:Selenium,Watir,Watir-We ...

  3. Selenium提取数据之标签对象提取文本内容和属性值

    Selenium提取数据之标签对象提取文本内容和属性值 find_element仅仅能够获取元素,不能够直接获取其中的数据,如果需要获取数据需要使用以下方法 对元素执行点击操作element.clic ...

  4. python xpath语法-Python Xpath语法

    一.python数据提取xpath 1.beautifulsoup xpath 正则表达式 2.xpath是一种在XML和HTML文档中查找信息的语言,可用来在XML和HTML中对元素进行遍历 Chr ...

  5. python xpath语法-Python xpath表达式如何实现数据处理

    xpath表达式 1. xpath语法 ? 1 2 3 4 5 6 7 8 9 10 Harry Potter 999 Learning XML 888 1.1 选取节点 XPath 使用路径表达式来 ...

  6. python xpath语法-python xpath 基本用法

    发布时间: pythonercn 8 months, 3 weeks ago 在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也 ...

  7. python中xpath用法_python xpath 基本用法

    发布时间: pythonercn 8 months, 3 weeks ago 在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也 ...

  8. element select 不回显_Jsoup中Element对象的使用

    <?xml version="1.0" encoding="UTF-8" ?> <students ><student numbe ...

  9. Element 对象表示 XML 文档中的元素。

    Element 对象 Element 对象表示 XML 文档中的元素.元素可包含属性.其他元素或文本.如果元素含有文本,则在文本节点中表示该文本. 重要事项:文本永远存储在文本节点中.在 DOM 处理 ...

  10. HTML DOM Element 对象

    TML DOM 节点 在 HTML DOM (文档对象模型)中,每个部分都是节点: 文档本身是文档节点 所有 HTML 元素是元素节点 所有 HTML 属性是属性节点 HTML 元素内的文本是文本节点 ...

最新文章

  1. leetcode 839 Similar String Groups
  2. python applymap_运行Python Applymap需要时间
  3. 进程间通信 - 邮槽实现
  4. impala sql清单
  5. mysql数据库管理维护_(转)Mysql数据库管理 表的维护
  6. 如何才能CentOS终端输入中文
  7. Vue实战(六)通用Table组件
  8. ajax在php中使用方法,在项目中如何使用ajax请求
  9. GWAS meta分析
  10. 百度文库免积分免费下载工具的原理与实现
  11. 不用百度网盘客户端下载文件
  12. linux配置文件前面有分号,linux中的分号 ||
  13. C1见习工程师能力认证 考纲
  14. 周超臣:支付宝的套路是我走过最长的路
  15. centos7 无网络 安装oracle 脚本静默安装
  16. mysql-mmm 故障_mysql-mmm故障解决一例
  17. 谷歌程序员年薪高达25万美元以上
  18. AMD cpu黑苹果 修改补丁 OpenCore教程
  19. 【历史上的今天】3 月 21 日:世界上第一条推文发布;雅虎收购 Flickr;Megaupload 上线
  20. 如何找计算机配置文件,怎么查看电脑系统配置

热门文章

  1. Python基础知识笔记(二)
  2. java 对象快速赋值_JavaWeb学习笔记:简单JavaBean对象的快速赋值与获取
  3. :没有此sdk或暂不支持此sdk模拟_即构SDK7月迭代:新增支持按通道设置延迟模式,大大减少卡顿...
  4. python按钮代码_Python QPalette.Button方法代码示例
  5. python 代码分块_python大数据分块处理
  6. mysql所选路径已经存在_MySQL 入门知识(下) | 周末送资料
  7. Java进阶:SpringMVC中获取web.xml中的全局参数
  8. .net导出Excel设置颜色font.ColorIndex 各颜色编号
  9. C++_数据结构_堆用法详解
  10. 科研_今天,我们怎么做科研?