搬运自本人博客:http://www.xgezhang.com/xpath_helper.html

每一个写爬虫、或者是做网页分析的人,相信都会因为在定位、获取xpath路径上花费大量的时间,甚至有时候当爬虫框架成熟之后,基本上主要的时间都花费在了页面的解析上。在没有这些辅助工具的日子里,我们只能通过搜索html源代码,定位一些id去找到对应的位置,非常的麻烦,而且经常出错。这里介绍一个chrome的xpath辅助插件给大家。

先给到下载链接:xpath-helper

安装好之后,我们重新打开浏览器,按ctrl+shift+x就能调出xpath-helper框了。界面如下:

如果我们要查找某一个、或者某一块元素的xpath路径,可以按住shift,并移动到这一块中,上面的框就会显示这个元素的xpath路径,右边则会显示解析出的文本内容,并且我们可以自己改动xpath路径,程序也会自动的显示对应的位置,可以很方便的帮助我们判断我们的xpath语句是否书写正确。

虽然这个小插件使用非常方便,但它也不是万能的,有两个问题:

1.XPath Helper 自动提取的 XPath 都是从根路径开始的,这几乎必然导致 XPath 过长,不利于维护;

2.当提取循环的列表数据时,XPath Helper 是使用的下标来分别提取的列表中的每一条数据,这样并不适合程序批量处理,还是需要人为修改一些类似于*标记等。

不过,合理的使用Xpath,还是能帮我们省下很多时间的!

爬虫、网页分析解析辅助工具 Xpath-helper相关推荐

  1. python自带网页解析器_Python爬虫Chrome网页解析工具-XPath Helper

    之前就说过Python爬虫中Xpath的用法,相信每一个写爬虫.或者是做网页分析的人,都会因为在定位.获取XPath路径上花费大量的时间,在没有这些辅助工具的日子里,我们只能通过搜索HTML源代码,定 ...

  2. 深入理解爬虫:网页分析||审查元素

    Overview 以前做爬虫,就是先用requests把网页内容拿下来,然后beautifulsoup4进行解析,再通过ctrl+f找到所需要的目录,通过find_all定位到位置,虽说大部分时候可以 ...

  3. 3.网页信息解析方法:Xpath与BeautifulSoup

    1.BeautifulSoup基本语法 BeautifulSoup只要字符串,它都可以识别,只要你的字符串的格式是HTML或者XML文档就可以 from bs4 import BeautifulSou ...

  4. 一款优秀的BIDS辅助工具-BIDS Helper

    SQL Server 2008中SQL应用系列及BI学习笔记系列--目录索引 今天注意到一款优秀的BIDS辅助工具,地址:http://bidshelper.codeplex.com/ 它可以适用于S ...

  5. 无需任何下载工具就可以下载英雄联盟LOL英雄时刻系统剪辑好的视频爬虫网页分析基础

    -------下面的文字只是记录一下想法,想看答案的可以忽略所有文字,直接按照下面图片上的步骤去操作------------- 闲暇时间会玩一玩游戏,比如LOL,一来可以歇歇脑,让本就不多的头发得以延 ...

  6. seo爬虫工具 php,爬虫工具有哪些(爬虫网页分析工具)

    我们的许多站长应该很清楚.在百度站长的背景中我们可以看到两个项目:普通收录和快速收录.这在网站中起作用吗?根据百度的官方声明,"资源享受快速捕获和验证,快速搜索和显示,并不保证包含的效果&q ...

  7. SEO必备软件,网站SEO分析优化辅助工具

    EO优化是利用搜索引擎的规则提高网站在有关搜索引擎内的自然排名.目的是让其在行业内占据领先地位,获得品牌收益.那么有哪些好用的网站分析优化软件可以帮助我们更好地做好优化呢? 网站死链接清理工具Inte ...

  8. python xpath语法-【python】爬虫: lxml解析库、XPath语法详解

    first item second item third item fourth item lxml

  9. c 爬虫 html解析,C# 爬虫 Jumony html解析

    前言 前几天写了个爬虫,然后认识到了自己的不足. 烽火情怀推荐了Jumony.Core,通过倚天照海- -推荐的文章,也发现了Jumony.Core. 研究了2天,我发现这个东西简单粗暴,非常好用,因 ...

最新文章

  1. Swift 3.0 预告:将 Objc 库转换成更符合 Swift 语法风格的形式
  2. (zhuan) Recurrent Neural Network
  3. 网络推广——网络推广专员浅析新站应该如何提升长尾关键词的排名
  4. mysql 同机做主从
  5. Spring3.0中的前置通知、后置通知、环绕通知、异常通知
  6. jboss eap 6.2+ 版本中 加密datasource密码等敏感信息
  7. 《算法导论》学习总结 — 21.第16章 贪心算法(1) 基础入门1
  8. python基础-字典的增删改查
  9. android 3d模型ppt,PPT已支持3D PPT怎么插入3D模型?
  10. 用终端访问路由器设置端口开发_网络故障排查最全总结!ONU、机顶盒、路由器常见网络问题及处理方法...
  11. C语言open()函数:打开文件函数(转)
  12. 华为音量键只能调通话_手机音量键还在以为只能调音量?别傻了,赶紧看看下文绝对涨知识!...
  13. 选什么专业?找什么样的工作?教你四个维度
  14. 微服务在微信的架构实践
  15. 神经网络算法识别手写数字minst
  16. 清华同方台式计算机 U盘启动,清华同方台式电脑一键u盘启动bios设置教程
  17. android 置灰不可点击,android 按钮置灰效果
  18. 小程序高级电商前端第1周走进Web全栈工程师<二>
  19. Diffusion Model
  20. 【无标题】PCI-5565PIORC-110000128MB反射内存卡多模光纤

热门文章

  1. IDEA创建web工程+tomcat配置
  2. 速卖通开店入驻收费:各类目费用一览表及开店入驻绿色通道
  3. windows 7系统安装
  4. 中国海洋大学各个校区都有什么专业
  5. 操作系统真象还原第1章:部署工作环境
  6. <2>重定向的用法说明和举例
  7. 2022-05-18 牛客网每日选择题--前端
  8. 股票自动委托下单html,股票怎么设置自动挂单?股票挂单的方式
  9. 废墟里,我和同学立下约定
  10. 中国文化概论名词解释题