爬虫之Xpath详解

XPath介绍

XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。

XPath 是 W3C XSLT 标准的主要元素,并且 XQuery 和 XPointer 都构建于 XPath 表达之上。

因此,对 XPath 的理解是很多高级 XML 应用的基础。                                  --------------------W3School

1. XPath 使用路径表达式来选取 XML 文档中的节点或者节点集。这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似。

2. XPath 含有超过 100 个内建的函数。这些函数用于字符串值、数值、日期和时间比较、节点和 QName 处理、序列处理、逻辑值。

3. XPath 于 1999 年 11 月 16 日 成为 W3C 标准。XPath 被设计为供 XSLT、XPointer 以及其他 XML 解析软件使用。

XPath 术语

1. 在 XPath 中,有七种类型的节点:元素、属性、文本、命名空间、处理指令、注释以及文档节点(或称为根节点)。XML 文档是被作为节点树来对待的。树的根被称为文档节点或者根节点。

2. 基本值(或称原子值,Atomic value)是无父或无子的节点。

3. 项目(Item)是基本值或者节点。

XPath 语法

XPath 使用路径表达式来选取 XML 文档中的节点或节点集。节点是通过沿着路径 (path) 或者步 (steps) 来选取的。

谓语(Predicates)

谓语用来查找某个特定的节点或者包含某个指定的值的节点。

谓语被嵌在方括号中。

转载于:https://www.cnblogs.com/xyhh/p/10860863.html

爬虫之Xpath详解相关推荐

  1. Python网络爬虫之Xpath详解

    1.什么是Xpath XPath 是一门在 XML 文档中查找信息的语言. 所谓 Xpath,是指 XML path language,path 就是路径, Xpath 主要是通过路径来查找元素. 咱 ...

  2. python爬虫入门实例-Python爬虫天气预报实例详解(小白入门)

    本文研究的主要是Python爬虫天气预报的相关内容,具体介绍如下. 要求是把你所在城市过去一年的历史数据爬出来. 分析网站 我们可以看到,我们需要的天气数据都是放在图表上的,在切换月份的时候,发现只有 ...

  3. python编程入门与案例详解pdf-Python爬虫天气预报实例详解(小白入门)

    本文研究的主要是Python爬虫天气预报的相关内容,具体介绍如下. 这次要爬的站点是这个:http://www.weather.com.cn/forecast/ 要求是把你所在城市过去一年的历史数据爬 ...

  4. fofa自动化爬虫脚本更新+详解

    fofa自动化爬虫脚本更新+详解 起因 最近要用到fofa爬虫,为什么要用爬虫不用api,问就是穷,想起来之前写过一个相关的脚本:Fofa-python-脚本,是很久以前写的了,之前写的时候有点问题, ...

  5. python编程入门与案例详解-Python爬虫天气预报实例详解(小白入门)

    本文研究的主要是Python爬虫天气预报的相关内容,具体介绍如下. 这次要爬的站点是这个:http://www.weather.com.cn/forecast/ 要求是把你所在城市过去一年的历史数据爬 ...

  6. Python爬虫JS解密详解,学会直接破解80%的网站(一)!!!

    文章目录 1.网页查看 2.有道翻译简单实现源码 3.JS解密(详解) 4.python实现JS解密后的完整代码 4.1.实现效果 5.JS解密后完整代码升级版 5.1.实现效果 CSDN独家福利降临 ...

  7. 网络爬虫工作原理详解

    网络爬虫工作原理详解 一.通用网络爬虫运行原理 二.聚焦网络爬虫运行原理

  8. 【python】python爬虫requests库详解

    1.安装:pip install requests 简介:Requests是一个优雅而简单的Python HTTP库,与之前的urllibPython的标准库相比,Requests的使用方式非常的简单 ...

  9. python爬虫代码实例源码_python爬虫及案例详解(附代码)

    安装三大库 1.requests 2.BeautifulSoup 3.lxml 有的网站做了相应的反爬虫,不能用普通方法爬取网站数据. 这里我用python爬取了几个网站的数据,分别存入csv文件,m ...

最新文章

  1. Spring MVC 实现Excel的导入导出功能(2:Excel的导入优化和Excel的导出)
  2. 【杂谈】如何从数据准备,模型设计与调优,训练到部署完成整个深度学习算法流程...
  3. pom文件报错_maven-resources-plugin修改了我的文件
  4. 求小数的某一位(信息学奥赛一本通-T1082)
  5. it'll be much more productive to read pdf files via a touch screen
  6. 解决Debug certificate expired的问题 - 转
  7. 用java观察者模式解耦经典三层架构
  8. c语言函数求圆面积,C语言编写函数,计算圆面积.
  9. python图片添加文字
  10. 美国大学 计算机专业 排名,2019美国大学计算机专业排名
  11. arcgis的lyr样式转qgis的sld样式
  12. 丰田、雷克萨斯决定在今年将亚马逊Alexa应用到部分车型中
  13. 白鹭小游戏开发,并发布到微信平台
  14. BaseMultiItemQuickAdapter 条目position获取
  15. 连通集(浙大数据结构习题)
  16. 宣布发布 .NET 7 Release Candidate 1
  17. 能力不足,眼力辅助——山寨CSDN发帖表情插件
  18. 我的计算机中找不到磁盘分区,d盘不见了怎么办?我的电脑没有d盘怎么添加硬盘分区...
  19. 模拟电子中的重要器件——场效应管
  20. 缓存区 buffers 和 caches 的区别

热门文章

  1. 2、安装ICS(Internet Component Suite)控件
  2. 写了一个PPT,用于公司内部培训
  3. am5718_AM5718如何扩大内存 - Sitara™ Cortex-A8 和 ARM9 微处理器 - Sitara™ Cortex-A8 和 ARM9 微处理器 - E2E™ 中文支持论坛...
  4. python我的所得税计算器_教你使用Python实现新个税计算器
  5. 运行php能运行asp么,配置使web server即能运行asp又能运行PHP(不装Apache)
  6. plsql 为空显示 0 的函数_记住这三个检测函数,彻底清除公式当中的0值
  7. python与excel互通_【好消息】Python和Excel终于可以互通了!!
  8. java 限制文本框长度_java中限制文本框输入长度的显示(转载)
  9. linux刷新指定URL脚本,【图片】linux下crontab定时执行本地脚本和定时访问指定url【不要牧师吧】_百度贴吧...
  10. oracle grand select,Oracle SQL 高级篇