xpath小结

xpath('//div[@class="class"]/preceding-sibling::*')  # 选取当前节点之前的所有同级节点
xpath('//div[@class="class"]/following-sibling::*')  # 选取当前节点之后的所有同级节点
xpath('//div[@class="class"]/div/child::*')  # 选取当前节点的所有子元素
xpath('//div[@class="class"]/parent::*')  # 获取当前节点的父节点
xpath('//div[@class="class"]/div/descendant::*')  # 选取当前节点的所有后代元素子、孙等
xpath('//div[@class="class"]/descendant-or-self::*')  # 选取当前节点的所有后代元素 子、孙等 以及当前节点本身
xpath('//div[@class="class"]/ancestor-or-self::*')  # 选取当前节点的所有先辈 父、祖父等 以及当前节点本身
xpath('//div[@class="class"]/ancestor-or-self::*')  # 选取当前节点的所有先辈 父、祖父等 以及当前节点本身
xpath('//div[@class="class"]/preceding::*')  # 选取当前节点的开始标签之前的所有节点
xpath('//div[@class="class"]/following::*')  # 选取当前节点的结束标签之后的所有节点

xpath小结preceding-sibling、following-sibling相关推荐

  1. XML相关的安全漏洞-XXE,XPATH小结(XXE注入、XPATH注入)

    0x00前言: 本文主要小结以下php下的xpath查询xml结构的漏洞利用和XXE漏洞利用 xml是可扩展标记语言,它被设计出来是为了存储传输数据的. 它的结构是树形结构,并且标签要成对出现比如下面 ...

  2. (数据科学学习手札61)xpath进阶用法

    一.简介 xpath作为对网页.对xml文件进行定位的工具,速度快,语法简洁明了,在网络爬虫解析内容的过程中起到很大的作用,除了xpath的基础用法之外(可参考我之前写的(数据科学学习手札50)基于P ...

  3. xpath语法大全(转载)

    //查找所有的"B" var xpath="//B"; //查找所有元素 xpath = "//*"; // 选择所有路径依附于/A/B/的 ...

  4. 【转】C#解析HTML

    在搜索引擎的开发中,我们需要对网页的Html内容进行检索,难免的就需要对Html进行解析.拆分每一个节点并且获取节点间的内容.此文介绍两种C#解析Html的方法. 第一种方法: 用System.Net ...

  5. 高并发高流量网站架构详解--转载

    原文地址:http://www.ha97.com/818.html Web2.0的兴起,掀起了互联网新一轮的网络创业大潮.以用户为导 向的新网站建设概念,细分了网站功能和用户群,不仅成功的造就了一大批 ...

  6. linux内核设计与实现---进程管理

    进程管理 1 进程描述符及任务结构 分配进程描述符 进程描述符的存放 进程状态 设置当前进程状态 进程上下文 进程家族树 2 进程创建 写时拷贝 fork() vfork() 3 线程在Linux中的 ...

  7. Python爬虫编程实践 Task02

    文章目录 一.Xpath Xpath常用的路径表达式 使用lxml解析 实战:爬取丁香园-用户名和回复内容 二.正则表达式 re库 正则表达式的语法 正则表达式re库的使用 re库的主要功能函数 re ...

  8. 高并发高流量网站架构[转]

    2019独角兽企业重金招聘Python工程师标准>>> Web2.0的兴起,掀起了互联网新一轮的网络创业大潮.以用户为导向的新网站建设概念,细分了网站功能和用户群,不仅成功的造就了一 ...

  9. python很全的爬虫入门教程

    python很全的爬虫入门教程 一.爬虫前的准备工作 首先,我们要知道什么是爬虫 1.什么是网络爬虫? 网络爬虫是一种按照一定的规则,自动的抓取万维网信息的程序或者脚本.另外一些不常使用的名字还有蚂蚁 ...

  10. React源码分析(二)= Reac初次渲染分析

    文章目录 1. render阶段 legacyRenderSubtreeIntoContainer 1.1. legacyCreateRootFromDOMContainer 1.1.1. React ...

最新文章

  1. 马斯克来了!瞄准1万亿美元电信市场,星链「村村通」在美获突破
  2. 【控制】遗传算法(GA,Genetic Algorithm)及 Matlab 实现
  3. mvn 本地jar包 加入自己的maven仓库
  4. Hibernate 发展之路
  5. 关于在unity中动态获取字符串后在InputField上进行判断的BUG
  6. JavaScript类型强制解释
  7. PHP 调用shell命令
  8. UVA457 Linear Cellular Automata【模拟】
  9. 操作系统MOOC课后习题答案
  10. 自己写的随手记事程序
  11. Juc_无juc情况
  12. 基于连续优化的规划算法:以二次规划为例
  13. 如何给php安装上pecl,php如何安装pecl扩展
  14. 每天读一点职场心理学读书笔记
  15. 我爱计算机专业作文1000字,计算机人作文1000字
  16. IOST节点竞选计划公布,欢迎广大开发者参与成为节点!
  17. android 输入法确定键,android 改变输入法enter键文字 为搜索 下一个 以及前往
  18. 位深度8位什么水平_2位3通电磁阀是什么,2位3通电磁阀工作原理
  19. AI算命:千亿市场的好生意?
  20. 在Ubuntu系统上在线下载/删除/查看软件包信息apt命令

热门文章

  1. 网吧服务器系统机房图片,很多网吧看不到主机的秘密
  2. 不可不学的摄影技巧.1—构图
  3. python keys方法_Robot Framework selenium操作键盘press keys方法详解(Python篇)
  4. Cesium 影像卷帘对比
  5. 创新实训(11)——推荐系统实现之基于流行度和新鲜度的推荐
  6. 怎么快速录制高清的游戏视频?电脑或手机屏幕录制
  7. POJ 1436 Horizontally Visible Segments(线段树区间修改)
  8. mpeg怎么转换成mp4?
  9. 战地2142 我喜欢...
  10. wince tfp telnet