使用text()来做标记,用来确定位置.

测试文本

">    <tbody><tr class="result1"><th class="field-name">Type</th><td>Electronic Thesis or Dissertation</td></tr><tr class="result2"><th class="field-name">Type</th><td>Text</td></tr><tr class="result1"><th class="field-name">Type</th><td>Image</td></tr><tr class="result2"><th class="field-name">Type</th><td>StillImage</td></tr><tr class="result1"><th class="field-name">Language</th><td>fr</td></tr><tr class="result2"><th class="field-name">Identifier</th><td><a onclick="ga('send', 'event', 'External-link', 'Identifier', '/full.php?id=1183922'); return logDownload('1183922');"href="http://www.theses.fr/2016SACLS038"title="View original record">http://www.theses.fr/2016SACLS038</a></td></tr></tbody>
</table>

//th[.='Type'] # 获取到所有文本为Type的值.

我们为了获取,第一个文本

需要在此基础上我们获取它的父节点下面的td的文本内容../td/text(),我们只需要获取第一个值加一个坐标.

(//th[.='Type']/../td/text())[1]  # 得到预期的结果 Electronic Thesis or Dissertation
使用属性的多值匹配 使用contains

倘若属性的值发生变化.但是存在一定规律,如下图class='result1'或者是class='result2'之类的.我们需要获取他们的内容.

<tr class="result1"><th class="field-name">Type</th><td>Electronic Thesis or Dissertation</td>
</tr>
<tr class="result2"><th class="field-name">Type</th><td>Text</td>
</tr>
<tr class="result1"><th class="field-name">Type</th><td>Image</td>
</tr>
<tr class="result2"><th class="field-name">Type</th><td>StillImage</td>
</tr>
<tr class="result1"><th class="field-name">Language</th><td>fr</td>
</tr>

xpath 语法

//tr[contains(@class,'result')] # 得到所有class 包含result的语句
获取多个参数
<div class="accordion-tabbed__tab-mobile "><a href="#" data-id="a2" data-db-target-for="a2" title="Costa M. L."class="author-name accordion-tabbed__control visible-x"><span>Costa M. L.</span><i aria-hidden="true"class="icon-arrow_d_n"></i></a><div data-db-target-of="a2" class="author-info accordion-tabbed__content"><p>PhD, FRCS (Tr &amp; Orth), ClinicalSenior Lecturer</p><p class="author-type"></p><p></p><p>1Clinical Sciences Institute University of Warwick Medical School, Clinical Sciences Building, UniversityHospital, Clifford Bridge Road, Coventry CV2 2DX, UK.</p><div class="bottom-info"><p><a href="/author/Costa%2C+M+L">Search for more papers by this author</a></p></div></div>
</div>


需要一条xpath获取他们的名字,职位,跟机构.

//div[a/span/text() and div/p/text() and div/div/p/a/text()]

xpath 准确匹配 跟 模糊匹配属性相关推荐

  1. Kibana查询语言(KQL)AND、OR匹配,模糊匹配

    一. 前言 现在大多数的公司都会使用ELK组合来对日志数据的收集.存储和提供查询服务.ElasticSearch + Logstash+ Kibana. 查询数据库,如果是MySQL,那么就需要使用M ...

  2. element中组件el-autocomplete远程搜索之精确匹配和模糊匹配

    在实际开发项目中总是会遇到很多难以预测的情况, 比如el-autocomplete的远程搜索时,经常会从服务器发起搜索,然后把对象带出的相关值赋给其他标签元素,一般模糊匹配没问题,但是精确匹配会存在一 ...

  3. python dataframe 模糊匹配_Python模糊匹配(FuzzyWuzzy) – 保持最佳匹配

    我正在尝试模糊匹配两个csv文件,每个文件包含一列相似但不相同的名称. 我的代码到目前为止如下: import pandas as pd from pandas import DataFrame fr ...

  4. 正则表达式的精确匹配和模糊匹配的写法区别

    精确匹配: 写法: /^(你要匹配的内容)$/ //判断后缀名 //匹配域名后缀的实例 var name1 = /^(art|auto|beer|com|cn|co|cc|chat|club|cool ...

  5. python 地址模糊匹配_使用python处理selenium中的xpath定位元素的模糊匹配问题

    # 用contains,寻找页面中style属性值包含有sp.gif这个关键字的所有div元素,其中@后面可以跟该元素任意的属性名. self.driver.find_element_by_xpath ...

  6. css正則匹配、模糊匹配

    //所有class包含font-red的p标签 p[class~="font-red"] {color: red;} [abc^="def"] 选择 abc 属 ...

  7. excel 两列模糊匹配给出结果_北大硕士给大脑植入Excel病毒,工作效率提升了好几倍...

    在工作中,我们经常会碰到这样的同事,他们是这样完成工作的: 先用计算器算好结果,甚者动用手指头在电脑屏幕上数数,然后把数据填写到Excel表格中. 结果可以预见,原本可以在上班时间完成的工作,愣是加班 ...

  8. React中的模糊匹配与精准匹配

    路由的严格匹配与模糊匹配 1.默认使用的是模糊匹配(简单记:[输入的路径]必须包含要[匹配的路径],且顺序要一致)2.开启严格匹配:<Route exact={true} path=" ...

  9. 【Excel高效工作3】VLOOKUP函数实例使用(二):精确匹配进阶——反向查找,多条件查找 / 模糊匹配的使用

    本章内容: 上一章用实例展示了VLOOKUP函数最基本的功能:精确匹配 的基础用法.然而,实际工作中对我们提出的需求会更高,面对某些更加复杂的情况,我们可能需要对Excel表格数据先进行预处理,再使用 ...

最新文章

  1. 使用pycharm将自己项目代码上传github(保姆教程)
  2. .OCX、.dll文件注册命令Regsvr32的使用
  3. python爬虫教程 百度云-如何使用python编程【python爬虫教程 百度云】
  4. [Manifest]关于sharedUserIdsharedUserLabel
  5. aba会导致问题_护发素会导致掉发?这个纠结多年的问题,真相原来是这回事
  6. mysql数据库 日志类型_MySQL中的日志类型(一)-摘要和日志的共同特征
  7. 深度学习-Tensorflow2.2-Tensorboard可视化{5}-可视化基础-17
  8. ROS系统中的多个版本Boost问题
  9. 上手深度学习之前,我们先聊聊“数学”
  10. word双引号间距大_微软判定:Word 编辑英文句号后“两个空格”为拼写异常
  11. 回归标准差和残差平方和的关系_一文详解经典回归分析
  12. 免费杀软中的王者:德国小红伞评测
  13. Win7小工具“美女报时”,搜道版,v1.0.4.0
  14. 8、某网络拓扑如图所示,路由器R1通过接口E1、E2分别连接局域网1、局域网2,通过接口L0连接路由器R2,并通过路由器R2连接域名服务器与互联网。R1的L0接口的IP地址是202.118.2.1/2
  15. react简书项目学习笔记38如何拿到页面的输入值
  16. Python 3 字符串 center( ) 方法
  17. Android技能树 — 树基础知识小结(一),kotlin开源项目
  18. 【机器学习】笔记1:回归与误差分析
  19. 【转载】【《Real-Time Rendering 3rd》 提炼总结】(四) 第五章 · 图形渲染与视觉外观 The Visual Appearance
  20. 吃瓜(西瓜书-南瓜书)1、2章

热门文章

  1. scrapy shell 调试报错TypeError: module.__init__() takes at most 2 arguments (3 g iven)
  2. 各个等级测试工程师所需的必要技能
  3. 某app登录协议逆向分析
  4. Convert的用法
  5. python 函数的使用方法
  6. Python条码识别:使用Python进行条形码识别的详细教程
  7. ”AE-OT A NEW GENERATIVE MODEL BASED ON EXTENDED“阅读笔记
  8. React的Render的简单实现
  9. TM4C123G 硬件spi
  10. ip地址位置提供商查询 cip.cc/ip