我假设评论中的引号是相同的,常规qoute字符“ – 不是显示此问题时出现的排版不同的起始和结束引用.

如果这个假设是错误的,只需将下面表达式中的标准引号替换为相应的引用.

使用(如果有问题的评论是文档中的第一个):

substring-before(substring-after(//comment(),'"'),'"')

这会产生字符串(不带引号):

“ X ”

对于引号中的第二个字符串,使用:

substring-before(

substring-after(

substring-after(

substring-after(//comment(),'"')

基于XSLT的验证(因为XSLT样式表必须是格式良好的XML文档,我们用实体& quot替换表达式中的引号 – 只是为了避免由嵌套引号引起的错误):

xmlns:xsl="http://www.w3.org/1999/XSL/Transform">

""

=============

"

"substring-before(substring-after(substring-after(substring-after(//comment(),'"')"/>"

对此XML文档应用此转换时:

Hello.

评估两个XPath表达式,并将这两个评估的结果复制到输出(用引号括起来显示复制的确切字符串):

" X "

=============

" Y "

html字符串使用xpath,使用XPath和regex在HTML注释中提取文本相关推荐

  1. python xpath语法-XPath语法和lxml模块(数据提取)

    XPath语法和lxml模块 XPath lxml库 1.什么是XPath? XPath (XML Path Language) 是一门在 XML 文档中查找信息的语言,可用来在 XML 文档中对元素 ...

  2. Python网络爬虫开发实战使用XPath,xpath的多种用法

    XPath,全称XML Path Language,即XML路径语言,它是一门在XML文档中查找信息的语言.它最初是用来搜寻XML文档的,但是它同样适用于HTML文档的搜索. 很多人学习python, ...

  3. Xpath string()提取多个子节点中的文本

    <div><ul class="show"><li>275万购昌平邻铁三居 总价20万买一居</li><li>00万内购 ...

  4. python xpath语法-XPath 语法

    XPath 语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集.节点是通过沿着路径 (path) 或者步 (steps) 来选取的. XML 实例文档 我们将在下面的例子中使用这个 ...

  5. 在Scrapy中如何利用Xpath选择器从HTML中提取目标信息(两种方式)

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 坚定,严谨,勤奋,开拓 前一阵子我 ...

  6. php 换行 html_php-自动换行/剪切HTML字符串中的文本

    在这里,我想做的是:我有一个包含HTML标签的字符串,并且我想使用除HTML标签之外的自动换行功能将其剪切. 我被卡住了: public function textWrap($string, $wid ...

  7. 从html中提取手机号码,C#从字符串中提取电话号码、手机号码

    C#程序目的:从一堆字符串中提取电话号码.手机号码,要求字符串中的号码以非数字字符分割.原理:利用正则表达式提取纯数字字符串数组,然后利用长度等号码特征,筛选过滤. 代码: //思路仅供参考 //nu ...

  8. 如何从字符串中删除文本?

    本文翻译自:How to remove text from a string? I've got a data-123 string. 我有一个data-123字符串. How can I remov ...

  9. java学习中,字符串使用(比较、构造方法)(java 学习中的小记录)

    java学习中,字符串使用(比较.构造方法)(java 学习中的小记录)作者:王可利(Star·星星) String的使用 1.在内存中是如何保存字符串. == :比较的是地址(引用数据类型) equ ...

最新文章

  1. React 循环渲染 5
  2. Windows Small Business Server 2003 意外关闭 ; 1001, 1013 和 1014 事件记录
  3. 微信小程序星级评分和展示
  4. 我的android面试经历
  5. python基础-C扩展
  6. C/C++进程文件锁 之 fcntl函数的用法总结(非阻塞O_NONBLOCK)
  7. csv去重 python_python去重函数是什么
  8. Android 控件 之 Adapter 基础讲解
  9. 基于 python + WebDriverAgent 的“跳一跳”小程序高分教程 1
  10. 昆腾公司稍感安慰:向外扩展存储业务营收有所提升
  11. MATLAB命令大全
  12. 基于labview的虚拟简单信号发生器
  13. 这次,多地消防控制室双人值守可变单人值守
  14. .NET之盛派微信SDK简单操作
  15. PL330 DMAC笔记(3) - 外设请求接口,事件和中断,Abort
  16. 简洁的旅行青蛙个人主页纯静态HTML
  17. android EditText 设置弹出数字输入法键盘
  18. 智慧园区地图导航解决方案,如何实现园区内地图导航?
  19. prefetch()
  20. python怎么编译dex_用python一步步解剖dex文件(二)

热门文章

  1. linux 系统管理 启动管理器Grub lilo
  2. Python3 对于中文文件的读写处理
  3. maven里如何根据不同的environment打包
  4. Spring自动扫描组件
  5. 淘宝账号基于OAuth2.0的登录验证授权登陆第三方网站
  6. ASP.NET2.0 验证cookie详解
  7. mysql高并发下主键冲突
  8. while opening read connection: jdbc:mysql message from server: Host is not allowed to connect to t
  9. ThinkPHP跨控制器调用方法
  10. linux php7 安装redis扩展(php7可以使用自测)