html xpath java_Java根据XPath提取HTML

有这样一段HTML：

希望通过这个XPath提取出Hello：

//div//td[contains(@id, 'foo')]/text()

先导入maven依赖：

net.sourceforge.htmlcleaner

htmlcleaner

2.21

main函数：

package com.my.demo;

import javax.xml.xpath.XPath;

import javax.xml.xpath.XPathConstants;

import javax.xml.xpath.XPathFactory;

import org.htmlcleaner.CleanerProperties;

import org.htmlcleaner.DomSerializer;

import org.htmlcleaner.HtmlCleaner;

import org.htmlcleaner.TagNode;

import org.w3c.dom.Document;

public class HtmlXpathJava {

public static void main(String[] args) {

String sampleHtml = "

String sampleXpath = "//div//td[contains(@id, 'foo')]/text()";

System.out.println(getValueByXpath(sampleXpath, sampleHtml));

}

/**

* Extract value by xPath from HTML.

private static String getValueByXpath(String xPath, String html) {

TagNode tagNode = new HtmlCleaner().clean(html);

String value = null;

try {

Document doc = new DomSerializer(new CleanerProperties()).createDOM(tagNode);

XPath xpath = XPathFactory.newInstance().newXPath();

value = (String) xpath.evaluate(xPath, doc, XPathConstants.STRING);

} catch (Exception e) {

System.out.println("Extract value error. " + e.getMessage());

e.printStackTrace();

}

return value;

}

输出：

Hello

参考：

html xpath java_Java根据XPath提取HTML相关推荐

python xpath语法-Python Xpath语法
一.python数据提取xpath 1.beautifulsoup xpath 正则表达式 2.xpath是一种在XML和HTML文档中查找信息的语言,可用来在XML和HTML中对元素进行遍历 Chr ...
python xpath语法-Python xpath表达式如何实现数据处理
xpath表达式 1. xpath语法 ? 1 2 3 4 5 6 7 8 9 10 Harry Potter 999 Learning XML 888 1.1 选取节点 XPath 使用路径表达式来 ...
python xpath语法-python xpath 基本用法
发布时间: pythonercn 8 months, 3 weeks ago 在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也 ...
python中xpath用法_python xpath 基本用法
发布时间: pythonercn 8 months, 3 weeks ago 在进行网页抓取的时候,分析定位html节点是获取抓取信息的关键,目前我用的是lxml模块(用来分析XML文档结构的,当然也 ...
进一步了解XPath（利用XPath爬取飞哥的博客）【python爬虫入门进阶】（04）
您好,我是码农飞哥,感谢您阅读本文,欢迎一键三连哦. 本文是爬虫专栏的第四篇,重点介绍lxml库与XPath搭配使用解析网页提取网页内容. 干货满满,建议收藏,系列文章持续更新. 小伙伴们如有问题及需 ...
【Python XPath】使用XPath返回空值
使用XPath返回空值再练习使用XPath来爬取数据时,出现了以下情况,本人由于想要快捷,直接使用浏览器复制,结果返回了空的列表,为了验证,本人去浏览器搜索栏查看一开始以为是复制错了,就自己写全 ...
解析html生成xpath,html使用xpath解析xml
test.xml: Everyday Italian Giada De Laurentiis 2005 30.00 Harry Potter J K. Rowling 2005 29.99 XQuer ...
Jmeter(六）关联之XPath提取器
如果请求返回的消息为xml或html格式的,可以用XPath提取器来提取需要的数据以http://www.weather.com.cn/为例: 先新建一个HTTP请求GetCityURL,获取城市天 ...
java node子节点_使用Java的XPath循环遍历节点并提取特定的子节点值
我从谷歌了解到,使用XPath从XML中提取数据比使用DOM循环更有意义. 目前,我已经使用DOM实现了一个解决方案,但是代码很冗长,感觉不整洁且不可维护,所以我想切换到更清洁的XPath解决方案. ...

html xpath java_Java根据XPath提取HTML

html xpath java_Java根据XPath提取HTML相关推荐

最新文章

热门文章