jsoup 标准化html代码,Jsoup从元素抽取属性,文本和HTML
在解析获得一个Document实例对象,并查找到一些元素之后,你希望取得在这些元素中的数据。要取得一个属性的值,可以使用Node.attr(String key) 方法
对于一个元素中的文本,可以使用Element.text()方法
对于要取得元素或属性中的HTML内容,可以使用Element.html(), 或 Node.outerHtml()方法
示例:String html = "
An example link.
";
Document doc = Jsoup.parse(html);//解析HTML字符串返回一个Document实现
Element link = doc.select("a").first();//查找第一个a元素
String text = doc.body().text(); // "An example link"//取得字符串中的文本
String linkHref = link.attr("href"); // "http://example.com/"//取得链接地址
String linkText = link.text(); // "example""//取得链接地址中的文本
String linkOuterH = link.outerHtml();
// "example"
String linkInnerH = link.html(); // "example"//取得链接内的html内容
上述方法是元素数据访问的核心办法。此外还其它一些方法可以使用:
这些访问器方法都有相应的setter方法来更改数据。
参考资料:
jsoup 标准化html代码,Jsoup从元素抽取属性,文本和HTML相关推荐
- Jsoup从元素中抽取属性 文本和HTML
在解析获得一个Document实例对象,并查找到一些元素之后,我们如何取得在这些元素中的数据呢??? 使用Jsoup抽取属性,一般方法如下: 1.要取得一个属性的值,可以使用Node.attr(Str ...
- Jsoup(一)Jsoup详解(官方)
1.1.简介 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API, 可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作 ...
- 一步步教你为网站开发Android客户端---HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新ListView...
本文面向Android初级开发者,有一定的Java和Android知识即可. 文章覆盖知识点:HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新List ...
- Java使用Jsoup爬虫获取网站内容(三)获取元素内容属性的方法
介绍 我们可以通过Jsoup来获取一个Document对象,然后通过对Document对象进行解析来获取元素对象,最后通过元素对象的一些方法来获取元素的属性名称,属性值以及文本内容. 代码 附上获取方 ...
- java jsoup解析_3使用Jsoup解析Java中HTML文件的示例
java jsoup解析 HTML是Web的核心,无论您是通过JavaScript,JSP,PHP,ASP或任何其他Web技术动态生成的,您在Internet上看到的所有页面都是基于HTML的. 您的 ...
- Jsoup,一款超好用的HTML文本解析Java工具
引言 对于一段HTML文本,需要去掉文本内所有HTML标签,只保留纯文本内容,可以怎么实现?看到很多写正则表达式,用StringUtils里的replace方法实现的.我自己也尝试了一下,发现正则匹配 ...
- android爬虫框架jsoup,Android笔记之JSoup爬虫入门
前言 闲扯一些没用的,写这篇文章之前是有点私心的,因为之前评论某简书大v的文章是鸡汤,瞬间被拉黑,连个解释和说明的机会都没有,文章语言干涩,内容平平,于是就好奇到底是些什么样的人喜欢和吹捧这样的鸡汤作 ...
- jsoup html转义处理,jsoup解析网页出现转义符问题
https://www.oschina.net/question/996055_136438 *************************************** 我要解析这个网页 htt ...
- jsoup html转义处理,JSOUP 如何避免转义字符
JSOUP 如何避免转义字符 JSOUP 如何避免转义字符 日期:2014-05-20 浏览次数:20358 次 JSOUP 如何处理转义字符? 比如我用JSOUP 爬到如下HTML,我如何解析? 比 ...
最新文章
- 谷歌系自动驾驶公司再获4千万美元融资,核心产品是仿真软件
- 软件项目版本号的命名规则及格式
- 一篇文章带你了解Flannel
- java final的内存_Java并发编程之final域的内存语义
- LOOPS HDU - 3853(概率dp,期望)
- 电梯tt服务器显示第二行啥意思,【大杂烩】〖其他〗奥的斯电梯服务调试器按键说明(TT)...
- 35岁北大博士拟升市长
- 前后端敏感数据加密方案及实现_02
- mysql在可视化软件navicat中如何解决中文乱码问题
- boost::lockfree::queue多线程读写实例
- webpack 4.0 中 clean-webpack-plugin 的使用
- MongoDB 的分片技术
- vs2010sp1安装失败问题
- 通过stm32cubemx配置DCMI驱动ov5640摄像头
- 计算机网络线接法,电脑网线插座接法图文详解
- 一个读者大佬精心总结的阿里、腾讯、宇宙条大厂 Offer 面经和硬核面试攻略
- java中String转byte 编码格式
- Android App 耗电量分析-1
- 为什么日本人不吃鲤鱼
- 表单input标签type属性详解