在解析获得一个Document实例对象,并查找到一些元素之后,你希望取得在这些元素中的数据。要取得一个属性的值,可以使用Node.attr(String key) 方法

对于一个元素中的文本,可以使用Element.text()方法

对于要取得元素或属性中的HTML内容,可以使用Element.html(), 或 Node.outerHtml()方法

示例:String html = "

An example link.

";

Document doc = Jsoup.parse(html);//解析HTML字符串返回一个Document实现

Element link = doc.select("a").first();//查找第一个a元素

String text = doc.body().text(); // "An example link"//取得字符串中的文本

String linkHref = link.attr("href"); // "http://example.com/"//取得链接地址

String linkText = link.text(); // "example""//取得链接地址中的文本

String linkOuterH = link.outerHtml();

// "example"

String linkInnerH = link.html(); // "example"//取得链接内的html内容

上述方法是元素数据访问的核心办法。此外还其它一些方法可以使用:

这些访问器方法都有相应的setter方法来更改数据。

参考资料:

jsoup 标准化html代码,Jsoup从元素抽取属性,文本和HTML相关推荐

  1. Jsoup从元素中抽取属性 文本和HTML

    在解析获得一个Document实例对象,并查找到一些元素之后,我们如何取得在这些元素中的数据呢??? 使用Jsoup抽取属性,一般方法如下: 1.要取得一个属性的值,可以使用Node.attr(Str ...

  2. Jsoup(一)Jsoup详解(官方)

    1.1.简介 jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址.HTML文本内容.它提供了一套非常省力的API, 可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作 ...

  3. 一步步教你为网站开发Android客户端---HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新ListView...

    本文面向Android初级开发者,有一定的Java和Android知识即可. 文章覆盖知识点:HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新List ...

  4. Java使用Jsoup爬虫获取网站内容(三)获取元素内容属性的方法

    介绍 我们可以通过Jsoup来获取一个Document对象,然后通过对Document对象进行解析来获取元素对象,最后通过元素对象的一些方法来获取元素的属性名称,属性值以及文本内容. 代码 附上获取方 ...

  5. java jsoup解析_3使用Jsoup解析Java中HTML文件的示例

    java jsoup解析 HTML是Web的核心,无论您是通过JavaScript,JSP,PHP,ASP或任何其他Web技术动态生成的,您在Internet上看到的所有页面都是基于HTML的. 您的 ...

  6. Jsoup,一款超好用的HTML文本解析Java工具

    引言 对于一段HTML文本,需要去掉文本内所有HTML标签,只保留纯文本内容,可以怎么实现?看到很多写正则表达式,用StringUtils里的replace方法实现的.我自己也尝试了一下,发现正则匹配 ...

  7. android爬虫框架jsoup,Android笔记之JSoup爬虫入门

    前言 闲扯一些没用的,写这篇文章之前是有点私心的,因为之前评论某简书大v的文章是鸡汤,瞬间被拉黑,连个解释和说明的机会都没有,文章语言干涩,内容平平,于是就好奇到底是些什么样的人喜欢和吹捧这样的鸡汤作 ...

  8. jsoup html转义处理,jsoup解析网页出现转义符问题

    https://www.oschina.net/question/996055_136438 *************************************** 我要解析这个网页  htt ...

  9. jsoup html转义处理,JSOUP 如何避免转义字符

    JSOUP 如何避免转义字符 JSOUP 如何避免转义字符 日期:2014-05-20 浏览次数:20358 次 JSOUP 如何处理转义字符? 比如我用JSOUP 爬到如下HTML,我如何解析? 比 ...

最新文章

  1. 谷歌系自动驾驶公司再获4千万美元融资,核心产品是仿真软件
  2. 软件项目版本号的命名规则及格式
  3. 一篇文章带你了解Flannel
  4. java final的内存_Java并发编程之final域的内存语义
  5. LOOPS HDU - 3853(概率dp,期望)
  6. 电梯tt服务器显示第二行啥意思,【大杂烩】〖其他〗奥的斯电梯服务调试器按键说明(TT)...
  7. 35岁北大博士拟升市长
  8. 前后端敏感数据加密方案及实现_02
  9. mysql在可视化软件navicat中如何解决中文乱码问题
  10. boost::lockfree::queue多线程读写实例
  11. webpack 4.0 中 clean-webpack-plugin 的使用
  12. MongoDB 的分片技术
  13. vs2010sp1安装失败问题
  14. 通过stm32cubemx配置DCMI驱动ov5640摄像头
  15. 计算机网络线接法,电脑网线插座接法图文详解
  16. 一个读者大佬精心总结的阿里、腾讯、宇宙条大厂 Offer 面经和硬核面试攻略
  17. java中String转byte 编码格式
  18. Android App 耗电量分析-1
  19. 为什么日本人不吃鲤鱼
  20. 表单input标签type属性详解

热门文章

  1. 搭建Android开发环境 以及 ionic 编译安卓app步骤
  2. 用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践
  3. Win32程序开发流程--《深入浅出MFC》
  4. Linux下批量kill掉进程
  5. 基于Bootstrap的jQuery开关按钮插件
  6. 设计模式之Builder(建造者)(转)
  7. CentOS7 Tomcat安装
  8. eclipse中使用javap分析java代码备忘
  9. 线程安全与锁优化(思维导图)
  10. 模拟电子技术_清华大学华成英教授主讲之符号说明