创建可靠的文档结构(html标签包含head 和 body,在head只出现恰当的元素)

Jsoup常用的方法从一个URL加载一个Document 简单的get方法Document doc = Jsoup.connect("http://www.domain.com/").get();String title = doc.title(); 带头信息的post方法Document doc = Jsoup.connect("http://www..domain.com") .data("username", "Alic") .userAgent("Mozilla") .cookie("auth", "token") .timeout(3000) .post();

从文件中加载HTML文档 File file = new File("path");Document doc = Jsoup.parse(file, "UTF-8", "http://www.domian.com/");

简单的从String加载HTML Document doc = Jsoup.parse(String html);

使用DOM方法来遍历一个文档 File file = new File("/path/index.html");Document doc = Jsoup.parse(file, "UTF-8", "http://www.domian.com/");Element content = doc.getElementById("content");//获取id为content的dom节点Elements links = content.getElementsByTag("a");//获取所有的a标签dom节点//遍历所有的a标签for (Element link : links) { String linkHref = link.attr("href"); String linkText = link.text();}Elements links = doc.select("a[href]"); //带有href属性的a元素Elements pngs = doc.select("img[src$=.png]"); //扩展名为.png的图片Element masthead = doc.select("div.masthead").first(); //class等于masthead的div标签Elements resultLinks = doc.select("h3.r > a"); //在h3元素之后的a元素

常用的方法:见官网API文档传送Jsoup

本文原创发布php中文网,转载请注明出处,感谢您的尊重!

相关文章

相关视频

网友评论

文明上网理性发言,请遵守 新闻评论服务协议我要评论

立即提交

专题推荐独孤九贱-php全栈开发教程

全栈 100W+

主讲:Peter-Zhu 轻松幽默、简短易学,非常适合PHP学习入门

玉女心经-web前端开发教程

入门 50W+

主讲:灭绝师太 由浅入深、明快简洁,非常适合前端学习入门

天龙八部-实战开发教程

实战 80W+

主讲:西门大官人 思路清晰、严谨规范,适合有一定web编程基础学习

php中文网:公益在线php培训,帮助PHP学习者快速成长!

Copyright 2014-2020 https://www.php.cn/ All Rights Reserved | 苏ICP备2020058653号-1

java html遍历_Java解析和遍历html文档利器_html/css_WEB-ITnose相关推荐

  1. java设置页码_Java 添加页码到Word文档

    前言 在操作Word文档时,可以通过添加页码来使其条理清晰,以便于后期查看整理.通常来说,一个Word文档包含了多个节,我们可以忽视这些节为整个文档添加连续页码,同时也可以根据不同节来设置不连续页码. ...

  2. java pdf合并_Java 合并、拆分PDF文档

    本文将介绍如何在Java程序中合并及拆分PDF文档,合并文档时,包括合并多个不同PDF文档为一个文档,以及合并PDF文档的不同页面为一页:拆分文档是,包括将PDF文档按每一页拆分,以及按指定页数范围来 ...

  3. java接口注释_Java的注释和API文档

    Java 语言的注释一共有三种类型: 单行注释 多行注释 文档注释 一.单行注释和多行注释 单行注释就是在程序中注释一行代码,在 Java 语言中,将双斜线(//)放在需要注释的内容之前就可以了 : ...

  4. doc转pdf java不失真_java使用Aspose实现 word文档转pdf文件高效不失真

    java使用Aspose word文档转pdf功能实现 主要步骤 使用Aspose进行文档转换,首先引入相应的jar包到系统环境 项目resource下导入license.xml文件 使用Aspose ...

  5. Jsoup解析HTML实例及文档方法详解

    转载自  Jsoup解析HTML实例及文档方法详解 这篇文章主要介绍了Jsoup如何解析一个HTML文档.从文件加载文档.从URL加载Document等方法,对Jsoup常用方法做了详细讲解,最近提供 ...

  6. 粤嵌学习打卡第19天(基于DOM方式解析、生成XML文档)

    今天我们来聊聊基于DOM方式实现解析和生成XML文档 一般web开发的xnl文档: 基于DOM处理XML文档 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SIQAET ...

  7. java doc说明书_JAVADOC 常见使用方法 帮助文档

    我们知道Java中有三种注释语句:1.//用于单行注释. 2./*...*/用于多行注释,从/*开始,到*/结束,不能嵌套.3./**...*/则是为支持jdk工具javadoc.exe而特有的注释语 ...

  8. HttpHandler解析并展示PDF文档内容

    2019独角兽企业重金招聘Python工程师标准>>> HttpHandler 解析并展示 PDF 文档内容 如果我们想将服务端的 PDF 文档内容展示给客户端,往往会通过 URL ...

  9. 计算机毕业设计Java银行贷款管理系统(系统+程序+mysql数据库+Lw文档)

    计算机毕业设计Java银行贷款管理系统(系统+程序+mysql数据库+Lw文档) 计算机毕业设计Java银行贷款管理系统(系统+程序+mysql数据库+Lw文档) 本源码技术栈: 项目架构:B/S架构 ...

最新文章

  1. mysql 存储过程out,in,inout分别表示什么
  2. 配置MUX VLAN示例(汇聚层设备)
  3. WAF Bypass数据库特性(Mysql探索篇)
  4. css 边缘闪光_css文字渐变+内发光+投影效果
  5. python管理包管理工具pip和conda使用,及使用pip和conda创建虚拟环境
  6. 【微信网页版】给所有微信群发消息
  7. 怎么让电脑屏幕一直亮着_电视机指示灯亮不开机怎么办 电视机故障及维修介绍【详解】...
  8. python优雅编程_Python优雅地可视化数据
  9. 一篇文章带初学者明白:什么是编译器,什么是集成开发环境(IDE)?
  10. Vue插值文本换行问题
  11. Python全栈开发之11、进程和线程
  12. ubuntu安装python3.8_在Ubuntu 18.04系统上安装Python 3.8的两种方法
  13. DNN Navisuite菜单模块原始XML文件的格式
  14. Android签名机制学习笔记
  15. PMP考试只刷题能否通过呢?
  16. H264 数据帧头分析
  17. dotnet 使用 Obsolete 特性标记成员过时保持库和框架的兼容性
  18. android游戏地图编辑器
  19. 问卷调查的数据分析怎么做
  20. c#与汇川机器人通讯_C#与西门子PLC通讯

热门文章

  1. 计算机电源多低无法使用吗,电脑电源供电不足会怎么样 电脑电源供电不足坏处介绍【详解】...
  2. CentOS7重置root密码
  3. EPSON简单视觉应用编程
  4. Android P 新特性抢先看
  5. 女娲石,增强通知/冰箱Ice Box,冻结后台/FV悬浮球,单手也可以造作啊
  6. ILRuntime 第一集
  7. python递归函数的用法
  8. OData BATCH 使用方法
  9. 我在OData的经历
  10. 五一户外运动需要哪些装备?户外运动必备装备清单推荐