java html遍历_Java解析和遍历html文档利器_html/css_WEB-ITnose
创建可靠的文档结构(html标签包含head 和 body,在head只出现恰当的元素)
Jsoup常用的方法从一个URL加载一个Document 简单的get方法Document doc = Jsoup.connect("http://www.domain.com/").get();String title = doc.title(); 带头信息的post方法Document doc = Jsoup.connect("http://www..domain.com") .data("username", "Alic") .userAgent("Mozilla") .cookie("auth", "token") .timeout(3000) .post();
从文件中加载HTML文档 File file = new File("path");Document doc = Jsoup.parse(file, "UTF-8", "http://www.domian.com/");
简单的从String加载HTML Document doc = Jsoup.parse(String html);
使用DOM方法来遍历一个文档 File file = new File("/path/index.html");Document doc = Jsoup.parse(file, "UTF-8", "http://www.domian.com/");Element content = doc.getElementById("content");//获取id为content的dom节点Elements links = content.getElementsByTag("a");//获取所有的a标签dom节点//遍历所有的a标签for (Element link : links) { String linkHref = link.attr("href"); String linkText = link.text();}Elements links = doc.select("a[href]"); //带有href属性的a元素Elements pngs = doc.select("img[src$=.png]"); //扩展名为.png的图片Element masthead = doc.select("div.masthead").first(); //class等于masthead的div标签Elements resultLinks = doc.select("h3.r > a"); //在h3元素之后的a元素
常用的方法:见官网API文档传送Jsoup
本文原创发布php中文网,转载请注明出处,感谢您的尊重!
相关文章
相关视频
网友评论
文明上网理性发言,请遵守 新闻评论服务协议我要评论
立即提交
专题推荐独孤九贱-php全栈开发教程
全栈 100W+
主讲:Peter-Zhu 轻松幽默、简短易学,非常适合PHP学习入门
玉女心经-web前端开发教程
入门 50W+
主讲:灭绝师太 由浅入深、明快简洁,非常适合前端学习入门
天龙八部-实战开发教程
实战 80W+
主讲:西门大官人 思路清晰、严谨规范,适合有一定web编程基础学习
php中文网:公益在线php培训,帮助PHP学习者快速成长!
Copyright 2014-2020 https://www.php.cn/ All Rights Reserved | 苏ICP备2020058653号-1
java html遍历_Java解析和遍历html文档利器_html/css_WEB-ITnose相关推荐
- java设置页码_Java 添加页码到Word文档
前言 在操作Word文档时,可以通过添加页码来使其条理清晰,以便于后期查看整理.通常来说,一个Word文档包含了多个节,我们可以忽视这些节为整个文档添加连续页码,同时也可以根据不同节来设置不连续页码. ...
- java pdf合并_Java 合并、拆分PDF文档
本文将介绍如何在Java程序中合并及拆分PDF文档,合并文档时,包括合并多个不同PDF文档为一个文档,以及合并PDF文档的不同页面为一页:拆分文档是,包括将PDF文档按每一页拆分,以及按指定页数范围来 ...
- java接口注释_Java的注释和API文档
Java 语言的注释一共有三种类型: 单行注释 多行注释 文档注释 一.单行注释和多行注释 单行注释就是在程序中注释一行代码,在 Java 语言中,将双斜线(//)放在需要注释的内容之前就可以了 : ...
- doc转pdf java不失真_java使用Aspose实现 word文档转pdf文件高效不失真
java使用Aspose word文档转pdf功能实现 主要步骤 使用Aspose进行文档转换,首先引入相应的jar包到系统环境 项目resource下导入license.xml文件 使用Aspose ...
- Jsoup解析HTML实例及文档方法详解
转载自 Jsoup解析HTML实例及文档方法详解 这篇文章主要介绍了Jsoup如何解析一个HTML文档.从文件加载文档.从URL加载Document等方法,对Jsoup常用方法做了详细讲解,最近提供 ...
- 粤嵌学习打卡第19天(基于DOM方式解析、生成XML文档)
今天我们来聊聊基于DOM方式实现解析和生成XML文档 一般web开发的xnl文档: 基于DOM处理XML文档 [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-SIQAET ...
- java doc说明书_JAVADOC 常见使用方法 帮助文档
我们知道Java中有三种注释语句:1.//用于单行注释. 2./*...*/用于多行注释,从/*开始,到*/结束,不能嵌套.3./**...*/则是为支持jdk工具javadoc.exe而特有的注释语 ...
- HttpHandler解析并展示PDF文档内容
2019独角兽企业重金招聘Python工程师标准>>> HttpHandler 解析并展示 PDF 文档内容 如果我们想将服务端的 PDF 文档内容展示给客户端,往往会通过 URL ...
- 计算机毕业设计Java银行贷款管理系统(系统+程序+mysql数据库+Lw文档)
计算机毕业设计Java银行贷款管理系统(系统+程序+mysql数据库+Lw文档) 计算机毕业设计Java银行贷款管理系统(系统+程序+mysql数据库+Lw文档) 本源码技术栈: 项目架构:B/S架构 ...
最新文章
- mysql 存储过程out,in,inout分别表示什么
- 配置MUX VLAN示例(汇聚层设备)
- WAF Bypass数据库特性(Mysql探索篇)
- css 边缘闪光_css文字渐变+内发光+投影效果
- python管理包管理工具pip和conda使用,及使用pip和conda创建虚拟环境
- 【微信网页版】给所有微信群发消息
- 怎么让电脑屏幕一直亮着_电视机指示灯亮不开机怎么办 电视机故障及维修介绍【详解】...
- python优雅编程_Python优雅地可视化数据
- 一篇文章带初学者明白:什么是编译器,什么是集成开发环境(IDE)?
- Vue插值文本换行问题
- Python全栈开发之11、进程和线程
- ubuntu安装python3.8_在Ubuntu 18.04系统上安装Python 3.8的两种方法
- DNN Navisuite菜单模块原始XML文件的格式
- Android签名机制学习笔记
- PMP考试只刷题能否通过呢?
- H264 数据帧头分析
- dotnet 使用 Obsolete 特性标记成员过时保持库和框架的兼容性
- android游戏地图编辑器
- 问卷调查的数据分析怎么做
- c#与汇川机器人通讯_C#与西门子PLC通讯