jsoup解析HTML及简单实例
jsoup 中文参考文献 http://www.open-open.com/jsoup/
本文将利用jsoup,简单实现网络抓取的功能,并给出一个小实例,该实例效果为:获取作者本人在博客园写的所有文章的标题。
一:建立一个java工程,导入jsoup包,junit(导入junit包,hamcrest包)。若不知junit为何要导入两个包,请点击链接‘junit的使用’。
二:建立一个demo.java类,实现代码如下:
import java.io.IOException;import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import org.junit.Test;public class demo {@Testpublic void reasUrl() throws IOException {String url = "http://www.cnblogs.com/sky-";Connection conn = Jsoup.connect(url); // 建立与url中页面的连接Document doc = conn.get(); // 解析页面Elements links = doc.select("a[href]"); // 获取页面中所有的超链接int i = 1;for (Element link : links) {if ("阅读全文".equals(link.text())) { // 获取页面中每篇文章‘阅读全文’的链接,进入文章Document doc2 = Jsoup.connect(link.attr("abs:href")).get(); // 解析每篇文章的页面System.out.println("第" + i + "篇:" + doc2.title()); // 把该文章的标题打印出来i++;}}} }
三:运行项目即可得到作者本人在博客园写的所有文章的标题
第1篇:jsoup解析HTML及简单实例 - sky_烁 - 博客园 第2篇:面向接口编程及适配器模式 - sky_烁 - 博客园 第3篇:数据库 SQL语句小结 - sky_烁 - 博客园
转载于:https://www.cnblogs.com/sky-/p/4623501.html
jsoup解析HTML及简单实例相关推荐
- Jsoup 解析Html源码实例
最近在做数据挖掘的过程中需要对html的源码进行解析,用到了Jsoup这个解析工具,下面写个基本实例来展现它的用法. 需要用到jar包:jsoup-1.7.2.jar,可以到jsoup的官网下载:ht ...
- Jsoup解析HTML实例及文档方法详解
转载自 Jsoup解析HTML实例及文档方法详解 这篇文章主要介绍了Jsoup如何解析一个HTML文档.从文件加载文档.从URL加载Document等方法,对Jsoup常用方法做了详细讲解,最近提供 ...
- java jsoup解析开彩网api接口json数据实例
https://www.cnblogs.com/zdz8207/p/7288830.html 开彩网apiJava技术学习 https://www.itkc8.com json-lib-2.4-jdk ...
- Android开发探秘之三:利用jsoup解析HTML页面
这节主要是讲解jsoup解析HTML页面.由于在android开发过程中,不可避免的涉及到web页面的抓取,解析,展示等等,所以,在这里我主要展示下利用jsoup jar包来抓取cnbeta.com网 ...
- 一步步教你为网站开发Android客户端---HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新ListView...
本文面向Android初级开发者,有一定的Java和Android知识即可. 文章覆盖知识点:HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新List ...
- Java 爬虫工具Jsoup解析
Jsoup是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址.HTML 文本内容.它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和 ...
- Android Fragment 简单实例
Android上的界面展示都是通过Activity实现的.Activity实在是太经常使用了.我相信大家都已经很熟悉了,这里就不再赘述. 可是Activity也有它的局限性,相同的界面在手机上显示可能 ...
- springMVC简单实例
springMVC简单实例 参考: 使用springMVC实现简单的登录例子 - Admol - 博客园 https://www.cnblogs.com/admol/articles/4199546. ...
- python遍历data、并输出结果_获取python运行输出的数据并解析存为dataFrame实例
在学习xg的 时候,想画学习曲线,但无奈没有没有这个 evals_result_ AttributeError: 'Booster' object has no attribute 'evals_re ...
最新文章
- 针对Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.1的解决方案
- OpenCV中CV_IS_MAT_CONT(src->type dst->type) 的含义
- python中opencv安装_怎么为python安装opencv模块-百度经验
- pyecharts第六节、水球图
- 【LeetCode160】相交链表
- 大话设计模式-策略模式与简单工厂模式
- “中国音乐金钟奖”落地成都 今年起将连续举办三届
- AS星尘粒子系统 初识2
- matlab卷积神经网络的实现,matlab卷积神经网络库
- Excel透视表实操,只需6步就能搞定!
- 限制整个手机的网速 -- 360免费wifi
- 【视觉-摄像机3】}摄像机镜头--焦距与视角(选相机和镜头)
- 史上最全的launch的解析来啦,木有之一欧
- Java实现读取txt文件数据并导入数据库
- ybt1357 车厢调度
- btrace 开源!基于 Systrace 高性能 Trace 工具
- Markdown 数学公式大帅了
- 数据清洗的几种常用手段
- 人像摆姿参考--西野七瀬(1)
- SQL语句 SQL Server(代码添加约束:主键约束,外键约束,默认值约束,check约束,规则约束)
热门文章
- mysql分组后再分组_全网最全的mysql分组后取topN的解答
- android鸿洋布局,Android基础ConstrainLayout约束布局的介绍和使用
- 基于Websocket草案10协议的升级及基于Netty的握手实现
- 边栏实现过程中,导入style.css没用
- 2020年Java讲课笔记目录
- Spring Boot基础学习笔记10:配置国际化页面
- 数据库笔记05:创建与管理数据库
- mosquitto源码分析(三)
- VS系列IDE(2005、2008等)下使用cppunit的方法及使用示例
- 二维高斯曲面拟合法求取光斑中心及算法的C++实现