jsoup 中文参考文献    http://www.open-open.com/jsoup/

本文将利用jsoup,简单实现网络抓取的功能,并给出一个小实例,该实例效果为:获取作者本人在博客园写的所有文章的标题。

一:建立一个java工程,导入jsoup包,junit(导入junit包,hamcrest包)。若不知junit为何要导入两个包,请点击链接‘junit的使用’

二:建立一个demo.java类,实现代码如下:

import java.io.IOException;import org.jsoup.Connection;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import org.junit.Test;public class demo {@Testpublic void reasUrl() throws IOException {String url = "http://www.cnblogs.com/sky-";Connection conn = Jsoup.connect(url); // 建立与url中页面的连接Document doc = conn.get(); // 解析页面Elements links = doc.select("a[href]"); // 获取页面中所有的超链接int i = 1;for (Element link : links) {if ("阅读全文".equals(link.text())) { // 获取页面中每篇文章‘阅读全文’的链接,进入文章Document doc2 = Jsoup.connect(link.attr("abs:href")).get(); // 解析每篇文章的页面System.out.println("第" + i + "篇:" + doc2.title()); // 把该文章的标题打印出来i++;}}}
}

三:运行项目即可得到作者本人在博客园写的所有文章的标题

第1篇:jsoup解析HTML及简单实例 - sky_烁 - 博客园
第2篇:面向接口编程及适配器模式 - sky_烁 - 博客园
第3篇:数据库 SQL语句小结 - sky_烁 - 博客园

转载于:https://www.cnblogs.com/sky-/p/4623501.html

jsoup解析HTML及简单实例相关推荐

  1. Jsoup 解析Html源码实例

    最近在做数据挖掘的过程中需要对html的源码进行解析,用到了Jsoup这个解析工具,下面写个基本实例来展现它的用法. 需要用到jar包:jsoup-1.7.2.jar,可以到jsoup的官网下载:ht ...

  2. Jsoup解析HTML实例及文档方法详解

    转载自  Jsoup解析HTML实例及文档方法详解 这篇文章主要介绍了Jsoup如何解析一个HTML文档.从文件加载文档.从URL加载Document等方法,对Jsoup常用方法做了详细讲解,最近提供 ...

  3. java jsoup解析开彩网api接口json数据实例

    https://www.cnblogs.com/zdz8207/p/7288830.html 开彩网apiJava技术学习 https://www.itkc8.com json-lib-2.4-jdk ...

  4. Android开发探秘之三:利用jsoup解析HTML页面

    这节主要是讲解jsoup解析HTML页面.由于在android开发过程中,不可避免的涉及到web页面的抓取,解析,展示等等,所以,在这里我主要展示下利用jsoup jar包来抓取cnbeta.com网 ...

  5. 一步步教你为网站开发Android客户端---HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新ListView...

    本文面向Android初级开发者,有一定的Java和Android知识即可. 文章覆盖知识点:HttpWatch抓包,HttpClient模拟POST请求,Jsoup解析HTML代码,动态更新List ...

  6. Java 爬虫工具Jsoup解析

    Jsoup是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址.HTML 文本内容.它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和 ...

  7. Android Fragment 简单实例

    Android上的界面展示都是通过Activity实现的.Activity实在是太经常使用了.我相信大家都已经很熟悉了,这里就不再赘述. 可是Activity也有它的局限性,相同的界面在手机上显示可能 ...

  8. springMVC简单实例

    springMVC简单实例 参考: 使用springMVC实现简单的登录例子 - Admol - 博客园 https://www.cnblogs.com/admol/articles/4199546. ...

  9. python遍历data、并输出结果_获取python运行输出的数据并解析存为dataFrame实例

    在学习xg的 时候,想画学习曲线,但无奈没有没有这个 evals_result_ AttributeError: 'Booster' object has no attribute 'evals_re ...

最新文章

  1. 针对Failed to execute goal org.apache.maven.plugins:maven-compiler-plugin:3.1的解决方案
  2. OpenCV中CV_IS_MAT_CONT(src->type dst->type) 的含义
  3. python中opencv安装_怎么为python安装opencv模块-百度经验
  4. pyecharts第六节、水球图
  5. 【LeetCode160】相交链表
  6. 大话设计模式-策略模式与简单工厂模式
  7. “中国音乐金钟奖”落地成都 今年起将连续举办三届
  8. AS星尘粒子系统 初识2
  9. matlab卷积神经网络的实现,matlab卷积神经网络库
  10. Excel透视表实操,只需6步就能搞定!
  11. 限制整个手机的网速 -- 360免费wifi
  12. 【视觉-摄像机3】}摄像机镜头--焦距与视角(选相机和镜头)
  13. 史上最全的launch的解析来啦,木有之一欧
  14. Java实现读取txt文件数据并导入数据库
  15. ybt1357 车厢调度
  16. btrace 开源!基于 Systrace 高性能 Trace 工具
  17. Markdown 数学公式大帅了
  18. 数据清洗的几种常用手段
  19. 人像摆姿参考--西野七瀬(1)
  20. SQL语句 SQL Server(代码添加约束:主键约束,外键约束,默认值约束,check约束,规则约束)

热门文章

  1. mysql分组后再分组_全网最全的mysql分组后取topN的解答
  2. android鸿洋布局,Android基础ConstrainLayout约束布局的介绍和使用
  3. 基于Websocket草案10协议的升级及基于Netty的握手实现
  4. 边栏实现过程中,导入style.css没用
  5. 2020年Java讲课笔记目录
  6. Spring Boot基础学习笔记10:配置国际化页面
  7. 数据库笔记05:创建与管理数据库
  8. mosquitto源码分析(三)
  9. VS系列IDE(2005、2008等)下使用cppunit的方法及使用示例
  10. 二维高斯曲面拟合法求取光斑中心及算法的C++实现