Jsoup的maven坐标:

        <!-- https://mvnrepository.com/artifact/org.jsoup/jsoup --><dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.11.3</version></dependency>

Java代码:

package com.zifeiy.test;import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.OutputStreamWriter;
import java.util.ArrayList;
import java.util.List;import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;public class XinwenGetter {private static List<String> urlList = new ArrayList<String>();private static OutputStreamWriter out;private static void getUrlList() throws IOException {for (int i = 1; i <= 44; i ++) {String url = null;if (i == 0) {url = "http://www.xwlbo.com/txt.html";} else {url = "http://www.xwlbo.com/txt_" + i + ".html";}Document doc = Jsoup.connect(url).get();Elements xwlistElements = doc.getElementsByClass("xwlist");Elements aElements = xwlistElements.get(0).select("a");for (Element element : aElements) {String resUrl = element.attr("href");urlList.add(resUrl);}}}private static void solve(String url) throws IOException {Document doc = Jsoup.connect(url).get();System.out.println("handling " + doc.title() + " ...");out.write("<h3>" + doc.title() + "</h3>\r\n");Elements textElements = doc.getElementsByClass("text_content");Elements pElements = textElements.get(0).select("p");for (Element pElement : pElements) {
//          System.out.println(pElement);out.write(pElement.toString() + "\r\n");}out.write("<hr>\r\n");}public static void main(String[] args) throws IOException {getUrlList();File file = new File("D:/新闻联播大全.html");if (file.exists() == true) file.delete();out = new OutputStreamWriter(new FileOutputStream(file, true), "UTF-8");for (String url: urlList) {solve(url);}out.close();}}

转载于:https://www.cnblogs.com/zifeiy/p/10527621.html

Java使用Jsoup获得新闻联播所有文字稿相关推荐

  1. 利用tushare接口获取前一日新闻联播文字稿

    利用tushare接口获取前一日新闻联播文字稿 分享的是刚学习的一个内容,把前一日新闻联播的文字稿获取下来并存到CSV文件中. # _*_ coding: utf-8 _*_ "" ...

  2. tushare pro接口_利用tushare获取新闻联播文字稿并制作词云

    安装 首先需要一堆python的第三方库,俺用的是大清的镜像,一点都不卡哦. pip install -i https://pypi.tuna.tsinghua.edu.cn/simple jieba ...

  3. 文字层一点就变红_《蚂蚁前端研发最佳实践》文字稿

    以下是我在 2019.11.15成都全栈大会分享的文字稿,介绍了蚂蚁前端研发的最佳实践,其中我提取了三个比较重要的点,每个点都是我们实践和深入思考后的结果,希望能对大家有所启发,欢迎探讨. 开篇 准备 ...

  4. java渐变色字体生成器_java阴影文字效果怎么做?渐变的怎么做?

    随着时代的不断发展,新兴技术的使用也促使人们不断地在学习进步.今天主要为大家介绍一下,java的阴影和渐变的文字效果怎么做. 首先为大家介绍的是阴影效果文字的做法.第一步:使用Graphics类的se ...

  5. EOS从入门到精通-设计背景与DPOS算法(文字稿)

    大家好,非常感谢参加<EOS从入门到精通>系列课程,我是王巨.先跟大家汇报一下上周六试讲的情况,上周6的试讲已经有6000多小伙伴参与了试听,在此我非常感谢大家的信任.同时在试讲的过程中大 ...

  6. 计算机科技手抄报内容,科技手抄报内容云计算文字稿

    <科技手抄报内容云计算文字稿>由会员分享,可在线阅读,更多相关<科技手抄报内容云计算文字稿(2页珍藏版)>请在人人文库网上搜索. 1.科技手抄报内容云计算云计算是继1980年代 ...

  7. SEE Conf: Umi 4 设计思路文字稿

    大家好,我是若川.持续组织了5个月源码共读活动,感兴趣的可以点此加我微信 ruochuan12 参与,每周大家一起学习200行左右的源码,共同进步.同时极力推荐订阅我写的<学习源码整体架构系列& ...

  8. Java实现在图片上添加文字(水印)

    今天分享一个:通过Java代码,给图片添加文字. 比如下面这个图片,我们在左下角就添加了一个文字版的水印,那么这是如何实现的呢 ? 目录 [1]获取原图片对象 (1.1)读取本地图片 (1.2)读取网 ...

  9. Java使用Jsoup写爬虫

    Java使用Jsoup写爬虫 安装Jsoup.jar 简单了解Jsoup Jsoup框架中的常用方法 动手实践 进阶写法 安装Jsoup.jar 1.首先我们打开Jsoup官网 2.按照图片这里下载 ...

最新文章

  1. js之浅拷贝和深拷贝
  2. 安装pyspider后运行pyspider all后遇到的问题
  3. Java截取最后一个/后面的所有字符
  4. STM32 进阶教程 11 - RAM中运行程序
  5. 怎么求星期几的后几天C语言,计算任何一天是星期几的C语言源代码.
  6. ggplot2横坐标标签旋转
  7. Next主题美化博客
  8. 高速列车运行调度控制仿真软件SimTrain
  9. 测试基础-系统测试包括哪些内容
  10. 手变小是怎么回事_手指小太阳越来越小是怎么回事
  11. 严肃讨论:如何自给自足获取自主学习磁力种子?
  12. 私有网段IP地址的划分
  13. 手机市场变天:荣耀鸣枪,重回舞台中央?
  14. 洪水预报系统的读书笔记
  15. 计算机有多种技术指标其主频是,计算机有多种技术指标,其中主频是指( )。
  16. zeppelin高可用部署
  17. Win10系统卸载照片应用程序详细介绍
  18. sql server 修改列属性为非必填项
  19. 微软服务器管理员证书,微软认证 Azure 管理员培训
  20. 国内人脸识别公司哪家强,人脸比对跑个分比较下!

热门文章

  1. WRF模式运行的流程以及简单错误的避免
  2. 2021-08-20 做一个网站需要多少钱大概?
  3. android 充电模式deamon_Android Lint工作原理剖析
  4. 高版本CUDA 在算力低的显卡上不执行核函数如no kernel image is available for execution on the device
  5. 汉字的书写效果的实现
  6. C语言:9.5 有10个学生,每个学生的数据包括学号、姓名、3门课程的成绩,从键盘输入10个学生数据,要求输出3门课程总平均分成绩,以及最高分的学生的数据(包括学号、姓名、3门课程成绩、平均分数)。
  7. 3、有5个学生,每个学生的数据信息包括学号、姓名、4门课程成绩,编程实现学生成绩管理。要求: (1)用input函数来输入数据,并计算每个学生的平均成绩。 (2)用print函数来输出学生的信息
  8. eggs和egg是什么意思_egg的意思是鸡蛋,你知道a good egg是什么意思吗?
  9. 【宝物志】门店运营内容分享 第十二期
  10. 永磁同步电机的一些资料汇总