Java爬虫爬取360doc个人图书馆
然后我就用Jsoup把想要的爬下来了。
最后代码就生成到项目下的MyJsoup.txt下了。
Document doc = Jsoup.connect("http://www.360doc.com/content/13/1210/01/1956846_335862874.shtml")
.data("query","Java").userAgent("Mozilla").cookie("auth", "token").timeout(3000).get();
Element ele= doc.getElementById("p");
String text = doc.body().text();
File file = new File("MyJsoup.txt");
if(file.exists()){
file.createNewFile();
}
FileWriter fw = new FileWriter(file.getName());
BufferedWriter bw = new BufferedWriter(fw);
bw.write(text);
bw.close();
System.out.println("Done");
Java爬虫爬取360doc个人图书馆相关推荐
- python java 爬数据_如何用java爬虫爬取网页上的数据
当我们使用浏览器处理网页的时候,有时候是不需要浏览的,例如使用PhantomJS适用于无头浏览器,进行爬取网页数据操作.最近在进行java爬虫学习的小伙伴们有没有想过如何爬取js生成的网络页面吗?别急 ...
- Java爬虫 --- 爬取王者荣耀英雄图片
Java爬虫 - 爬取王者荣耀英雄图片 import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Docu ...
- Java爬虫 爬取某招聘网站招聘信息
Java爬虫 爬取某招聘网站招聘信息 一.系统介绍 二.功能展示 1.需求爬取的网站内容 2.实现流程 2.1数据采集 2.2页面解析 2.3数据存储 三.获取源码 一.系统介绍 系统主要功能:本项目 ...
- java爬虫爬取笔趣阁小说
java爬虫爬取笔趣阁小说 package novelCrawler;import org.jsoup.Connection; import org.jsoup.HttpStatusException ...
- Java爬虫爬取wallhaven的图片
Java爬虫爬取wallhaven的图片 参考文章:JAVA Jsoup爬取网页图片下载到本地 需要的jar包:jsuop wallhaven网站拒绝java程序访问,所以要伪装报头. 发送请求时 C ...
- 我的第一个开源项目:Java爬虫爬取旧版正方教务系统课程表、成绩表
Java爬虫爬取旧版正方教务系统课程表.成绩表 一.项目展示 1.正方教务系统 首页 2.爬虫系统 首页: 成绩查询: 课表查询: 二.项目实现 1.爬取思路描述 无论是成绩查询或课表查询亦或者其它的 ...
- Java爬虫爬取 天猫 淘宝 京东 搜索页和 商品详情
Java爬虫爬取 天猫 淘宝 京东 搜索页和 商品详情 先识别商品url,区分平台提取商品编号,再根据平台带着商品编号爬取数据. 1.导包 <!-- 爬虫相关Jar包依赖 --><d ...
- java爬虫爬取互联网上的各大影视网站---360影视(附源码下载)
关于爬虫: 万维网上有着无数的网页,包含着海量的信息,无孔不入.森罗万象.但很多时候,无论出于数据分析或产品需求,我们需要从某些网站,提取出我们感兴趣.有价值的内容,但是纵然是进化到21世纪的人类,依 ...
- Jsoup学习 JAVA爬虫爬取美女网站 JAVA爬虫爬取美图网站 爬虫
最近对爬虫起了兴趣,但是网上都说做爬虫最好得语言是py.但是我只会java,所以就想能不能用java实现一个爬虫,百度搜索发现,其实java也有很多优秀得开源爬虫框架,包括Gecco,webmagic ...
最新文章
- 滴滴裁员2000多人,去年亏损超百亿
- 操作系统面试知识点总结1
- Bullet 3D 物理引擎 简析(2)
- HwBinder入门篇-Android10.0 HwBinder通信原理(一)
- result的type属性
- 北斗导航 | 坐标变换矩阵(CTM)与欧拉角(Euler)互相转换:Matlab源代码
- 前端学习(2948):webpack创建简单项目
- JavaScript之Object
- python all和any用法_python any()和all()用法
- Zabbix---4 监控mysql服务并配置动作
- 如何利用用户ID号、关键词或视频时长在自媒体视频软件上批量采集下载关于在自媒体视频软件上批量采集...
- String的常用方法
- 基于深度卷积神经网络的图像去噪方法
- html开源类库,Js弹窗类库的开源库介绍
- cygwin 编译android,再次在 cygwin 下编译 Android toolchain
- 面对未来,与其期待,不如更早开始「自问与探索」| TiDB DevCon 2020 即将开启
- 《Qt5:Widget、Dialog和MainWindow之间的关系》
- 错误Could not locate executable null\bin\winutils.exe in the Hadoop binaries的解决方案
- APP合规讲堂(七)-App有关收集使用规则的内容晦涩难懂、冗长繁琐,用户难以理解
- trueOS能装linux软件,TrueOS 17.12发布下载,一款基于FreeBSD的桌面Linux系统
热门文章
- Linux 日历和计算器命令
- trips | python注释快捷键
- 腾讯云服务器1M带宽下载速度怎么样?慢不慢?
- java师生交流答疑系统maven项目介绍
- 《熊猫人之谜》属性可能重大改变
- Apollo EM Planner阅读笔记
- shiro认证时出现报错Submitted credentials for token [org.apache.shiro.authc.UsernamePasswordToken -
- 基础研究的高风险导向型范式,助力“从0到1”的创新
- ICMP是个啥?一分钟介绍ICMP协议
- 名图怎么弄云服务器_“双车”战略,名图如何驱动新兴细分市场