jsoup简单小应用,利用java爬取小姐姐图片,虽然不如python好用,但是依旧不错,记录一下

<dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.12.1</version>
</dependency>
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import java.util.Date;public class jsoup {/*** @Description:* @Param: keyword:搜索的关键词,* @param :url:请求路径* @return: 页面代码* @Author: lbq* @Date: 2021/3/2*  //https://blog.csdn.net/qq_22003641/article/details/79137327*/public static int num = 0;public static void main(String[] args) throws IOException {//要搜的关键词//String keyword = "加湿器";//keyword = URLEncoder.encode(keyword,"utf-8");//url(你要爬的网站)
//        String url = "https://search.jd.com/Search?keyword="+keyword;String url = "";//获取页面Document doc = Jsoup.connect(url).get();//解析页面,下载图片(HTML标签)Elements elements = doc.select("img[src]");for (Element element : elements) {String imgUrl = element.attr("src");System.out.println(imgUrl);if (!imgUrl.startsWith("http://")) {imgUrl = "http:" + imgUrl;}new Thread(new jsoup().new DownLoadThread(imgUrl)).start();}}public class DownLoadThread implements Runnable {private String imgUrl;public DownLoadThread(String url) {this.imgUrl = url;}@Overridepublic void run() {FileOutputStream out = null;HttpURLConnection conn = null;try {URL url = new URL(imgUrl);conn = (HttpURLConnection) url.openConnection();conn.setRequestMethod("GET");conn.setReadTimeout(5 * 1000);InputStream inputStream = conn.getInputStream();//存放路径File file = new File("d:\\photo");if (!file.exists()){file.mkdir();}// imgUrl.replaceAll("\\", "_").replaceAll("http:", "");Date date = new Date();long time = date.getTime();String s = String.valueOf(time);String fileName = "d:\\photo\\"+s+".jpg";out = new FileOutputStream(new File(fileName));byte[] arr = new byte[1024];int len = 0;while ((len = inputStream.read(arr)) != -1) {out.write(arr, 0, len);}System.out.println("=====下载完成====");} catch (Exception e) {e.printStackTrace();} finally {if (out != null) {try {out.close();} catch (IOException e) {e.printStackTrace();}}if (conn != null) {conn.disconnect();}}}}
}

手把手教学爬小姐姐图片(jsoup)相关推荐

  1. 用 Java 爬小姐姐图片,这个厉害了。。。

    今日推荐 Web登录很简单?开玩笑!知乎热问:国家何时整治程序员的高薪现象?太可怕了!注解+反射优雅的实现Excel导入导出(通用版)Fluent Mybatis 牛逼!Nginx 常用配置清单这玩意 ...

  2. 想用Python爬小姐姐图片?那你得先搞定分布式进程

    导读:分布式进程指的是将Process进程分布到多台机器上,充分利用多台机器的性能完成复杂的任务.我们可以将这一点应用到分布式爬虫的开发中. 作者:范传辉 如需转载请联系大数据(ID:hzdashuj ...

  3. python爬虫 爬取清纯小姐姐图片

    文章目录 1 思路介绍 2 完整代码 2 代码介绍 2.1 获取网站 2.3 创建目录 2.4 找到首图的名称和地址 2.5 实现同一个人的翻页 2.6 实现每一位小姐姐图片的连接 2.7 爬取图片 ...

  4. Python爬取不羞涩网小姐姐图片——BeautifulSoup应用

    引言 今年提倡原地过年,相信很多朋友都没有回家过年,像我就被迫留在深圳过年了,无聊之余只能去看看电影爬爬山.今天给大家带来一个打发无聊时光的案例,用Python爬取不羞涩网小姐姐图片,并保存到本地,老 ...

  5. python爬虫 爬取小姐姐图片

    前言 大致熟悉了python的基础语法以后,开始学习爬虫基础. 一.爬取前的准备工作 python3.7环境(只要是python3版本都可以): 依赖包 : time requests re (缺少包 ...

  6. 三分钟教会你用Python爬取心仪小姐姐图片

    使用Python爬取小姐姐图片 首先上网站链接 唯美女生 爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 E.g xiaojiejie web 2.下载并安装python环境 pytho ...

  7. [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片

    安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...

  8. Python三步爬取VMgirls小姐姐图片

    Python三步爬取VMgirls小姐姐图片 具体思路 第一步:确定目标 第二步:分析目标网站 第三步:代码编写 具体思路 第一步:确定目标:寻找目标网站,我选择的网站是http://www.VMgi ...

  9. Python爬虫利用18行代码爬取虎牙上百张小姐姐图片

    Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...

最新文章

  1. php empty详解
  2. 哈夫曼树编码与译码(完整C/C++实现代码)
  3. 使用X.509数字证书加密解密实务(二)-- 使用RSA证书加密敏感数据(转)
  4. 基础算法 —— 高精度计算
  5. 2021高考成绩怎么查询时间北京,2021年北京高考成绩几号公布可以查询,查询时间安排...
  6. 二级java编写用户界面例题,单选题11—20:2012年计算机二级VB用户界面设计练习题及答案-计算机二级-233网校...
  7. python 两个队列进行对比
  8. 基于腾讯视频影视作品数据分析
  9. 网站类项目商业计划书(转)
  10. 双浮点运算计算机在线,双浮点运算计算器
  11. stm32f405rgt6芯片手册
  12. P5_扩展卡尔曼滤波器_udacity无人驾驶
  13. cocos2dx 制作一个简单的三消游戏
  14. 普通风景照如何调色,ps教程
  15. 双节快乐!| 中秋的月亮,今晚圆
  16. 用vba创建图表分析上市公司财报
  17. 小米Note4、小米8、一加6刷机(三方rec+rom+root)
  18. 5G助威云游戏前哨战,科技公司竞逐游戏界“Netflix”名号
  19. php 豆瓣api_想调用豆瓣电影 api,谁开发过整套的 php 开源吗?或者指点下
  20. 免抠图PNG素材网站

热门文章

  1. 八大排序算法比较及各自的特点
  2. 区块链+保险,隐私保护必不可少!
  3. SIMCOM7600CE TCP通信
  4. 2021-2027全球与中国直流电荷泵市场现状及未来发展趋势
  5. 第35课时_电荷泵电路
  6. 通信原理学习笔记1:模拟与数字通信系统、通信系统性能指标
  7. CentOS7中安装字体库中文字体
  8. LIO-SAM论文与代码阅读笔记(一)论文阅读
  9. 我的爸爸是一位计算机工程师,描写爸爸的小学生作文我的爸爸是建筑工程师
  10. 如何让Java后端日志开发变得优雅