手把手教学爬小姐姐图片(jsoup)
jsoup简单小应用,利用java爬取小姐姐图片,虽然不如python好用,但是依旧不错,记录一下
<dependency><groupId>org.jsoup</groupId><artifactId>jsoup</artifactId><version>1.12.1</version>
</dependency>
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;import java.io.File;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
import java.net.HttpURLConnection;
import java.net.URL;
import java.net.URLEncoder;
import java.util.Date;public class jsoup {/*** @Description:* @Param: keyword:搜索的关键词,* @param :url:请求路径* @return: 页面代码* @Author: lbq* @Date: 2021/3/2* //https://blog.csdn.net/qq_22003641/article/details/79137327*/public static int num = 0;public static void main(String[] args) throws IOException {//要搜的关键词//String keyword = "加湿器";//keyword = URLEncoder.encode(keyword,"utf-8");//url(你要爬的网站)
// String url = "https://search.jd.com/Search?keyword="+keyword;String url = "";//获取页面Document doc = Jsoup.connect(url).get();//解析页面,下载图片(HTML标签)Elements elements = doc.select("img[src]");for (Element element : elements) {String imgUrl = element.attr("src");System.out.println(imgUrl);if (!imgUrl.startsWith("http://")) {imgUrl = "http:" + imgUrl;}new Thread(new jsoup().new DownLoadThread(imgUrl)).start();}}public class DownLoadThread implements Runnable {private String imgUrl;public DownLoadThread(String url) {this.imgUrl = url;}@Overridepublic void run() {FileOutputStream out = null;HttpURLConnection conn = null;try {URL url = new URL(imgUrl);conn = (HttpURLConnection) url.openConnection();conn.setRequestMethod("GET");conn.setReadTimeout(5 * 1000);InputStream inputStream = conn.getInputStream();//存放路径File file = new File("d:\\photo");if (!file.exists()){file.mkdir();}// imgUrl.replaceAll("\\", "_").replaceAll("http:", "");Date date = new Date();long time = date.getTime();String s = String.valueOf(time);String fileName = "d:\\photo\\"+s+".jpg";out = new FileOutputStream(new File(fileName));byte[] arr = new byte[1024];int len = 0;while ((len = inputStream.read(arr)) != -1) {out.write(arr, 0, len);}System.out.println("=====下载完成====");} catch (Exception e) {e.printStackTrace();} finally {if (out != null) {try {out.close();} catch (IOException e) {e.printStackTrace();}}if (conn != null) {conn.disconnect();}}}}
}
手把手教学爬小姐姐图片(jsoup)相关推荐
- 用 Java 爬小姐姐图片,这个厉害了。。。
今日推荐 Web登录很简单?开玩笑!知乎热问:国家何时整治程序员的高薪现象?太可怕了!注解+反射优雅的实现Excel导入导出(通用版)Fluent Mybatis 牛逼!Nginx 常用配置清单这玩意 ...
- 想用Python爬小姐姐图片?那你得先搞定分布式进程
导读:分布式进程指的是将Process进程分布到多台机器上,充分利用多台机器的性能完成复杂的任务.我们可以将这一点应用到分布式爬虫的开发中. 作者:范传辉 如需转载请联系大数据(ID:hzdashuj ...
- python爬虫 爬取清纯小姐姐图片
文章目录 1 思路介绍 2 完整代码 2 代码介绍 2.1 获取网站 2.3 创建目录 2.4 找到首图的名称和地址 2.5 实现同一个人的翻页 2.6 实现每一位小姐姐图片的连接 2.7 爬取图片 ...
- Python爬取不羞涩网小姐姐图片——BeautifulSoup应用
引言 今年提倡原地过年,相信很多朋友都没有回家过年,像我就被迫留在深圳过年了,无聊之余只能去看看电影爬爬山.今天给大家带来一个打发无聊时光的案例,用Python爬取不羞涩网小姐姐图片,并保存到本地,老 ...
- python爬虫 爬取小姐姐图片
前言 大致熟悉了python的基础语法以后,开始学习爬虫基础. 一.爬取前的准备工作 python3.7环境(只要是python3版本都可以): 依赖包 : time requests re (缺少包 ...
- 三分钟教会你用Python爬取心仪小姐姐图片
使用Python爬取小姐姐图片 首先上网站链接 唯美女生 爬取图片主要分为一下几步: 1.打开一个你喜欢的小姐姐的网站 E.g xiaojiejie web 2.下载并安装python环境 pytho ...
- [ Python ] 爬虫类库学习之 xpath,爬取彼岸图网的 小姐姐 图片
安装:pip install lxml 实例化一个etree对象 from lxml import etree 1.将本地的html文档中的源码数据加载到etree对象中 etree.parse(fi ...
- Python三步爬取VMgirls小姐姐图片
Python三步爬取VMgirls小姐姐图片 具体思路 第一步:确定目标 第二步:分析目标网站 第三步:代码编写 具体思路 第一步:确定目标:寻找目标网站,我选择的网站是http://www.VMgi ...
- Python爬虫利用18行代码爬取虎牙上百张小姐姐图片
Python爬虫利用18行代码爬取虎牙上百张小姐姐图片 下面开始上代码 需要用到的库 import request #页面请求 import time #用于时间延迟 import re #正则表达式 ...
最新文章
- php empty详解
- 哈夫曼树编码与译码(完整C/C++实现代码)
- 使用X.509数字证书加密解密实务(二)-- 使用RSA证书加密敏感数据(转)
- 基础算法 —— 高精度计算
- 2021高考成绩怎么查询时间北京,2021年北京高考成绩几号公布可以查询,查询时间安排...
- 二级java编写用户界面例题,单选题11—20:2012年计算机二级VB用户界面设计练习题及答案-计算机二级-233网校...
- python 两个队列进行对比
- 基于腾讯视频影视作品数据分析
- 网站类项目商业计划书(转)
- 双浮点运算计算机在线,双浮点运算计算器
- stm32f405rgt6芯片手册
- P5_扩展卡尔曼滤波器_udacity无人驾驶
- cocos2dx 制作一个简单的三消游戏
- 普通风景照如何调色,ps教程
- 双节快乐!| 中秋的月亮,今晚圆
- 用vba创建图表分析上市公司财报
- 小米Note4、小米8、一加6刷机(三方rec+rom+root)
- 5G助威云游戏前哨战,科技公司竞逐游戏界“Netflix”名号
- php 豆瓣api_想调用豆瓣电影 api,谁开发过整套的 php 开源吗?或者指点下
- 免抠图PNG素材网站