来自:http://www.open-open.com/bbs/view/1320576549952
如何从网页中下载图片
如果做为爬虫很有必要从网页中下载图片到本地,那么我们利用jsoup来进行该操作,jsoup 是一个很不错的html解析器。下面是它的简介:
jsoup 是一款 Java 的HTML 解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于JQuery的操作方法来取出和操作数据。
jsoup的主要功能如下:
- 从一个URL,文件或字符串中解析HTML;
- 使用DOM或CSS选择器来查找、取出数据;
- 可操作HTML元素、属性、文本;
jsoup是基于MIT协议发布的,可放心使用于商业项目。
网页中下载图片需要这么两步操作
1.获取绝对路径
很多网页中用的是相对路径,因此获取图片的绝对路径很重要
方法一:我们就利用jsoup来获取
1
|
Element image = document.select( "img" ).first();
|
2
|
String url = image.absUrl( "src" );
|
3
|
// url = http://www.example.com/images/chicken.jpg
|
或者
01
|
String url = image.attr( "abs:src" );
|
02
|
他们的前提利用connect方式获取而不是文件方式
|
03
|
Document doc = Jsoup.connect( "http://jsoup.org" ).get();
|
04
|
Element link = doc.select( "a" ).first();
|
05
|
String relHref = link.attr( "href" ); // == "/"
|
06
|
String absHref = link.attr( "abs:href" ); // "http://jsoup.org/"
|
08
|
URL url = new URL( "http://www.example.com/index.html" );
|
09
|
URI uri = url.toURI();
|
10
|
System.out.println(uri.resolve( "images/chicken.jpg" ).toString());
|
2.第二步则就是下载图片
01
|
URL url = new URL( "图片地址" );
|
02
|
URLConnection uc = url.openConnection();
|
03
|
InputStream is = uc.getInputStream();
|
04
|
File file = new File( "本地路径 " );
|
05
|
FileOutputStream out = new FileOutputStream(file);
|
07
|
while ((i=is.read())!=- 1 ) {
|
本站翻译的:jsoup的官方教程
利用jsoup 如何从网页中下载图片相关推荐
- 如何从网页中下载图片
如果做为爬虫很有必要从网页中下载图片到本地,那么我们利用jsoup来进行该操作,jsoup 是一个很不错的html解析器. 网页中下载图片需要这么两步操作 1.获取绝对路径 很多网页中用的是相对路径, ...
- go语言并发下载电影和视频,根据m3u8索引url下载视频.下载网页中的图片,可以从当前页向下搜索层数.
一,根据URL的m3u8索引,下载视频文件. 二,下载网页中的图片. 为了家里小朋友,要下载一个视频,放在电视上看. 所以利用一点时间,写了这个简单下载程序.如果视频有加密,会对其解密. 最近下点图片 ...
- 下载网页中的图片到本地
简单的一个下载如下 : string url = "http://avatar.csdn.net/A/2/6/2_yefengzhixia.jpg";string filepath ...
- 如何下载网页中的图片
http://qzher.com/?p=218 如何下载网页中的图片 发表日期 2016年4月25日 by qzher https://tuchong.com/1181287/12974705/ 怎么 ...
- python获取网页图片_python抓取网页中的图片示例
python抓取网页中的图片示例 代码如下: #coding:utf8 import re import urllib def getHTML(url): page = urllib.urlopen( ...
- asp自动解析网页中的图片地址,并将其保存到本地服务器
程序实现功能:自动将远程页面的文件中的图片下载到本地. 程序代码 <% '将本文保存为 save2local.asp '测试:save2local.asp?url=http://ent.sina ...
- python爬取图片-Python爬取网页中的图片(搜狗图片)详解
前言 最近几天,研究了一下一直很好奇的爬虫算法.这里写一下最近几天的点点心得.下面进入正文: 你可能需要的工作环境: Python 3.6官网下载 本地下载 我们这里以sogou作为爬取的对象. 首先 ...
- html给网页加图片背景颜色,0035 如何设置网页背景图和在网页中插入图片
上节课讲了关于表格的一些更多知识和用表格配合div来进行网页排版. 这节课开始讲关于网页图片的相关知识. 上节课的课后练习 1.去网上搜索2个自己喜欢的图片,1个图片用来作为整个网页的背景,另一个图片 ...
- 为网页中的图片添加水印的效果
程序本来源于http://dev.csdn.net/develop/article/22/22096.shtm中lovered所写的程序,我把其中的一些我觉得不太好的加以了改进并且增加一些功能形成了该 ...
最新文章
- P1464 Function(递归式的记忆化搜索)
- KVO 的进一步理解
- Android 消息处理源代码分析(1)
- 在虚拟主机上部署ASP.NET AJAX 1.0 Beta的程序集
- R400安装Windows2003网卡驱动
- 下载网页上的视频、音频文件
- 中国地图矫正中的误差
- 从零读懂CAN总线(上)
- vue 中引入阿里云的云盾防水墙
- Win系统 - 电脑一直停在正在关机的界面怎么办?
- 要实现一台电脑可以上公司内网也可以访问外网
- css图片动画主要知识点
- 关于数据分析,管理者常犯的4个错误
- 多线程并发数量设置设多少算合理
- 【CSS】元素的伪类
- 美国亚利桑那州成立自动驾驶移动研究所,研发无人车技术
- Uniswap计算过程推演
- Windows服务器防火墙端口怎么开放?扬州服务器租用140.210.20.X
- 基于c++和asio的网络编程框架asio2教程基础篇:1、基本概念和使用说明
- Spring Redis工具类
热门文章
- 栗子——自定义EditText实现右下角计数控件
- Bsie(鄙视IE)
- 惠新宸:我也曾经是“不适合”编程的人
- POJ 1192 最优连通子集(树形DP)
- Visual Studio Code中的无标题(工作区)
- Zookeeper的Leader选举
- 大数据分析的目的与意义
- 大数据在零售业的应用
- 如何从服务器上取pdf文件,如何从服务器响应创建pdf文件?
- 永恒python怎么用_毫无基础的人如何入门 Python ?Python入门教程拿走不谢啦!