爬虫python下载网站所有图片_Python爬虫之下载网页图片

传统的方式是在想要的图片上鼠标点击右键另存为，或者用截图的方式保存图片，其实我们还可以通过使用简单的Python语言实现图片的下载并保存到本地，下面让我们看看如何实现吧

一、确定图片的URL地址及获取URL网页页面的信息#coding:utf-8

fromurllib.requestimporturlopen #导入urlopen

defgetHtml(url):

page = urlopen(url)

html = page.read() #读取URL

returnhtml

html = getHtml("http://g.hiphotos.baidu.com/image/pic/item/8694a4c27d1ed21bd85def25a46eddc450da3f5e.jpg") #访问URL地址

print(html)

二、通过正则表达筛选想要的页面数据

通过审查页面元素，可以找到图片的地址，如下：src=”https://imgsa.baidu.com/forum/pic/item/f6738bd4b31c8701b540a1bf257f9e2f0608fff1.jpg”

摘自百度图片

修改后代码如下：#coding:utf-8

fromurllib.requestimporturlopen

importre

defgetHtml(url):

page = urlopen(url)

html = page.read()

returnhtml

defgetImg():

reg =r'src="(.+?\.jpg)" pic_ext' #通过正则表达获取图片数据

img = re.compile(reg)

img_list = re.findall(img,html)

returnimg_list

html = getHtml("http://g.hiphotos.baidu.com/image/pic/item/8694a4c27d1ed21bd85def25a46eddc450da3f5e.jpg")

print(html)

三、将获取的数据保存到本地

通过for循环遍历并下载到本地，代码如下：#coding:utf-8

fromurllib.requestimporturlopen

importre

importurllib

defgetHtml(url):

page = urlopen(url)

html = page.read()

returnhtml

defgetImg():

reg =r'src="(.+?\.jpg)" pic_ext'

img = re.compile(reg)

img_list = re.findall(img,html)

x =0

forimgurlinimg_list:

urllib.urlretrieve(imgurl,'%s.jpg'% x) #urllib.urlretrieve()方法,下载并保留到本地

x +=1

html = getHtml("http://g.hiphotos.baidu.com/image/pic/item/8694a4c27d1ed21bd85def25a46eddc450da3f5e.jpg")

print(html)

爬虫python下载网站所有图片_Python爬虫之下载网页图片相关推荐

爬虫python下载网站所有图片_python爬虫（4）：多页图片批量下载-澎湃网信息图...
澎湃网文章的质量不错,它的"美数课"栏目的信息图做得也很好.图片干货多还能带来ppt和图表制作的技巧.为了更方便浏览所有文章图片,通过分析Ajax爬取栏目至今所有信息图的图片. 但 ...
python获取网站代码_python爬虫1——获取网站源代码(豆瓣图书top250信息)
# -*- coding: utf-8 -*- import requests import re import sys reload(sys) sys.setdefaultencoding('utf ...
爬虫python可以干嘛_python爬虫可以用来做什么？
1.收集数据 python爬虫程序可用于收集数据.这也是最直接和最常用的方法.由于爬虫程序是一个程序,程序运行得非常快,不会因为重复的事情而感到疲倦,因此使用爬虫程序获取大量数据变得非常简单和快速. ...
爬虫python教程百度云_Python爬虫比较基础的教程视频百度云网盘下载
Python爬虫比较基础的教程视频百度云网盘下载,目录如下,给编程的朋友学习吧,请大家支持正版! QQ截图20180719110859.jpg (12.41 KB, 下载次数: 27) 2018-7- ...
python 爬网站实例_python爬虫实战：之爬取京东商城实例教程！（含源代码）
前言: 本文主要介绍的是利用python爬取京东商城的方法,文中介绍的非常详细,下面话不多说了,来看看详细的介绍吧. 主要工具 scrapy BeautifulSoup requests 分析步骤 1 ...
爬虫python需要哪些软件_Python爬虫可以应用在哪些地方
Python爬虫可以应用在哪些地方发布时间:2020-06-19 14:46:48 来源:亿速云阅读:118 作者:元一网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页 ...
HTML5响应式手机软件下载网站源码 APP应用软件下载站pbootcms模板
HTML5响应式手机软件下载网站源码 APP应用软件下载站pbootcms模板小子在本地亲测了一下,是一套不错的手机软件下载源码,之前见过不少帝国cms做的软件下载站,这个感觉更棒一些,页面简洁大方, ...
学知网是个有5000G学习资料的下载网站,注册后可免费下载以下资料
学知网是个有5000G学习资料的下载网站,注册后可免费下载以下资料: [文件]REFRESH.JSP [地址]http://www.stuknow.com/dirlist/10002/cff09e52 ...
爬虫python下载网站所有图片_爬取某图片网站多页图片的python爬虫
1.[代码][Python]代码 # coding=utf-8 import requests import re from lxml import etree import time import ...

爬虫python下载网站所有图片_Python爬虫之下载网页图片

爬虫python下载网站所有图片_Python爬虫之下载网页图片相关推荐

最新文章

热门文章