爬虫python下载网站所有图片_Python爬虫之下载网页图片
传统的方式是在想要的图片上鼠标点击右键另存为,或者用截图的方式保存图片,其实我们还可以通过使用简单的Python语言实现图片的下载并保存到本地,下面让我们看看如何实现吧
一、确定图片的URL地址及获取URL网页页面的信息#coding:utf-8
fromurllib.requestimporturlopen #导入urlopen
defgetHtml(url):
page = urlopen(url)
html = page.read() #读取URL
returnhtml
html = getHtml("http://g.hiphotos.baidu.com/image/pic/item/8694a4c27d1ed21bd85def25a46eddc450da3f5e.jpg") #访问URL地址
print(html)
二、通过正则表达筛选想要的页面数据
通过审查页面元素,可以找到图片的地址,如下:src=”https://imgsa.baidu.com/forum/pic/item/f6738bd4b31c8701b540a1bf257f9e2f0608fff1.jpg”
摘自百度图片
修改后代码如下:#coding:utf-8
fromurllib.requestimporturlopen
importre
defgetHtml(url):
page = urlopen(url)
html = page.read()
returnhtml
defgetImg():
reg =r'src="(.+?\.jpg)" pic_ext' #通过正则表达获取图片数据
img = re.compile(reg)
img_list = re.findall(img,html)
returnimg_list
html = getHtml("http://g.hiphotos.baidu.com/image/pic/item/8694a4c27d1ed21bd85def25a46eddc450da3f5e.jpg")
print(html)
三、将获取的数据保存到本地
通过for循环遍历并下载到本地,代码如下:#coding:utf-8
fromurllib.requestimporturlopen
importre
importurllib
defgetHtml(url):
page = urlopen(url)
html = page.read()
returnhtml
defgetImg():
reg =r'src="(.+?\.jpg)" pic_ext'
img = re.compile(reg)
img_list = re.findall(img,html)
x =0
forimgurlinimg_list:
urllib.urlretrieve(imgurl,'%s.jpg'% x) #urllib.urlretrieve()方法,下载并保留到本地
x +=1
html = getHtml("http://g.hiphotos.baidu.com/image/pic/item/8694a4c27d1ed21bd85def25a46eddc450da3f5e.jpg")
print(html)
爬虫python下载网站所有图片_Python爬虫之下载网页图片相关推荐
- 爬虫python下载网站所有图片_python爬虫(4):多页图片批量下载-澎湃网信息图...
澎湃网文章的质量不错,它的"美数课"栏目的信息图做得也很好.图片干货多还能带来ppt和图表制作的技巧.为了更方便浏览所有文章图片,通过分析Ajax爬取栏目至今所有信息图的图片. 但 ...
- python获取网站代码_python爬虫1——获取网站源代码(豆瓣图书top250信息)
# -*- coding: utf-8 -*- import requests import re import sys reload(sys) sys.setdefaultencoding('utf ...
- 爬虫python可以干嘛_python爬虫可以用来做什么?
1.收集数据 python爬虫程序可用于收集数据.这也是最直接和最常用的方法.由于爬虫程序是一个程序,程序运行得非常快,不会因为重复的事情而感到疲倦,因此使用爬虫程序获取大量数据变得非常简单和快速. ...
- 爬虫python教程百度云_Python爬虫比较基础的教程视频百度云网盘下载
Python爬虫比较基础的教程视频百度云网盘下载,目录如下,给编程的朋友学习吧,请大家支持正版! QQ截图20180719110859.jpg (12.41 KB, 下载次数: 27) 2018-7- ...
- python 爬网站 实例_python爬虫实战:之爬取京东商城实例教程!(含源代码)
前言: 本文主要介绍的是利用python爬取京东商城的方法,文中介绍的非常详细,下面话不多说了,来看看详细的介绍吧. 主要工具 scrapy BeautifulSoup requests 分析步骤 1 ...
- 爬虫python需要哪些软件_Python爬虫可以应用在哪些地方
Python爬虫可以应用在哪些地方 发布时间:2020-06-19 14:46:48 来源:亿速云 阅读:118 作者:元一 网络爬虫(又称为网页蜘蛛,网络机器人,在FOAF社区中间,更经常的称为网页 ...
- HTML5响应式手机软件下载网站源码 APP应用软件下载站pbootcms模板
HTML5响应式手机软件下载网站源码 APP应用软件下载站pbootcms模板小子在本地亲测了一下,是一套不错的手机软件下载源码,之前见过不少帝国cms做的软件下载站,这个感觉更棒一些,页面简洁大方, ...
- 学知网是个有5000G学习资料的下载网站,注册后可免费下载以下资料
学知网是个有5000G学习资料的下载网站,注册后可免费下载以下资料: [文件]REFRESH.JSP [地址]http://www.stuknow.com/dirlist/10002/cff09e52 ...
- 爬虫python下载网站所有图片_爬取某图片网站多页图片的python爬虫
1.[代码][Python]代码 # coding=utf-8 import requests import re from lxml import etree import time import ...
最新文章
- 总结Anaconda+Tensorflow遇到的坑
- (八)适配器模式详解
- 算法----摆动序列
- PHP获取二维数组中某一列的值集合
- AJAX应用和传统Web应用有什么不同
- spring 多线程 事务 源码解析(一)
- Java学习日报—SQL基础—2021/11/29
- JVM学习笔记(一)JDKJREJVM
- 关于jesd204B调试总结
- 十三种常用的数据挖掘的技术
- 光敏电阻、光电二三极管及接收头
- android手机双卡的电话录音,苹果与android手机电话通话录音
- HTML网页的基本结构
- oracle expdp作业外表报错ORA-20011KUP-11024ORA-29913
- Java程序员面试分类真题(后附答案解析)
- 如何实现幻灯片效果/图片轮播
- 使用逐步细化开发 DFD
- 【HC-SR501人体红外传感器】
- web课程设计:网上商城系统
- 投资理财-有趣的灵魂