Python爬虫网站图片并下载到本地
文章目录
- 先看效果
- 1、环境准备
- 2、要爬取的网站
- 3、程序源代码(可直接运行)
先看效果
1、环境准备
import requests
import re
下载requests库:
pip install requests
2、要爬取的网站
https://www.hippopx.com
3、程序源代码(可直接运行)
E:\test 需要在E盘下准备一个test 文件夹,当然,也可以自己更改存储路径
import requests
import rekeyword = input("请输入中文关键字:")
baseurl = 'https://www.hippopx.com/zh/search?q='+ str(keyword) +'&page='
downpage = input("请输入页数:")
downpage = int(downpage) + 2picList = [] # 图片列表
pattern =[]
num = 0for i in range(2,downpage):url = baseurl + str(i)print(url)content = requests.get(url).content.decode('utf-8')pattern = re.compile('<link itemprop="thumbnail" href="(.+?)"').findall(content)# picList.append(pattern)picList = picList + patternprint(picList)
print(len(picList))# 下载图片
def dowmloadPicture():# 定义全局变量global numprint('找到的图片,即将开始下载图片...')for each in picList:print('正在下载第' + str(num + 1) + '张图片,图片地址:' + str(each))try:if each is not None:pic = requests.get(each, timeout=7)else:continueexcept BaseException:print('错误,当前图片无法下载')continueelse:# 保存路径string = 'E:\test\\' + str(num) + '.jpg'fp = open(string, 'wb')fp.write(pic.content)fp.close()num += 1# 调用下载图片方法
dowmloadPicture()
Python爬虫网站图片并下载到本地相关推荐
- python爬虫网页图片并保存到本地
#coding=utf-8 import urllib import re #py抓取页面图片并保存到本地 #获取页面信息 def getHtml(url): page = urllib.urlope ...
- Python爬百度图片并下载到本地实战
百度图片是Ajax加载的,怎么判断是不是Ajax呢?方法很简单,我们在页面进行某种操作时,网页的链接不会变化,但是内容变了,就可以判定网页内容是Ajax动态加载出来的,例如在浏览百度图片时,鼠标滚轮一 ...
- python下载图片并保存_Python爬虫获取图片并下载保存至本地的实例
1.抓取煎蛋网上的图片. 2.代码如下: import urllib.request import os #to open the url def url_open(url): req=urllib. ...
- Python爬虫——利用Scrapy批量下载图片
Python爬虫--利用Scrapy批量下载图片 Scrapy下载图片项目介绍 使用Scrapy下载图片 项目创建 项目预览 创建爬虫文件 项目组件介绍 Scrapy爬虫流程介绍 页面结构分析 定义I ...
- python爬虫爬图片教程_Python爬虫爬图片需要什么
Python爬虫爬图片需要什么?下面用两种方法制作批量爬取网络图片的方法: 第一种方法:基于urllib实现 要点如下: 1.url_request = request.Request(url) 2. ...
- python 爬虫+selenium 全自动化下载JS动态加载漫画
** python 爬虫+selenium 全自动化下载JS动态加载漫画 最近刚学的python,代码可能并不规范,希望大家见谅! 爬取之前,我们首先需要做一些准备工作,因为很多网站都有反爬检索,为了 ...
- python爬虫之壁纸的下载
python爬虫之壁纸的下载 好久没有写博客了,暑假这段时间在学校里面忙着写小论文,没机会写我最喜欢的爬虫了(虽然很简单,但架不住哥喜欢...) 好了,废话不多说了,开始把 本次爬虫爬取的是 手机壁纸 ...
- Python爬虫—Scrapy框架—Win10下载安装
Python爬虫-Scrapy框架-Win10下载安装 1. 下载wheel 2.下载twisted 3. 下载pywin32 4. 下载安装Scrapy 5. 创建一个scrapy项目 6. fir ...
- Python爬虫——Selenium 简介和下载
文章目录 Python爬虫--Selenium 简介和下载 1.Selenium 简介 2.Selenium 下载安装 3.Selenium 简单使用 Python爬虫--Selenium 简介和下载 ...
最新文章
- 目标检测---Segmentation Is All You Need
- linux install g++
- 那些数学不好的程序员?最后都如何了(文末送书)
- Android编译笔记一
- php mysql 链表_php实现数据结构的单向链表
- Elasticsearch7.15.2 分布式集群安装(linux环境)
- 合数分解1(C语言)
- WPF MVVM设计模式的ViewModelBase和CommandBase代码
- Python 之 str 、 repr 、 反引号(``)的区别
- 淘宝APP用户行为数据分析 by 一只废鹅
- Chrome浏览器(油猴子)插件安装使用教程
- 读懂复利“魔力” 30年让你成为千万富翁
- SDOI 2014 数表 题解
- 35岁后,互联网数据分析人的出路在哪里?
- 计算机硕士毕业面试题,计算机研究生面试自我介绍
- 【号外】联手腾讯故宫试水“互联网+”
- Redis 缓存回收的7种策略volatile设置过期时间及allkeys所有数据范围内
- linux kde vga参数1366,Archlinux+KDE 下双屏VGA高分辨率设置
- 递归查询,父类获取对应子类集合
- Leetcode刷题java之3. 无重复字符的最长子串