文章目录

  • 先看效果
  • 1、环境准备
  • 2、要爬取的网站
  • 3、程序源代码(可直接运行)

先看效果


1、环境准备

import requests
import re

下载requests库:

pip install requests

2、要爬取的网站

https://www.hippopx.com

3、程序源代码(可直接运行)

E:\test 需要在E盘下准备一个test 文件夹,当然,也可以自己更改存储路径

import requests
import rekeyword = input("请输入中文关键字:")
baseurl = 'https://www.hippopx.com/zh/search?q='+ str(keyword) +'&page='
downpage = input("请输入页数:")
downpage = int(downpage) + 2picList = []  # 图片列表
pattern =[]
num = 0for i in range(2,downpage):url = baseurl  + str(i)print(url)content = requests.get(url).content.decode('utf-8')pattern = re.compile('<link itemprop="thumbnail" href="(.+?)"').findall(content)# picList.append(pattern)picList = picList + patternprint(picList)
print(len(picList))# 下载图片
def dowmloadPicture():# 定义全局变量global numprint('找到的图片,即将开始下载图片...')for each in picList:print('正在下载第' + str(num + 1) + '张图片,图片地址:' + str(each))try:if each is not None:pic = requests.get(each, timeout=7)else:continueexcept BaseException:print('错误,当前图片无法下载')continueelse:# 保存路径string =  'E:\test\\' + str(num) + '.jpg'fp = open(string, 'wb')fp.write(pic.content)fp.close()num += 1# 调用下载图片方法
dowmloadPicture()

Python爬虫网站图片并下载到本地相关推荐

  1. python爬虫网页图片并保存到本地

    #coding=utf-8 import urllib import re #py抓取页面图片并保存到本地 #获取页面信息 def getHtml(url): page = urllib.urlope ...

  2. Python爬百度图片并下载到本地实战

    百度图片是Ajax加载的,怎么判断是不是Ajax呢?方法很简单,我们在页面进行某种操作时,网页的链接不会变化,但是内容变了,就可以判定网页内容是Ajax动态加载出来的,例如在浏览百度图片时,鼠标滚轮一 ...

  3. python下载图片并保存_Python爬虫获取图片并下载保存至本地的实例

    1.抓取煎蛋网上的图片. 2.代码如下: import urllib.request import os #to open the url def url_open(url): req=urllib. ...

  4. Python爬虫——利用Scrapy批量下载图片

    Python爬虫--利用Scrapy批量下载图片 Scrapy下载图片项目介绍 使用Scrapy下载图片 项目创建 项目预览 创建爬虫文件 项目组件介绍 Scrapy爬虫流程介绍 页面结构分析 定义I ...

  5. python爬虫爬图片教程_Python爬虫爬图片需要什么

    Python爬虫爬图片需要什么?下面用两种方法制作批量爬取网络图片的方法: 第一种方法:基于urllib实现 要点如下: 1.url_request = request.Request(url) 2. ...

  6. python 爬虫+selenium 全自动化下载JS动态加载漫画

    ** python 爬虫+selenium 全自动化下载JS动态加载漫画 最近刚学的python,代码可能并不规范,希望大家见谅! 爬取之前,我们首先需要做一些准备工作,因为很多网站都有反爬检索,为了 ...

  7. python爬虫之壁纸的下载

    python爬虫之壁纸的下载 好久没有写博客了,暑假这段时间在学校里面忙着写小论文,没机会写我最喜欢的爬虫了(虽然很简单,但架不住哥喜欢...) 好了,废话不多说了,开始把 本次爬虫爬取的是 手机壁纸 ...

  8. Python爬虫—Scrapy框架—Win10下载安装

    Python爬虫-Scrapy框架-Win10下载安装 1. 下载wheel 2.下载twisted 3. 下载pywin32 4. 下载安装Scrapy 5. 创建一个scrapy项目 6. fir ...

  9. Python爬虫——Selenium 简介和下载

    文章目录 Python爬虫--Selenium 简介和下载 1.Selenium 简介 2.Selenium 下载安装 3.Selenium 简单使用 Python爬虫--Selenium 简介和下载 ...

最新文章

  1. 目标检测---Segmentation Is All You Need
  2. linux install g++
  3. 那些数学不好的程序员?最后都如何了(文末送书)
  4. Android编译笔记一
  5. php mysql 链表_php实现数据结构的单向链表
  6. Elasticsearch7.15.2 分布式集群安装(linux环境)
  7. 合数分解1(C语言)
  8. WPF MVVM设计模式的ViewModelBase和CommandBase代码
  9. Python 之 str 、 repr 、 反引号(``)的区别
  10. 淘宝APP用户行为数据分析 by 一只废鹅
  11. Chrome浏览器(油猴子)插件安装使用教程
  12. 读懂复利“魔力” 30年让你成为千万富翁
  13. SDOI 2014 数表 题解
  14. 35岁后,互联网数据分析人的出路在哪里?
  15. 计算机硕士毕业面试题,计算机研究生面试自我介绍
  16. 【号外】联手腾讯故宫试水“互联网+”
  17. Redis 缓存回收的7种策略volatile设置过期时间及allkeys所有数据范围内
  18. linux kde vga参数1366,Archlinux+KDE 下双屏VGA高分辨率设置
  19. 递归查询,父类获取对应子类集合
  20. Leetcode刷题java之3. 无重复字符的最长子串

热门文章

  1. mysql -关联查询与分组查询
  2. AIS航行状态和船舶类型
  3. Oracle VM VirtualBox 新建虚拟电脑
  4. java基础-head first java
  5. idea 断点线程_在IntelliJ IDEA中多线程并发代码的调试方法详解
  6. 笔记本做wifi热点
  7. oracle 数据库 ORA-28000错误的原因及解决办法
  8. phpstudy提示80端口被system占用
  9. Linux内核配置(9)
  10. 使用css做水印效果