import threading
import requests
from lxml import etree as et
import os# 请求头
headers = {# 用户代理'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/78.0.3904.108 Safari/537.36'
}# 待抓取网页基地址
base_url = 'https://www.23jj.com/'
# 保存图片基本路径
base_dir = 'D:/python/code/aixjj/'# 保存图片
def savePic(pic_url, page):# 如果目录不存在,则新建if not os.path.exists(base_dir):os.makedirs(base_dir)# 分解符号 ['http:', '', 'img.23jj.com', 'image', '32', '3273', '0_236.jpg']arr = pic_url.split('/')# -1表示倒数第一个元素 -2 表示倒数第二个元素file_name = base_dir + str(page) + '_' + arr[-2] + arr[-1]print(file_name)# 获取图片内容response = requests.get(pic_url, headers=headers)# 写入图片# with expression as target:# expression:是一个需要执行的表达式;# target:是一个变量或者元组,存储的是expression表达式执行返回的结果,可选参数。# 打开文件with open(file_name, 'wb') as fp:# 利用Respose对象的iter_content()方法循环,在每次迭代中调用write(),将内容写入该文件for data in response.iter_content(128):fp.write(data)# 观察此网站总共只有62页,所以循环62次
def download(k):# 请求页面地址url = base_url + str(k)# 请求页面内容response = requests.get(url=url, headers=headers)# 请求状态码code = response.status_codeif code == 200:# etree.HTML()可以用来解析字符串格式的HTML文档对象,将传进去的字符串转变成_Element对象。作为_Element对象,# 可以方便的使用getparent()、remove()、xpath()等方法。html = et.HTML(response.text)# 获取页面所有图片地址r = html.xpath('//li/a/img/@src')# 遍历图片地址for pic_url in r:a = 'http:' + pic_urlsavePic(a, k)print('第%d页图片下载完成' % k)# 创建线程
for i in range(1, 63):threading.Thread(target=download, args=(i,)).start()

网站图片下载 Python相关推荐

  1. C#网站图片下载器,网络爬虫,仅供学习参考使用,不可用于商业活动

    程序一共包含3个文件,主入口文件Program.cs,Html下载解析文件HtmlDown.cs,文件缓存文件FileCache.cs,其中Program.cs处理常用逻辑,HtmlDown.cs负责 ...

  2. Python淘宝美眉图片下载爬虫视频教程-何家胜-专题视频课程

    Python淘宝美眉图片下载爬虫视频教程-21985人已学习 课程介绍         本套视频主要讲述Python项目实训一:如何利用Python的while循环体设计实现网络爬虫刷博器的程序的设计 ...

  3. ChromeFK插件推荐系列十九:网站图片批量下载插件推荐

    本次分享几个网站图片下载插件,内容来自: chromefk.希望对你有所帮助. 1.[CHROMEFK]图片助手(ImageAssistant) 批量图片下载器 一款用于嗅探.分析网页图片并提供批量下 ...

  4. 怎么在python官网下载python,python的官方网址是什么

    python的安装包怎么下载 下载python安装包的方法:1.访问python的官网地址""2.点击Download下面的Latest后面的python版本3.在跳转后的页面用鼠 ...

  5. 怎么在python官网下载python,官网python怎么下载安装

    python怎么安装 在Python官网下载Python安装包,双击打开Python软件.勾选add Python 3.8 to PATH,点击install Now. 安装完成后,点击Close.打 ...

  6. img绝对路径图片显示_使用python爬虫去风景图片网站批量下载图片

    使用python爬虫(requests,BeautifulSoup)去风景图片网站批量下载图片 1.写代码背景: 今天闲来无事,想弄点图片放到电脑,方便以后使用,故去百度查找一些风景图片网站,发现图片 ...

  7. 爬虫-python -(3) 网站菜价和图片下载 bs4解析

    文章目录 1.bs4爬*网站菜价 2.bs4图片网站 3.总结 bs4是通过网站的标签以及属性找到,对应文本信息或者标签属性. 1.bs4爬*网站菜价 例程给的网站,改版了,需要post,查找返回数据 ...

  8. python 第一行 报错_初学Python-只需4步,爬取网站图片

    很多人学习Python很重要的一个原因是,可以很简单的把一个网站的数据爬下来. 尤其是做我们这一行,产品经理,电商行业. 领导:弄一个买卖游戏周边商品的交易APP出来.我:行,那我们卖什么呀?领导:看 ...

  9. python批量读取图片gps位置_某少儿不宜网站图片拍摄位置分析,Python批量读取图片GPS位置!...

    原标题:某少儿不宜网站图片拍摄位置分析,Python批量读取图片GPS位置! 1. python读取图片exif属性中的GPS信息 智能手机或平板如果在拍照时开启定位服务,照片中就会记录拍照位置信息和 ...

最新文章

  1. HTML5——FileReader详解
  2. Keras实现mode.fit和model.fit_generator比较
  3. [一道搜狗输入法的面试题]C++转换构造函数和类型转换函数
  4. gdb core调试
  5. 为你讲解ELK的组成与部署
  6. Facebook推出人脸识别新功能,防止用户肖像遭滥用
  7. Exchange Server 2016管理系列课件50.DAG管理之激活数据库副本
  8. Linux文件管理和用户管理
  9. 用python做文件处理_用Python实现文件处理
  10. c#实现打印功能,可以设置纸张大小,字体和颜色等
  11. 常用SQL语句整理及示例
  12. node.js处理torrent
  13. 计算机网络实验二:网络基础编程实验
  14. 从 IPv4 向 IPv6 的迁移
  15. 使用n切换node版本
  16. 醋醋SEO基础入门教程_seo入门基础知识
  17. GPU 编程与CG 语言之阳春白雪下里巴人——CG学习读书笔记之数学函数(三)
  18. 用C语言来实现扫雷小游戏
  19. 秦曾昌人工智能课程---1、机器学习中的数学基础
  20. 异步多线程之入门必知

热门文章

  1. 花了一晚上时间,终于把Python的基本用法归纳好了!
  2. 【福利】3980元的web前端视频教程限量领取!!!
  3. badboy设置中文_[转载]Badboy使用教程
  4. eclipse lombok 标红_无法使Lombok项目在Eclipse上运行
  5. android 初始化语言,25.Android init language (安卓初始化语言)
  6. 标题排版字幕动画fcpx模板:Typography Titles for Mac
  7. BetterZip使用教程分享:Mac用户如何提取压缩文件?
  8. 如何在Mac计算机上轻松查找和删除类似照片
  9. QT Core | 信号槽03 - 自定义信号与槽
  10. ideajdk升级_JDK升级为13