首先创建的文件夹,先定义一个创建文件夹的函数:

def makdir(path):try:isExists = os.path.exists(path)#判断是否存在文件夹if not isExists:#不存在创建os.makedirs(path)print(path+'文件夹创建成功!')else:print(path+'文件夹已存在!')except Exception as e:print(e)

爬取图片并保存图片函数

def pic_download(paths,url):# 请求头池headers = {'user-agent':"Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10"}web = requests.get(url, headers=headers).content.decode()# print(web.encoding)data = etree.HTML(web)lists = data.xpath('//div[@class="text_left text_lefts"]/div[@id="container"]/div')for lis in lists:new_url = 'https:' + lis.xpath('./p/a/@href')[0]name = lis.xpath('./p/a/@alt')[0]#创建相应文件夹makdir(paths+'/' + name)new_web = requests.get(new_url, headers=headers).content.decode()new_data = etree.HTML(new_web)finall_url = 'https:' + new_data.xpath('//div[@class="imga"]/a/@href')[0]#以二进制的方式写入图片try:r = requests.get(finall_url, headers=headers).contentwith open(paths+'/' + name+'/'+name+'.jpg','wb') as f:f.write(r)print('%s 下载成功' % (name))time.sleep(0.5)except Exception:print('%s下载失败' % (name))time.sleep(0.5)

调用函数

if __name__ == '__main__':path = 'D:/爬虫下载'#爬取第5页到第7页的数据for i in range(5,8):print('==========开始第{}页的爬取=========='.format(i))url = 'https://sc.chinaz.com/tupian/renwutupian_{}.html'.format(i)pic_download(path+'/' + str(i),url)print('----------完成第{}页的爬取----------'.format(i))time.sleep(1)

完整代码:

from lxml import etree
import time
import requests
import os#创建文件夹
def makdir(path):try:isExists = os.path.exists(path)#判断是否存在文件夹if not isExists:#不存在创建os.makedirs(path)print(path+'文件夹创建成功!')else:print(path+'文件夹已存在!')except Exception as e:print(e)#获取图片
def pic_download(paths,url):# 请求头池headers = {'user-agent':"Mozilla/5.0 (X11; U; Linux x86_64; zh-CN; rv:1.9.2.10) Gecko/20100922 Ubuntu/10.10 (maverick) Firefox/3.6.10"}web = requests.get(url, headers=headers).content.decode()# print(web.encoding)data = etree.HTML(web)lists = data.xpath('//div[@class="text_left text_lefts"]/div[@id="container"]/div')for lis in lists:new_url = 'https:' + lis.xpath('./p/a/@href')[0]name = lis.xpath('./p/a/@alt')[0]#创建相应文件夹makdir(paths+'/' + name)new_web = requests.get(new_url, headers=headers).content.decode()new_data = etree.HTML(new_web)finall_url = 'https:' + new_data.xpath('//div[@class="imga"]/a/@href')[0]#以二进制的方式写入图片try:r = requests.get(finall_url, headers=headers).contentwith open(paths+'/' + name+'/'+name+'.jpg','wb') as f:f.write(r)print('%s 下载成功' % (name))time.sleep(0.5)except Exception:print('%s下载失败' % (name))time.sleep(0.5)#     #print(name)if __name__ == '__main__':path = 'D:/爬虫下载'#爬取第5页到第7页的数据for i in range(5,6):print('==========开始第{}页的爬取=========='.format(i))url = 'https://sc.chinaz.com/tupian/renwutupian_{}.html'.format(i)pic_download(path+'/' + str(i),url)print('----------完成第{}页的爬取----------'.format(i))time.sleep(1)

Python获取图片保存对应的文件夹相关推荐

  1. Vue+Springboot上传图片将 Base64 码转换为图片保存在指定文件夹

    Vue+Springboot上传图片将 Base64 码转换为图片保存在指定文件夹 前言 一.Vue 前端 一.五 注意!!! 二.Springboot 后端 引入Base64依赖 在项目里新建 ut ...

  2. java把图片存入文件夹_将图片保存在指定文件夹中

    我可以通过我的代码将图片保存在我想要的文件夹中,但这还不够好,因为我的代码在我的文件夹中提供了一个图像副本,而在图库中提供了另一个图像(DCIM) . 代码: Btngetdata.setOnClic ...

  3. python按照图片命名顺序读取文件夹下的图片

    假设我们要读取的文件夹下的图片命名如下: 现在需要按照图片的命名顺序逐个读取图片(即按照frame1.jpg,frame2.jpg,frame3.jpg,frame4.jpg,frame5.jpg顺序 ...

  4. 怎么把图片保存到考生文件夹_请在考生文件夹下完成如下操作

    1 .请在考生文件夹下完成如下操作: ( 1 )在考生文件夹下建立 " 图片 2" 文件夹: ( 2 )在考生文件夹下查找所有的 jpg 文件,并将文件移动到 " 图片 ...

  5. python批量图片大小处理-多文件夹

    有时候我们需要对图片就行大小处理,但是图片数量多,而且分布在不同的文件夹下面,那么我们怎么对图片进行批量大小处理呢. 一般的单张图片处理使用的是reshape或resize对图片进行缩放,但是如果我们 ...

  6. python下载图片到文件夹_python 移动图片到另外一个文件夹的实例

    python 移动图片到另外一个文件夹的实例 如下所示: # -*- coding:utf8 -*- import os import shutil import numpy as np import ...

  7. pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存

    pyaudio:基于pyaudio利用Python编程从电脑端录制音频保存到指定文件夹+将录音上传服务器+录音进行识别并转为文本保存 目录 输出结果 代码实现 输出结果 代码实现 # -*- codi ...

  8. Matlab图片预处理——截取图片中有效部分保存在其余文件夹下

    Matlab图片预处理 1.目的 2.多文件夹代码 3.单文件夹代码 4.效果图 1.目的 医学图像处理中,需要将医学图像中非病理图像的平台操作页面截掉,只保留病理图片. 2.多文件夹代码 Matla ...

  9. Python爬取起点小说并保存到本地文件夹和MongoDB数据库中

    Python爬取起点小说并保存到本地MongoDB数据库中 工具:Python3.7 + Mongo4.0 + Pycharm """ 爬取起点小说<诡秘之主> ...

  10. python爬取明星百度图片并存入本地文件夹

    python爬取明星百度图片并存入本地文件夹 想要一个明星图片的时候,发现图片量过大,一张张保存太累,不太现实 这时候就可以用到爬虫,批量爬取图片 现在又出现一个问题,当发现一个明星爬完后,再爬取下一 ...

最新文章

  1. 【机器学习算法-python实现】逻辑回归的实现(LogicalRegression)
  2. 【面试招聘】有哪些好的秋招经验分享?数据、算法岗的几点经验分享
  3. Caffe+UbuntuKylin14.04_X64+CUDA 6.5配置
  4. 转行,转向哪里?电子工程师!!!
  5. ubuntu 64 12.04 oracle,ubuntu server 12.04 x86_64 下安装oracle xe 11 x86_64
  6. python迭代器创建序列_Python 中迭代器与生成器实例详解
  7. you need to resolve your current index first 解决办法
  8. R.I.P. Alan Turing(旧文搬运15.6.6)
  9. python列表去重_python列表的去重
  10. ​比较一下主流国际快递系统 国际快递公司如何选择
  11. android删除字符,【已解决】Android中EditText中退格键BackSpace键(删除键)不起效果:无法删除字符...
  12. Linux共享后无权限访问,Samba服务无权限访问
  13. wex5 checkbox
  14. 【历史上的今天】2 月 9 日:世界上第一位计算机科学博士出生;微软发布 Surface Pro;Google Buzz 问世
  15. 实时vad(替换webrtcvad)
  16. 数据库load data命令批量插入txt文件的数据
  17. Linux:syscall: entry_SYSCALL_64_after_hwframe
  18. 小甜甜布兰妮的饮食瘦身套餐
  19. APP测试面试题汇总
  20. 赢在中国 第二季 语录

热门文章

  1. 什么是Android Instant Apps?
  2. 搭建一个独立英文网站费用多少?
  3. 方正飞鸿智能信息平台产品白皮书(四)
  4. 打地鼠游戏的制作与心得
  5. Win11如何退出磁贴桌面?
  6. 面试题:深拷贝和浅拷贝(超级详细,有内存图)
  7. Word:一级标题行首段前距失效问题
  8. 教育培训行业的SOP
  9. 计算机总自动开机 如何关闭,手把手教你win10电脑关机后自动开机怎么解决
  10. 开源项目学习之(一)------zheng环境搭建