python爬取图片然后保存在文件夹中

直接上代码:

import os
import requests
import redef getimg(soup,i):print('http:'+ soup[0])root = "D://tu//tu"  # 保存的根目录j=1for k in soup:print(k)path = root + str(j) + ".jpg"  # 保存的地址if not os.path.exists(path):  # 如果文件不存在就爬取并保存mun='http:'+ kr=requests.get(mun)j=j+1with open(path, 'wb') as f:  # 'wb'以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。f.write(r.content)  # content返回二进制数据,所以使用'wb'f.close()print("文件保存成功")else:print("文件已存在")
def main():url = 'https://s.taobao.com/search?q=%E8%AE%A1%E7%AE%97%E6%9C%BA%E7%BD%91%E7%BB%9C&imgfile=&js=1&stats_click=search_radio_all%3A1&initiative_id=staobaoz_20201126&ie=utf8'file = open('C:/Users/YHAA-1ED2A3/Desktop/taobao_product.txt','w',encoding='utf-8')cookie_str = r't=e62fc3896f26735342c795d27a369781; c83ebeb; xlly_s=1; 'cookies = {}headers = {'User-agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36'}for line in cookie_str.split(';'):key, value = line.split('=', 1)cookies[key] = valuer = requests.get(url, headers = headers, cookies = cookies)r.encoding = r.apparent_encodingdemo = r.textsoup = re.findall(r'"pic_url":"([^"]+)"',r.text,re.I) getimg(soup,1)main()

结果:

python爬取图片然后保存在文件夹中相关推荐

  1. python爬取图片并且保存到本地指定文件夹内

    python爬取图片 先上代码: from urllib.request import Request, urlopen, urlretrieve from fake_useragent import ...

  2. python3 爬取图片并分页保存在文件夹中

    目标 https://www.veer.com/search-image/fengjing/中的图片 过程分析 网页分析 这次爬取的比较简单,要爬取的内容很容易就找到了. 换页 点击下一页,看到网址变 ...

  3. python爬取图片并保存到本地

    Python爬取图片(你懂得) requests与Bs4 这两个模块是本文使用的主要模块,requests可以获取连接,bs4全名BeautifulSoup,是编写python爬虫常用库之一,主要用来 ...

  4. python图层合并_GIS实验之文件夹中的批量图层合并Python实现

    1. 实验任务2. 实验数据分析3. Python实现图层合并 1. 实验任务数据描述 :提供含有多个数据文件的 20 个文件夹,每中的数据名称都一致.例如每个文件夹中有为" 名称都一致.例 ...

  5. java保存不了_在使用Java写入文件时,文件不能保存在文件夹中

    什么即时通讯要做的只是让用户选择一个目录来保存文本文件,问题是即时通讯尝试选择一个文件夹即时通讯创建在我的桌面上,但是当我用JFileChooser选择文件夹,并让我的代码做工作它仍然保存在文件夹和桌 ...

  6. Python从父目录的其他文件夹中导入模块的解决方案(亲测有效)

    简单吐槽 这两天在下载github上的python程序来跑的时候,发现经常出现的一个问题:当在某一python脚本文件想要导入父目录下的其他文件夹中的模块时,会报错 Traceback (most r ...

  7. Python爬取图片并保存本地

    好久没用requests写爬虫了,因为是国内的网站,展示没有使用代理IP,而且爬取的数据不多. 1.第一步将要爬取的网页链接爬取下来.这句话有些矛盾. url='http://www.supe.com ...

  8. python批量处理图片尺寸(将文件夹中所有图片设定为固定尺寸)

    方法一:import numpy as np import os import cv2# 设置图片路径,该路径下包含了14张jpg格式的照片,名字依次为0.jpg, 1.jpg, 2.jpg,..., ...

  9. python怎么保存excel文件夹_在Python中保存excel工作簿

    我是Python新手,我需要打开文件夹中的所有excel(一个接一个),等待SAS addin加载新数据,然后保存并关闭它.我试着使用一些库,但无法获得预期的结果.在 使用子流程:import os ...

最新文章

  1. python连接mongo_Python连接MongoDB操作
  2. 程序员如何 10 分钟用 Python 画出蒙娜丽莎?
  3. 从零基础转行到前端大牛,需要经过哪几个阶段?
  4. WinForm 下实现一个自动关闭的MessageBox
  5. Python中使用static、class、abstract方法
  6. 【安装包】MySQL服务端
  7. C++ 动态命名和修改变量名 动态生成变量名 define
  8. 电子书的下载与查阅书的源码
  9. 计算机分析桁架受力,结构力学教学中桁架的概念分析与实践
  10. 达芬奇的十大经典名画解读
  11. 联想裁员:公司不是我的家
  12. Pandas query 的用法, df.query
  13. 支付业务与技术架构学习总结(10)——第三方支付账务系统论述
  14. Spring BackOff退避算法(一)
  15. Linux下CAN总线通信调试记录
  16. 新手入门:ST-Link和J-Link仿真器的使用
  17. MongoDB 运行 service mongod start 后服务没有启动成功
  18. 混凝土静力受压弹性模量试验计算公式_谈混凝土静力受压弹性模量
  19. Python简单爬虫入门-爬取链家租房网上的租房信息
  20. c语言指针与数组的深入理解

热门文章

  1. JDK下载(jdk1.8下载与安装教程)
  2. 基于暗通道优先的单幅图像去雾算法(Matlab)
  3. uCLinux的编译
  4. 谈谈多线程中的Future
  5. 车内看车头正不正技巧_史上最全:新手开车/停车技巧(真实图解)
  6. js java 图片上传_spring(java,js,html) 截图上传图片实例详解
  7. 2021-3-2打砖块游戏,轮播图,swiper,自执行函数
  8. WebGoat v8.1.0 下载安装(windows)
  9. Electron主进程与渲染进程相互通信
  10. 软件开发实训(720科技)――产品经理能力模型