先把需要爬取的网页链接写到表格中

读取表格信息

import xlrd
excel_path = '/Users/yt/Desktop/chaye.xlsx'workbook: xlrd.book.Book = xlrd.open_workbook(excel_path)
sheet: xlrd.sheet.Sheet = workbook.sheet_by_index(0)for row in range(1, sheet.nrows):url = sheet.row_values(row)[0]id_str = sheet.row_values(row)[1]self.deal_photo_item(url, id_str)

开始爬取链接并下载图片

import urllib.request
def deal_photo_item(self, url, id_str):self.driver.get(url)self.driver.execute_script("window.scrollBy(0,1000)")random_sleep()self.driver.execute_script("window.scrollBy(0,-1000)")random_sleep()html = self.driver.page_sourceselector = Selector(text=html)images = []banner_image_list = selector.css('#nc_small::attr(src)').extract()for i, detail_image in enumerate(banner_image_list):# 下载图片urlStr = detail_image.replace('_60.jpg', '') + '.jpg'filename = f'./图片/{id_str}+{i}.jpg'urllib.request.urlretrieve(urlStr, filename=filename)


具体的爬取代码可以看我之前的淘宝商品信息爬取代码,这边只记录通过链接保存图片

爬取网页图片链接并下载保存相关推荐

  1. Java 爬取网页图片并下载

    Java 爬取网页图片并下载 源码; package a; import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup. ...

  2. node.js 爬虫 实现爬取网页图片并保存到本地

    node.js 爬虫 实现爬取网页图片并保存到本地 没有废话直接看代码 /*** 请求网站数据* 将数据保存本地文件*/ //不同协议引用不同模块,http https const http = re ...

  3. 使用Python爬取网页图片

    使用Python爬取网页图片 李晓文 21 天前 近一段时间在学习如何使用Python进行网络爬虫,越来越觉得Python在处理爬虫问题是非常便捷的,那么接下来我就陆陆续续的将自己学习的爬虫知识分享给 ...

  4. java爬虫-简单爬取网页图片

    刚刚接触到"爬虫"这个词的时候是在大一,那时候什么都不明白,但知道了百度.谷歌他们的搜索引擎就是个爬虫. 现在大二.再次燃起对爬虫的热爱,查阅资料,知道常用java.python语 ...

  5. 一个咸鱼的python_一个咸鱼的Python爬虫之路(三):爬取网页图片

    学完Requests库与Beautifulsoup库我们今天来实战一波,爬取网页图片.依照现在所学只能爬取图片在html页面的而不能爬取由JavaScript生成的图. 所以我找了这个网站 http: ...

  6. 【用Java爬取网页图片——爬虫爬取数据】

    用Java爬取网页图片--爬虫爬取数据 1.在创建项目中导入jsoup 2.创建一个保存下载图片的路径 3.使用URL读取网页路径,jsoup读取网页内容 4.利用属性标签获取图片连接块 5.因为该路 ...

  7. 上手快!!福利局!新手如何使用python爬虫爬取网页图片(使用正则进行数据解析)当然这个新手是我自己

    作为一个python新入门小白,突然就想发个博客,一方面为了记录学习历程,一方面能分享给新入门的同学经验,更多的是想和大家一起学习和交流.以下是我以小白的角度分享的爬虫的相关知识和一个简单的爬取网页图 ...

  8. node:爬虫爬取网页图片 1

    代码地址如下: http://www.demodashi.com/demo/13845.html 前言 周末自己在家闲着没事,刷着微信,玩着手机,发现自己的微信头像该换了,就去网上找了一下头像,看着图 ...

  9. 利用python爬取网页图片

    学习python爬取网页图片的时候,可以通过这个工具去批量下载你想要的图片 开始正题: 我从尤物网去爬取我喜欢的女神的写真照,我们这里主要用到的就两个模块 re和urllib模块,有的时候可能会用到t ...

最新文章

  1. 为centos选择国内yum软件库
  2. 亲爱的,热爱的~CTF
  3. xaml中的布局面板
  4. 昆明学院计算机二级报名时间,2017年3月昆明学院计算机等级考试报名时间(云南)...
  5. 在 Google Earth 上看新闻
  6. DataGridView控件
  7. 26元买4500斤脐橙,农民淘宝店被主播带头薅亏700万,“羊毛党”太狠了!
  8. Javascript获取select下拉框选中的的值
  9. 怎么把代码放图片里面进行注入_揭秘代码分层后的新世界
  10. docker es持久化_docker如何保持数据持久化?其实可以考虑通过数据卷挂载的方式~...
  11. oracle+dg常用命令,DG 日常管理命令汇总
  12. 在linux安装docker以及docker的常用命令(一)
  13. 基于Python班级管理系统毕业设计-附源码171809
  14. matlab遗传算法工具箱及应用 pdf,MATLAB遗传算法工具箱及应用(雷英杰)
  15. 《 郝斌 java自学视频 完结 》_郝斌Java自学视频 全107讲视频教程下载 完整版
  16. 计算机二进制拨码,8位二进制拨码对照表图片
  17. 物联网(工程师)+嵌入式学习路线图各个阶段
  18. 微信小程序获取年月日周及早上、中午、晚上
  19. (VQA)LRTA: A Transparent Neural-Symbolic Reasoning Framework with Modular Supervision for Visual Que
  20. git fatal: detected dubious ownership in repository 解决方法

热门文章

  1. 1流明等于多少lux_坎德拉-lux-流明的换算
  2. Android ROOT System权限 设备管理器
  3. 绘图:BITMAP和DIB区别
  4. 滴滴快车奖励政策,高峰奖励,翻倍奖励,按成交率,指派单数分级(8月22日~8月28日)...
  5. 在线技术文章总结整理
  6. python PIL 将带透明底png图片批量转化为jpg格式
  7. 面试三 去苏州了 2023.6.13 苏州一上市公司
  8. 深深的码丨Java ArrayList 源码透析
  9. 脱壳的几种方法 详细操作步骤
  10. 大学里挂了一科MySQL_大学里挂了科还能考研吗?挂科会产生哪些影响?