#这里只爬取第一页

items.py
import scrapy
#定义爬取数据
class InsistItem(scrapy.Item):image_urls=scrapy.Field()tengxun.py
import scrapy
from insist.items import InsistItem
import jsonclass TengxunSpider(scrapy.Spider):name = 'tengxun'allowed_domains = ['douyucdn.cn']start_urls = ['http://capi.douyucdn.cn/api/v1/getVerticalRoom?limit=20&offset=']def parse(self, response):item=InsistItem()con=json.loads(response.body)datas=con['data']print(datas)for i in datas:item['image_urls']=[i['vertical_src']]#非常重要,由于#{'scrapy.pipelines.images.ImagesPipeline': 301}用到的是图片的url列表,即使是一个链接也要用列表yield itemsettings.py
ITEM_PIPELINES = {#'insist.pipelines.InsistPipeline': 300,'scrapy.pipelines.images.ImagesPipeline': 1,
}
IMAGES_STORE='C:\\Users\\lenovo\\Desktop\\data'#图片保存地址
IMAGES_URLS_FIELD='image_urls'#保存链接的字段

pipelines.py
import scrapy
from scrapy.pipelines.images import ImagesPipeline#导包
class SDPipeline(ImagesPipeline):def get_media_requests(self,item,info):image_link=item['image_urls']yield scrapy.Request(image_link)最后scrapy crawl tengxun
然后在所写的图片的目录中打开一个full的文件夹查看图片

转载于:https://www.cnblogs.com/persistence-ok/p/11560304.html

scrapy简单爬取图片相关推荐

  1. 使用Scrapy爬虫框架简单爬取图片并保存本地(妹子图)

    使用Scrapy爬虫框架简单爬取图片并保存本地(妹子图) 初学Scrapy,实现爬取网络图片并保存本地功能 一.先看最终效果 保存在F:\pics文件夹下 二.安装scrapy 1.python的安装 ...

  2. scrapy简单爬取内容

    scrapy的简单爬取不用新建项目.安装好scrapy后编写爬虫文件 import scrapyclass ZaobaoScrapy(scrapy.Spider):name = "zaoba ...

  3. python用for循环读取图片_python 使用for循环简单爬取图片(1)

    现在的网站大多做了反爬处理,找一个能爬的网站还真不容易. 下面开始一步步实现: 1.简单爬录目图片 1 importurllib.request2 importre3 4 defgethtml(url ...

  4. Scrapy管道爬取图片

    大家好,我是python的初学者,我最近在学习Scrapy管道下载时遇到很多问题,最终虽没有完全克服,但也是收获颇丰,下面我将最近遇到并克服的问题与大家分享一下! 本文的基础是pycharm,scra ...

  5. [python学习] 简单爬取图片网站图库中图片

    最近老师让学习Python与维基百科相关的知识,无聊之中用Python简单做了个爬取"游讯网图库"中的图片,因为每次点击下一张感觉非常浪费时间又繁琐.主要分享的是如何爬取HTML的 ...

  6. (纯小白)Python简单爬取图片

    在具体介绍图片爬取之前我们先简单弄个小实验,使用Python来写一个下载图片的程序. #完整代码 import requestsdef down_pic(down_url, picname):head ...

  7. 利用scrapy简单爬取新片场前20页视频数据,并存入mysql数据库

    1.创建Scrapy项目 scrapy startproject XPC 2.进入项目目录,使用命令genspider创建Spider(注意后面允许爬取的域要增加) scrapy genspider ...

  8. python+scrapy简单爬取淘宝商品信息

    python结合scrapy爬取淘宝商品信息 一.功能说明: 已实现功能: 通过scrapy接入selenium获取淘宝关键字搜索内容下的商品信息. 待扩展功能: 爬取商品中的全部其他商品信息. 二. ...

  9. python爬取图片实例_Python简单爬取图片实例

    都知道Python的语法很简单易上手,也很适合拿来作爬虫等等,这里就简单讲解一下爬虫入门--简单地爬取下载网站图片.html 效果 就像这样自动爬取下载图片到本地:python 代码: 其实很简单,咱 ...

最新文章

  1. python数据拟合fit
  2. Linux 终端部分重要快捷键
  3. Java数据库连接(JDBC)之一:JDBC详细连接过程
  4. 心态很容易受别人影响_阳光心态的句子,句句动人心弦,送给追梦路上的你
  5. 使用 Source Generator 代替 T4 动态生成代码
  6. IT-标准化-系列-15.在VPC 2007中构建虚拟网络
  7. 8cm等于多少像素_没诚意!红米Note 8 4800万像素是假的?网友:看看realme Q吧
  8. 微软宣布明年停止支持已推出25年的IE浏览器
  9. html在线查看ppt,网页设计———HTML基本标记.ppt
  10. 计算机信息管理自荐信个人简历,计算机信息专业英文自荐信
  11. ajax+同步+返回数据库,如何使AJAX同步
  12. python爬虫:Scrapy框架爬取纳斯达克(NASDAQ)股票数据
  13. Windows Server AppFabric 安装文档
  14. 微信开发 完美微信自动转发朋友圈-flutterAndroid
  15. CAJ论文怎么打开?
  16. 分号的html文本,vue中利用v-html按分号将文本换行
  17. WPF开发之dll文件创建与调用
  18. ckplayer html5 添加广告,ewebeditor下利用ckplayer增加html5 (mp4)全平台的支持
  19. SwiftUI脑洞大开打造实时显示当前值的Slider(滑动器)
  20. iphone11夜景模式怎么开

热门文章

  1. 【转】Unity3D研究院之设置自动旋转屏幕默认旋转方向
  2. 新鲜出炉的百度js面试题
  3. Timus 1015. Test the Difference!
  4. LeetCode2.两数相加
  5. Win10 Qt5安装
  6. 问题 K: 输出月历 山东科技大学OJ
  7. Ansible(四)ansible roles实现(apache+haproxy+keepalived)负载均衡+高可用
  8. idea swagger生成接口文档_Spring Boot(九)Swagger2自动生成接口文档和Mock模拟数据...
  9. 8 | Spatial-based GNN/convolution模型之GAT(受欢迎)
  10. SAP License:ERP实施关键问题