创建scrapy的项目请参考:https://blog.csdn.net/qq_35723619/article/details/83614670

items的实现:

DouyumeinvSpider创建:
这次我们爬去的是json数据包:我们可以通过network监控:

# -*- coding: utf-8 -*-
import scrapy
import json
from douyu.items import DouyuItemclass DouyumeinvSpider(scrapy.Spider):name = 'douyumeinv'allowed_domains = ['capi.douyucdn.cn']offset = 0url = "http://capi.douyucdn.cn/api/v1/getVerticalRoom?limit=20&offset="start_urls = [url + str(offset)]def parse(self, response):data = json.loads(response.text)['data']for each in data:item = DouyuItem()item['name'] = each['nickname']item['imglink'] = each['vertical_src']yield itemself.offset += 20yield scrapy.Request(self.url + str(self.offset), callback=self.parse)

配置setting

创建ImagePipeline我们这里继承了scrapy处理图片的ImagesPipeline重新构建

get_media_requests(self, item, info)和item_completed(self, results, item, info)方法

运行结果:

谢谢浏览!!!!

python+scrapy爬取斗鱼图片相关推荐

  1. 利用python爬虫爬取斗鱼图片(简单详细)

    关于 在一个安静的夜晚,我缓慢的打开了电脑,望着已经睡着的父母,我轻轻的把门关上,看着斗鱼颜值主播的魅力,我不尽感叹,要是每天都可以不需要那么麻烦的去看那该有多好! 于是我想起了最近刚学的爬虫,嘴角露 ...

  2. scrapy爬取斗鱼图片并且重命名后保存

    斗鱼的api为: http://capi.douyucdn.cn/api/v1/live?limit=20&offset=0 建立一个scrapy爬虫 douyu.py import json ...

  3. 使用Scrapy爬取斗鱼图片

    1.具体文件结构 2.代码: items # -*- coding: utf-8 -*-# Define here the models for your scraped items # # See ...

  4. Python爬虫:scrapy爬取斗鱼直播图片

    通过斗鱼给出的api,获取json文件,解析出图片地址,可以获取直播间的图片 斗鱼api接口: http://open.douyucdn.cn/api/RoomApi/live/{num} 比如: h ...

  5. 使用scrapy框架爬取斗鱼图片

    使用scrapy框架爬取斗鱼图片 首先我们先认识一下框架 scrapy-Scrapy是Python开发的一个快速.高层次的屏幕抓取和web抓取框架,用于抓取web站点并从页面中提取结构化的数据.Scr ...

  6. Scrapy爬取美女图片续集 (原创)

    上一篇咱们讲解了Scrapy的工作机制和如何使用Scrapy爬取美女图片,而今天接着讲解Scrapy爬取美女图片,不过采取了不同的方式和代码实现,对Scrapy的功能进行更深入的运用. 在学习Scra ...

  7. Python+scrapy爬取36氪网

    Python+Scrapy爬取36氪网新闻 一.准备工作: ​ ①安装python3 ​ ②安装scrapy ​ ③安装docker,用来运行splash,splash是用来提供js渲染服务(pyth ...

  8. Scrapy爬取ammmi图片

    Scrapy爬取ammmi图片 相关配置: python version:3.7 IDE:Pycharm environment:windows10 Framework:Scrapy 相关链接: We ...

  9. 使用scrapy爬取斗鱼直播间信息

    目录 1. 谷歌抓包工具的使用 1.1 打开Chrome开发者工具的方法 1.2 开发者工具的结构 1.3 network模块 2. 使用谷歌抓包工具抓取斗鱼数据 3. 使用scrapy爬取斗鱼直播间 ...

最新文章

  1. java日历教程_JAVA Calendar方法使用基础教程详解
  2. 【图文】Excel中vlookup函数的使用方法
  3. 《数据结构与算法分析:C语言描述》复习——第六章“排序”——基数排序
  4. 错误信息Make an entry in Field Text Area
  5. #10010 「一本通 1.1 练习 6」糖果传递 (数学+贪心)
  6. MarkDown的介绍
  7. 十面阿里,菜鸟,天猫,蚂蚁金服题目总汇
  8. 2个菜鸟Java常量和枚举陷阱
  9. 黑马程序员 java基础之网络编程TCP
  10. python 字符转义_2500字 字符串专题总结
  11. 盖茨透露自己曾犯下4000亿美元的错:给了安卓机会
  12. 将一个数组中的值按逆序重新排放。_六十五、下一个更大的数系列,单调栈解决方法...
  13. java中有效关键字_java中有效的关键字
  14. Java从入门到入土
  15. 中文拼音排序(web前端实现)
  16. donet 微服务开发 学习-熔断降级 Polly
  17. photoshop2019及其破解器
  18. Unity游戏热更新
  19. 全球与中国网络连接视频门铃对讲机市场深度研究分析报告
  20. sqlite设密工具如何使用(本人资源)

热门文章

  1. 7-4 Swan学院社团招新 (20 分)
  2. Python代码原来还可以这样玩——画出不同人物效果图,感觉很美好
  3. 操作系统知识总结一(OS概述)
  4. 汉诺塔 = 套娃 ?
  5. 独立显卡 台式计算机,台式机独立显卡怎么切换
  6. 利用飞信接口免费发短信
  7. Android6.0短信装逼生成器
  8. linux centos7 iso镜像下载,CentOS Linux 7.9 (2009) iso镜像下载
  9. ABP VNext学习日记17
  10. Ubuntu安装教程1-U盘启动盘制作