scrapy简单爬取图片
#这里只爬取第一页 items.py import scrapy #定义爬取数据 class InsistItem(scrapy.Item):image_urls=scrapy.Field()tengxun.py import scrapy from insist.items import InsistItem import jsonclass TengxunSpider(scrapy.Spider):name = 'tengxun'allowed_domains = ['douyucdn.cn']start_urls = ['http://capi.douyucdn.cn/api/v1/getVerticalRoom?limit=20&offset=']def parse(self, response):item=InsistItem()con=json.loads(response.body)datas=con['data']print(datas)for i in datas:item['image_urls']=[i['vertical_src']]#非常重要,由于#{'scrapy.pipelines.images.ImagesPipeline': 301}用到的是图片的url列表,即使是一个链接也要用列表yield itemsettings.py ITEM_PIPELINES = {#'insist.pipelines.InsistPipeline': 300,'scrapy.pipelines.images.ImagesPipeline': 1, } IMAGES_STORE='C:\\Users\\lenovo\\Desktop\\data'#图片保存地址 IMAGES_URLS_FIELD='image_urls'#保存链接的字段 pipelines.py import scrapy from scrapy.pipelines.images import ImagesPipeline#导包 class SDPipeline(ImagesPipeline):def get_media_requests(self,item,info):image_link=item['image_urls']yield scrapy.Request(image_link)最后scrapy crawl tengxun 然后在所写的图片的目录中打开一个full的文件夹查看图片
转载于:https://www.cnblogs.com/persistence-ok/p/11560304.html
scrapy简单爬取图片相关推荐
- 使用Scrapy爬虫框架简单爬取图片并保存本地(妹子图)
使用Scrapy爬虫框架简单爬取图片并保存本地(妹子图) 初学Scrapy,实现爬取网络图片并保存本地功能 一.先看最终效果 保存在F:\pics文件夹下 二.安装scrapy 1.python的安装 ...
- scrapy简单爬取内容
scrapy的简单爬取不用新建项目.安装好scrapy后编写爬虫文件 import scrapyclass ZaobaoScrapy(scrapy.Spider):name = "zaoba ...
- python用for循环读取图片_python 使用for循环简单爬取图片(1)
现在的网站大多做了反爬处理,找一个能爬的网站还真不容易. 下面开始一步步实现: 1.简单爬录目图片 1 importurllib.request2 importre3 4 defgethtml(url ...
- Scrapy管道爬取图片
大家好,我是python的初学者,我最近在学习Scrapy管道下载时遇到很多问题,最终虽没有完全克服,但也是收获颇丰,下面我将最近遇到并克服的问题与大家分享一下! 本文的基础是pycharm,scra ...
- [python学习] 简单爬取图片网站图库中图片
最近老师让学习Python与维基百科相关的知识,无聊之中用Python简单做了个爬取"游讯网图库"中的图片,因为每次点击下一张感觉非常浪费时间又繁琐.主要分享的是如何爬取HTML的 ...
- (纯小白)Python简单爬取图片
在具体介绍图片爬取之前我们先简单弄个小实验,使用Python来写一个下载图片的程序. #完整代码 import requestsdef down_pic(down_url, picname):head ...
- 利用scrapy简单爬取新片场前20页视频数据,并存入mysql数据库
1.创建Scrapy项目 scrapy startproject XPC 2.进入项目目录,使用命令genspider创建Spider(注意后面允许爬取的域要增加) scrapy genspider ...
- python+scrapy简单爬取淘宝商品信息
python结合scrapy爬取淘宝商品信息 一.功能说明: 已实现功能: 通过scrapy接入selenium获取淘宝关键字搜索内容下的商品信息. 待扩展功能: 爬取商品中的全部其他商品信息. 二. ...
- python爬取图片实例_Python简单爬取图片实例
都知道Python的语法很简单易上手,也很适合拿来作爬虫等等,这里就简单讲解一下爬虫入门--简单地爬取下载网站图片.html 效果 就像这样自动爬取下载图片到本地:python 代码: 其实很简单,咱 ...
最新文章
- python数据拟合fit
- Linux 终端部分重要快捷键
- Java数据库连接(JDBC)之一:JDBC详细连接过程
- 心态很容易受别人影响_阳光心态的句子,句句动人心弦,送给追梦路上的你
- 使用 Source Generator 代替 T4 动态生成代码
- IT-标准化-系列-15.在VPC 2007中构建虚拟网络
- 8cm等于多少像素_没诚意!红米Note 8 4800万像素是假的?网友:看看realme Q吧
- 微软宣布明年停止支持已推出25年的IE浏览器
- html在线查看ppt,网页设计———HTML基本标记.ppt
- 计算机信息管理自荐信个人简历,计算机信息专业英文自荐信
- ajax+同步+返回数据库,如何使AJAX同步
- python爬虫:Scrapy框架爬取纳斯达克(NASDAQ)股票数据
- Windows Server AppFabric 安装文档
- 微信开发 完美微信自动转发朋友圈-flutterAndroid
- CAJ论文怎么打开?
- 分号的html文本,vue中利用v-html按分号将文本换行
- WPF开发之dll文件创建与调用
- ckplayer html5 添加广告,ewebeditor下利用ckplayer增加html5 (mp4)全平台的支持
- SwiftUI脑洞大开打造实时显示当前值的Slider(滑动器)
- iphone11夜景模式怎么开
热门文章
- 【转】Unity3D研究院之设置自动旋转屏幕默认旋转方向
- 新鲜出炉的百度js面试题
- Timus 1015. Test the Difference!
- LeetCode2.两数相加
- Win10 Qt5安装
- 问题 K: 输出月历 山东科技大学OJ
- Ansible(四)ansible roles实现(apache+haproxy+keepalived)负载均衡+高可用
- idea swagger生成接口文档_Spring Boot(九)Swagger2自动生成接口文档和Mock模拟数据...
- 8 | Spatial-based GNN/convolution模型之GAT(受欢迎)
- SAP License:ERP实施关键问题