scrapy运行时提示DEBUG: Filtered offsite request to
用scrapy爬取数据时,使用yield scrapy.Requeste()不能把数据传到下一个解析函数时,提示Filtered offsite request to [域名] 说明此时你请求的域名list.suning.com
跟你起始设置的allowed_domains = ['book.suning.com']
中的域名不一样,系统自动过滤掉与设置域名不一样的域名了,这里有两种解决办法:
办法1:
设置allowed_domains = []
为这样,也就是设置起始域名为空,最简便的方法
办法2:
yield 设置为这样yield scrapy.Request(url,callback=self.next_parse,dont_filter=True)
,在后面添加了dont_filter=True
也就是不过滤为Ture
,这样scrapy运行的时候就不会自动过滤掉与初始设置的域名不一样的域名了
scrapy运行时提示DEBUG: Filtered offsite request to相关推荐
- [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ‘XXX‘
一.问题描述 scrapy-redis中使用RedisCrawlSpider类爬虫,以Rule规则来匹配地址,运行爬虫时出现错误: [scrapy.spidermiddlewares.offsite] ...
- [scrapy] DEBUG: Filtered offsite request to
[scrapy 常见问题整理] DEBUG: Filtered offsite request to 使用scrapy爬取豆瓣TOP250电影信息在进行自动翻页爬取的时候,出现了一个问题,解析自动翻页 ...
- 爬虫中遇到的问题Crawled (404),[scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to
1.错误1:url地址有误 Crawled (200) <GET http://www.itcast.cn/robots.txt> (referer: None) DEBUG: Crawl ...
- 2018-12-06 18:09:55 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'weixin.so
2018-12-06 18:09:55 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'weixin.so ...
- DEBUG: Filtered offsite request to
在做爬虫项目时,出现了一个问题,解析一个网站二次爬取时没有获取到数据,就写了一个测试程序试了下,测试程序如下 import scrapy from scrapy.linkextractors impo ...
- python爬虫学习日记(1) scrapy爬取时,报错Filtered offsite request
使用scrapy框架抓取某妹子图网时,只能抓取第一页,第二页报错 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request ...
- scrapy 爬网站 显示 Filtered offsite request to 错误
查看日志 发现报 2018-09-12 00:27:58 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ' ...
- 用scrapy写爬虫 显示 Filtered offsite request to 错误.
爬电源网公司信息,无法爬取. 查看控制台发现报如下错误: DEBUG: Filtered offsite request to 'product.dianyuan.com': 果断上网百度 ,找到答案 ...
- scrapy 爬网站 显示 Filtered offsite request to 错误.
爬取zol 网站图片,无法抓取. 在 setting.py 文件中 设置 日志 记录等级 LOG_LEVEL= 'DEBUG' LOG_FILE ='log.txt' 查看日志 发现报 2015-11 ...
最新文章
- FZU-Problem 2191 完美的数字
- OCR算法识别率怎么评估?
- 使用VS Code 从零开始开发并调试.NET Core 应用程序
- Vue.js 定义组件模板的七种方式
- 判断android图片是否硬解码(方法)
- Unity2020.1新功能探路:Profiler相关更新
- 练打字-测试看图说话(AD安装)
- 单元测试 : Googel test测试框架
- 【入门二】格式化输入/输出
- 如何将浮点数点左边的数每三位添加一个逗号,如12000000.11转化为『12,000,000.11』...
- Matlab常用函数表
- java 风能玫瑰图,施用java awt画风向玫瑰图及风能玫瑰图程序
- 电脑计算机稳定删除垃圾游戏,电脑卡怎么办简单步骤_如何清理电脑垃圾
- ChromeDriver版本(最新v2.45)与Chrome版本(最新v72)支持关系以及下载地址
- 2013年最火和最挣钱的IT职位
- 安装RabbitMQ出现Plugin configuration unchanged.问题
- 基于MATLAB的批量3度带高斯正算(LB--xy)
- Unity3D之挥动武器产生的剑痕特效
- 除了python人工智能还可以用哪些编程语言实现?
- B1030 (完美数列)
热门文章
- opencvsharp 使用knn 实现身份证号码识别
- 【转载】我们要做不完美的自己
- cnbloger: 范振勇, 虚拟机上安装centos8.0[(vmware-15-pro)]
- $.ajax传值方式
- 第七章 SQL聚合函数 LIST
- 五千买Android手机划算吗,啥时候买Android手机最划算?
- Starting From 0 Learning Python(The Fourth Day)
- _Linux (ipc命令)
- 日语五十音,电脑壁纸,手机壁纸自制纪念
- 读取豆瓣图书API并下载封面图片的Qt程序