用scrapy爬取数据时,使用yield scrapy.Requeste()不能把数据传到下一个解析函数时,提示Filtered offsite request to [域名] 说明此时你请求的域名list.suning.com跟你起始设置的allowed_domains = ['book.suning.com']中的域名不一样,系统自动过滤掉与设置域名不一样的域名了,这里有两种解决办法:
办法1:
设置allowed_domains = []为这样,也就是设置起始域名为空,最简便的方法

办法2:
yield 设置为这样yield scrapy.Request(url,callback=self.next_parse,dont_filter=True),在后面添加了dont_filter=True也就是不过滤为Ture,这样scrapy运行的时候就不会自动过滤掉与初始设置的域名不一样的域名了

scrapy运行时提示DEBUG: Filtered offsite request to相关推荐

  1. [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ‘XXX‘

    一.问题描述 scrapy-redis中使用RedisCrawlSpider类爬虫,以Rule规则来匹配地址,运行爬虫时出现错误: [scrapy.spidermiddlewares.offsite] ...

  2. [scrapy] DEBUG: Filtered offsite request to

    [scrapy 常见问题整理] DEBUG: Filtered offsite request to 使用scrapy爬取豆瓣TOP250电影信息在进行自动翻页爬取的时候,出现了一个问题,解析自动翻页 ...

  3. 爬虫中遇到的问题Crawled (404),[scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to

    1.错误1:url地址有误 Crawled (200) <GET http://www.itcast.cn/robots.txt> (referer: None) DEBUG: Crawl ...

  4. 2018-12-06 18:09:55 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'weixin.so

    2018-12-06 18:09:55 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'weixin.so ...

  5. DEBUG: Filtered offsite request to

    在做爬虫项目时,出现了一个问题,解析一个网站二次爬取时没有获取到数据,就写了一个测试程序试了下,测试程序如下 import scrapy from scrapy.linkextractors impo ...

  6. python爬虫学习日记(1) scrapy爬取时,报错Filtered offsite request

    使用scrapy框架抓取某妹子图网时,只能抓取第一页,第二页报错 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request ...

  7. scrapy 爬网站 显示 Filtered offsite request to 错误

    查看日志 发现报 2018-09-12 00:27:58 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ' ...

  8. 用scrapy写爬虫 显示 Filtered offsite request to 错误.

    爬电源网公司信息,无法爬取. 查看控制台发现报如下错误: DEBUG: Filtered offsite request to 'product.dianyuan.com': 果断上网百度 ,找到答案 ...

  9. scrapy 爬网站 显示 Filtered offsite request to 错误.

    爬取zol 网站图片,无法抓取. 在 setting.py 文件中 设置 日志 记录等级 LOG_LEVEL= 'DEBUG' LOG_FILE ='log.txt' 查看日志 发现报 2015-11 ...

最新文章

  1. FZU-Problem 2191 完美的数字
  2. OCR算法识别率怎么评估?
  3. 使用VS Code 从零开始开发并调试.NET Core 应用程序
  4. Vue.js 定义组件模板的七种方式
  5. 判断android图片是否硬解码(方法)
  6. Unity2020.1新功能探路:Profiler相关更新
  7. 练打字-测试看图说话(AD安装)
  8. 单元测试 : Googel test测试框架
  9. 【入门二】格式化输入/输出
  10. 如何将浮点数点左边的数每三位添加一个逗号,如12000000.11转化为『12,000,000.11』...
  11. Matlab常用函数表
  12. java 风能玫瑰图,施用java awt画风向玫瑰图及风能玫瑰图程序
  13. 电脑计算机稳定删除垃圾游戏,电脑卡怎么办简单步骤_如何清理电脑垃圾
  14. ChromeDriver版本(最新v2.45)与Chrome版本(最新v72)支持关系以及下载地址
  15. 2013年最火和最挣钱的IT职位
  16. 安装RabbitMQ出现Plugin configuration unchanged.问题
  17. 基于MATLAB的批量3度带高斯正算(LB--xy)
  18. Unity3D之挥动武器产生的剑痕特效
  19. 除了python人工智能还可以用哪些编程语言实现?
  20. B1030 (完美数列)

热门文章

  1. opencvsharp 使用knn 实现身份证号码识别
  2. 【转载】我们要做不完美的自己
  3. cnbloger: 范振勇, 虚拟机上安装centos8.0[(vmware-15-pro)]
  4. $.ajax传值方式
  5. 第七章 SQL聚合函数 LIST
  6. 五千买Android手机划算吗,啥时候买Android手机最划算?
  7. Starting From 0 Learning Python(The Fourth Day)
  8. _Linux (ipc命令)
  9. 日语五十音,电脑壁纸,手机壁纸自制纪念
  10. 读取豆瓣图书API并下载封面图片的Qt程序