2018-12-06 18:09:55 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ‘weixin.sogou.com’: <GET http://weixin.sogou.com/weixin?query=python&sug_type
=&s_from=input&sug=n&type=2&page=2&ie=utf8>

在爬取搜狗微信文章时报错如上所示

DEBUG: Filtered offsite request to 'weixin.sogou.com’
Request中请求的 URL 和 allowed_domains 中定义的域名冲突,所以将Request中请求的URL过滤掉了,无法请求


在 Request 请求参数中,设置 dont_filter = True ,Request 中请求的 URL 将不通过 allowed_domains 过滤。

问题就解决了~

问题参照 PythonMaO:https://www.jianshu.com/p/c31e53fd45f6

2018-12-06 18:09:55 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'weixin.so相关推荐

  1. 爬虫中遇到的问题Crawled (404),[scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to

    1.错误1:url地址有误 Crawled (200) <GET http://www.itcast.cn/robots.txt> (referer: None) DEBUG: Crawl ...

  2. [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ‘XXX‘

    一.问题描述 scrapy-redis中使用RedisCrawlSpider类爬虫,以Rule规则来匹配地址,运行爬虫时出现错误: [scrapy.spidermiddlewares.offsite] ...

  3. [scrapy] DEBUG: Filtered offsite request to

    [scrapy 常见问题整理] DEBUG: Filtered offsite request to 使用scrapy爬取豆瓣TOP250电影信息在进行自动翻页爬取的时候,出现了一个问题,解析自动翻页 ...

  4. scrapy 爬网站 显示 Filtered offsite request to 错误

    查看日志 发现报 2018-09-12 00:27:58 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ' ...

  5. scrapy运行时提示DEBUG: Filtered offsite request to

    用scrapy爬取数据时,使用yield scrapy.Requeste()不能把数据传到下一个解析函数时,提示Filtered offsite request to [域名] 说明此时你请求的域名l ...

  6. 2018.12.06 课后习题作业

    课后习题作业 1.编写一个简单程序,要求数组长度为5,分别赋值10,20,30,40,50, 在控制台输出该数组的值.(知识点:数组定义和创建.一维数组初始化 package javaemo2;imp ...

  7. 2018/12/06 eclipse 快速加载需要的包

    Windows: ctrl+shift+o macOS: cmmand+shift+o 转载于:https://www.cnblogs.com/huangZ-H/p/10078930.html

  8. 用scrapy写爬虫 显示 Filtered offsite request to 错误.

    爬电源网公司信息,无法爬取. 查看控制台发现报如下错误: DEBUG: Filtered offsite request to 'product.dianyuan.com': 果断上网百度 ,找到答案 ...

  9. scrapy 爬网站 显示 Filtered offsite request to 错误.

    爬取zol 网站图片,无法抓取. 在 setting.py 文件中 设置 日志 记录等级 LOG_LEVEL= 'DEBUG' LOG_FILE ='log.txt' 查看日志 发现报 2015-11 ...

最新文章

  1. 监控、链路追踪、日志这三者有何区别?
  2. xnawindowsph又见“X”Phone ePhone手机V90新鲜评测
  3. 我所不知道的Web 前台设计
  4. 苹果平板怎么卸载软件_苹果TF签名丨怎么卸载testflight下载的应用?
  5. mysql 索引 lt =_MySQL索引相关
  6. matlab实现cnn代码,CNN 经典的卷积神经网络MATLAB实现源码,可直接运行。 276万源代码下载- www.pudn.com...
  7. 笔记本cpu温度高怎么办_夏天面团温度高怎么办?几个技巧让面温立马降下来
  8. vue之ele组件中的select下拉 绑定对象值
  9. hurst指数matlab,hurst指数matlab
  10. 前端验证码与后端验证码
  11. 关系数据模型、基本概念、关系模型的基本术语、关系代数
  12. [系统工具]VMware Workstation 10.0 官方中文版 (附注册机/序列号)
  13. java 图片合成_java 将两张相片合成一张,开发实用类
  14. 【neotic-moveit】CHOMP Planner
  15. 百度指数的价值以及分析的意义
  16. Android多渠道打包配置
  17. 《Java基础入门第2版》--黑马程序员 课后答案及其详解 第6章 集合
  18. Python全栈开发零基础学习通关秘籍:2018新手入门指南
  19. [Classic AUTOSAR学习] DLT模块(LogTrace)
  20. 计算机游戏配机方案,主流电脑装机方案,日常娱乐游戏流畅不卡顿,小白装机可以参考...

热门文章

  1. tgp饥荒搭建服务器证书,饥荒tgp搭建服务器证书不存在怎么办 联机服务器证书不存在解决...
  2. AWS MVC 详解
  3. 七夕情人节—计算机情书
  4. Jenkins API之读取日志
  5. 掌握这几种OPPO手机拍照方式,让你在人群中脱颖而出
  6. php根据ajax传值跳转页面_thinkphp实现简单的ajax传值
  7. 因果推断学习——人工智能前沿讲习资料整理
  8. 日语五十音,电脑壁纸,手机壁纸自制纪念
  9. 想要转行软件测试就得先搞清测试工程师的职责是什么?
  10. 计算机教师评语中职,中职计算机专业学生评语-20210614110723.doc-原创力文档