爬取zol 网站图片,无法抓取.

在 setting.py 文件中 设置 日志 记录等级

LOG_LEVEL= 'DEBUG'

LOG_FILE ='log.txt'

查看日志 发现报

2015-11-07 14:43:43+0800 [meizitu] DEBUG: Filtered offsite request to 'bbs.zol.com.cn': <GET http://bbs.zol.com.cn/dcbbs/d14_134253.html>

这条日志记录有点奇怪 果断上网百度 ,找到答案

官方对这个的解释,是你要request的地址和allow_domain里面的冲突,从而被过滤掉。可以停用过滤功能。

yield Request(url, callback=self.parse_item, dont_filter=True)

转载地址‘https://blog.csdn.net/feifly329/article/details/49702063’

转载于:https://www.cnblogs.com/ittop/p/9317690.html

scrapy 爬网站 显示 Filtered offsite request to 错误.相关推荐

  1. scrapy 爬网站 显示 Filtered offsite request to 错误

    查看日志 发现报 2018-09-12 00:27:58 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ' ...

  2. scrapy 二次爬网站 显示 Filtered offsite request to 错误

    DEBUG: Filtered offsite request to 'movie.douban.com': <GET https://movie.douban.com/top250?start ...

  3. 用scrapy写爬虫 显示 Filtered offsite request to 错误.

    爬电源网公司信息,无法爬取. 查看控制台发现报如下错误: DEBUG: Filtered offsite request to 'product.dianyuan.com': 果断上网百度 ,找到答案 ...

  4. [scrapy] DEBUG: Filtered offsite request to

    [scrapy 常见问题整理] DEBUG: Filtered offsite request to 使用scrapy爬取豆瓣TOP250电影信息在进行自动翻页爬取的时候,出现了一个问题,解析自动翻页 ...

  5. python爬虫学习日记(1) scrapy爬取时,报错Filtered offsite request

    使用scrapy框架抓取某妹子图网时,只能抓取第一页,第二页报错 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request ...

  6. 2018-12-06 18:09:55 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'weixin.so

    2018-12-06 18:09:55 [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'weixin.so ...

  7. scrapy运行时提示DEBUG: Filtered offsite request to

    用scrapy爬取数据时,使用yield scrapy.Requeste()不能把数据传到下一个解析函数时,提示Filtered offsite request to [域名] 说明此时你请求的域名l ...

  8. 爬虫中遇到的问题Crawled (404),[scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to

    1.错误1:url地址有误 Crawled (200) <GET http://www.itcast.cn/robots.txt> (referer: None) DEBUG: Crawl ...

  9. [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ‘XXX‘

    一.问题描述 scrapy-redis中使用RedisCrawlSpider类爬虫,以Rule规则来匹配地址,运行爬虫时出现错误: [scrapy.spidermiddlewares.offsite] ...

最新文章

  1. AI从业者需要应用的10种深度学习方法
  2. Servlet+Tomcat制作出第一个运行在Tomcat上的Java应用程序
  3. 为什么德国制造让人那么放心
  4. Deep learning:十九(RBM简单理解)
  5. MySQL(四)字段及常用函数
  6. apt-get常用命令及工作原理
  7. 全连接层的作用是什么?
  8. 3月国内网民地域分布12强:广东居首 江苏重回第二
  9. [GO]冒泡排序的原理和代码实现
  10. (ICPR-2021)使用胶囊的多尺度部分表示变换的步态识别
  11. 名利双收的公益创业,“汇新杯”响应时代召唤助力公益创业
  12. 微信小程序:实现微信登录
  13. 1. 如何创建python环境
  14. jar包太大?手把手教你分析 Maven 依赖,完成瘦身优化!
  15. java mac转unix_管理Java类路径(UNIX和Mac OS X)
  16. 图像分割中CNN的简史:从R-CNN到Mask R-CNN
  17. 入手评测AMD锐龙r7 6800u和酷睿i7 1260p选哪个 r76800u和i71260p对比
  18. IEduChina2019国际教育展在北京完美落幕
  19. 11、git查看往日提交以及删除分支ID命令
  20. Flutter - 控件之 Picker

热门文章

  1. chatgpt赋能Python-python_plt_散点图
  2. 可能是目前最详细的游戏运维指南
  3. 用友U9C顾问安装教程
  4. MySQL timestampdiff()函数返回两个时间之间的差值
  5. 武汉长江大桥 (随便加点吧)
  6. 从游戏角度看后台开发
  7. python语言中关于素数的问题
  8. OpenStack Neutron安全组机制探索
  9. IC是否为当下风口,本科生能否入行
  10. C#自定义用户控件之分页