extract()extact_first()都是提取Selectordata部分。但现在你要先知道什么是Selector
Selector是选择器的意思。具体定义我不知道,但通过下面的例子,你就可以知道选择器是个什么东东。首先看一段代码:

<head><meta charset="UTF-8"><title>Quotes to Scrape</title>
</head>

这里,你还要知道response是什么:它是scrapy.Request返回的一个 TextResponse的实例,以参数形式传递给回调函数。上面的代码便是response.text中的一部分.关于response.text的全部内容可以点击这个网站,调出开发者工具查看。
安装好scrapy后,在cmd下输入scrapy shell "http://quotes.toscrape.com/page/1/",然后再输入 response.css('title')便可以看到:

    [<Selector xpath='descendant-or-self::title' data='<title>Quotes to Scrape</title>'>]

这便是选择器
再看一下下图:

图中,我们可以看到,extract()extact_first()都是提取Selectordata部分。但是extact_first()多做了一步,就是将提取的内容从列表里拿出来。红色框里已经画了出来。
还有便是extact_first()可以在找不到元素的情况下,避免IndexError和返回none.

转载于:https://www.cnblogs.com/busui/p/7209560.html

extract()和extact_first()的区别相关推荐

  1. python中get和getall_Scrapy框架get() 、getall() 、extract() 、extract_first()的区别

    官方解释说明 extract() and extract_first() If you're a long-time Scrapy user, you're probably familiar wit ...

  2. 【BERT-多标签文本分类实战】之二——BERT的地位与名词术语解释

    ·请参考本系列目录:[BERT-多标签文本分类实战]之一--实战项目总览 ·下载本实战项目资源:>=点击此处=< [注]本篇将从宏观上介绍bert的产生和在众多模型中的地位,以及与bert ...

  3. bs4 删除clear、decompose、extract的区别

    1. clear 清除标签内的内容(包括子标签和文本) html = "<html><body><p><a></a></p& ...

  4. [转]SQLServer和Oracle,存储过程区别,常用函数对比

    本文转自:http://www.cnblogs.com/neru/archive/2011/08/18/2144049.html 以前一直用sqlserver,只有很少的一点oracle的经验,现在要 ...

  5. String.slice和String.substring有什么区别?

    本文翻译自:What is the difference between String.slice and String.substring? Does anyone know what the di ...

  6. 窥探try ... catch与__try ... __except的区别

    VC中的这两个东西肯定谁都用过, 不过它们之间有什么区别, 正好有时间研究了一下, 如果有错误欢迎拍砖. 基于VC2005, 32位XP 平台测试通过. 估计对于其他版本的VC和操作系统是不通用的. ...

  7. MySQL与SQLServer的区别(一千条语句)

    ER图.分页.差异.Java连接MySQL SELECT * FROM table LIMIT [offset,] rows | rows OFFSET offset LIMIT 子句可以被用于强制 ...

  8. php中register_global,PHP安全之register_globals的on和off的区别

    一.register_globals=Off和register_globals=On的区别 register_globals是php.ini里的一个配置,这个配置影响到php如何接收传递过来的参数. ...

  9. Pandas文本处理双雄extract+extractall

    公众号:尤而小屋 作者:Peter 编辑:Peter 今天给大家介绍两个Pandas中处理文本数据的函数,主要功能是从文本内容中提取想要的信息:extract + extractall 建议:如果你有 ...

最新文章

  1. C6678-SRIO和Virtex6-FPGA
  2. Android项目Tab类型主界面大总结 Fragment+TabPageIndicator+ViewPager
  3. rust(65)-rust常用指针
  4. Java中sum和Sum相同吗,Java认为变量Sum 和sum相同。
  5. P6047-丝之割【斜率优化,dp】
  6. Profibus-DP光端机产品功能特点及技术参数详解
  7. MVC3 学习总结一(未发布)
  8. L2-018 多项式A除以B (25分)
  9. 近期CDRX4正常使用中突然提示盗版弹窗您的产品已被禁用永久解决教程
  10. Amine-PEG-Pyrene,芘丁酸聚乙二醇氨基,Pyrene-PEG-NH2
  11. 风变编程-python(基础语法-第1关)
  12. PostScript语言里的珠玑
  13. 2021-06-13
  14. linux 日志报警,linux日志报警怎么解决
  15. 两个女孩全程不带现金,只付加密货币几乎游遍大半个国家是一种什么体验?...
  16. 简单电话簿管理系统(C语言)
  17. 台灯显色指数多少合适?专家教你护眼灯怎么选
  18. 为什么使用双亲委派机制以及如何破坏双亲委派
  19. 最炫丽的网页平面UI课程就在广州传智播客
  20. Linux根目录文件系统变为Read Only解决方案

热门文章

  1. JZ32变形~剑指 Offer 32 - II. 从上到下打印二叉树 II
  2. ZooKeeper官方文档学习笔记01-zookeeper概述
  3. 如何用绩效考核搞垮一个团队?
  4. 深化管理、提升IT的数据平台建设方案
  5. Flex移动性能检查列表
  6. pool win10提示bad_快速解决Win10出现Bad pool caller蓝屏故障的技巧
  7. python写xml文件_python写入xml文件的方法
  8. java实现蛇形输出,Java 输入一个正整数,按蛇形打印。
  9. openwrt+php+not+found,openwrt路由翻车,等高手
  10. php 没有权限,PHP出现操作文件没有权限怎么办?