extract()和extact_first()的区别
extract()和extact_first()都是提取Selector
的data
部分。但现在你要先知道什么是Selector
。
Selector是选择器的意思。具体定义我不知道,但通过下面的例子,你就可以知道选择器是个什么东东。首先看一段代码:
<head><meta charset="UTF-8"><title>Quotes to Scrape</title>
</head>
这里,你还要知道response是什么:它是scrapy.Request
返回的一个 TextResponse的实例,以参数形式传递给回调函数。上面的代码便是response.text
中的一部分.关于response.text的全部内容可以点击这个网站,调出开发者工具查看。
安装好scrapy
后,在cmd下输入scrapy shell "http://quotes.toscrape.com/page/1/"
,然后再输入 response.css('title')
便可以看到:
[<Selector xpath='descendant-or-self::title' data='<title>Quotes to Scrape</title>'>]
这便是选择器。
再看一下下图:
图中,我们可以看到,extract()和extact_first()都是提取Selector
的data
部分。但是extact_first()多做了一步,就是将提取的内容从列表里拿出来。红色框里已经画了出来。
还有便是extact_first()可以在找不到元素的情况下,避免IndexError
和返回none
.
转载于:https://www.cnblogs.com/busui/p/7209560.html
extract()和extact_first()的区别相关推荐
- python中get和getall_Scrapy框架get() 、getall() 、extract() 、extract_first()的区别
官方解释说明 extract() and extract_first() If you're a long-time Scrapy user, you're probably familiar wit ...
- 【BERT-多标签文本分类实战】之二——BERT的地位与名词术语解释
·请参考本系列目录:[BERT-多标签文本分类实战]之一--实战项目总览 ·下载本实战项目资源:>=点击此处=< [注]本篇将从宏观上介绍bert的产生和在众多模型中的地位,以及与bert ...
- bs4 删除clear、decompose、extract的区别
1. clear 清除标签内的内容(包括子标签和文本) html = "<html><body><p><a></a></p& ...
- [转]SQLServer和Oracle,存储过程区别,常用函数对比
本文转自:http://www.cnblogs.com/neru/archive/2011/08/18/2144049.html 以前一直用sqlserver,只有很少的一点oracle的经验,现在要 ...
- String.slice和String.substring有什么区别?
本文翻译自:What is the difference between String.slice and String.substring? Does anyone know what the di ...
- 窥探try ... catch与__try ... __except的区别
VC中的这两个东西肯定谁都用过, 不过它们之间有什么区别, 正好有时间研究了一下, 如果有错误欢迎拍砖. 基于VC2005, 32位XP 平台测试通过. 估计对于其他版本的VC和操作系统是不通用的. ...
- MySQL与SQLServer的区别(一千条语句)
ER图.分页.差异.Java连接MySQL SELECT * FROM table LIMIT [offset,] rows | rows OFFSET offset LIMIT 子句可以被用于强制 ...
- php中register_global,PHP安全之register_globals的on和off的区别
一.register_globals=Off和register_globals=On的区别 register_globals是php.ini里的一个配置,这个配置影响到php如何接收传递过来的参数. ...
- Pandas文本处理双雄extract+extractall
公众号:尤而小屋 作者:Peter 编辑:Peter 今天给大家介绍两个Pandas中处理文本数据的函数,主要功能是从文本内容中提取想要的信息:extract + extractall 建议:如果你有 ...
最新文章
- C6678-SRIO和Virtex6-FPGA
- Android项目Tab类型主界面大总结 Fragment+TabPageIndicator+ViewPager
- rust(65)-rust常用指针
- Java中sum和Sum相同吗,Java认为变量Sum 和sum相同。
- P6047-丝之割【斜率优化,dp】
- Profibus-DP光端机产品功能特点及技术参数详解
- MVC3 学习总结一(未发布)
- L2-018 多项式A除以B (25分)
- 近期CDRX4正常使用中突然提示盗版弹窗您的产品已被禁用永久解决教程
- Amine-PEG-Pyrene,芘丁酸聚乙二醇氨基,Pyrene-PEG-NH2
- 风变编程-python(基础语法-第1关)
- PostScript语言里的珠玑
- 2021-06-13
- linux 日志报警,linux日志报警怎么解决
- 两个女孩全程不带现金,只付加密货币几乎游遍大半个国家是一种什么体验?...
- 简单电话簿管理系统(C语言)
- 台灯显色指数多少合适?专家教你护眼灯怎么选
- 为什么使用双亲委派机制以及如何破坏双亲委派
- 最炫丽的网页平面UI课程就在广州传智播客
- Linux根目录文件系统变为Read Only解决方案
热门文章
- JZ32变形~剑指 Offer 32 - II. 从上到下打印二叉树 II
- ZooKeeper官方文档学习笔记01-zookeeper概述
- 如何用绩效考核搞垮一个团队?
- 深化管理、提升IT的数据平台建设方案
- Flex移动性能检查列表
- pool win10提示bad_快速解决Win10出现Bad pool caller蓝屏故障的技巧
- python写xml文件_python写入xml文件的方法
- java实现蛇形输出,Java 输入一个正整数,按蛇形打印。
- openwrt+php+not+found,openwrt路由翻车,等高手
- php 没有权限,PHP出现操作文件没有权限怎么办?