最近在爬虫中使用xpath的时候,发现了extract这个方法
我们今天就来说说 xpath.extract 叭

extract 的用法

  1. 不加extract时,返回一个SelectorList 对象
    这里没有用 extract 时,是这样的
    (文末附有 SelectorList 的一些信息)

  2. 使用extract() ,返回一个列表,里面是提取的内容
    然后,我们使用 extract()。 可读性是不是好多了呢~

    后面加 [0] ,即extract[0] ,就是列表操作啦
    返回1中list的第一个元素(如果list为空抛出异常)

  3. 在extract 前面加 [0]. ,即 [0].extract() 跟上面在后面加是一样的
    返回2中SelectorList里的第一个元素(如果list为空抛出异常)

  4. 前后都加的话,即 [0].extract()[0]
    就是对列表中第一项的操作了,返回第一项的第一个字符

SelectorList

SelectorList官方文件

xpath.extract() 的使用相关推荐

  1. 爬虫文档学习 xpath bs4 selenium scrapy...

    爬虫 一.介绍 1.什么是爬虫 1.1 爬虫(Spider)的概念 爬虫用于爬取数据, 又称之为数据采集程序. 爬取的数据来源于网络,网络中的数据可以是由Web服务器(Nginx/Apache).数据 ...

  2. scrapy中response的方法

    response.css('').xpath() response.xpath('').extract() response.xpath().re('') response.css().extract ...

  3. python语言简介-Python语言介绍

    原标题:Python语言介绍 Python简介 Python 是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其 ...

  4. python的scrapy爬虫模块间进行传参_Python | Scrapy 爬虫过程问题解决(持续更新...)...

    1.使用python的re模块过滤html标签 In [1]: response.xpath("//div[@class='zx-dis_content']/p").extract ...

  5. python爬虫企业级技术点_Python爬虫必备技术点(二)

    Python爬虫必备技术点[续] 一.非爬虫框架 1.1 爬虫的认知 数据请求(网络请求库) 数据解析(re/xpath/bs4) 数据存储(csv/pymysql/json??) 反反爬的策略 ip ...

  6. Scrapy框架的学习(7. 了解Scrapy中的debug信息以及Scrapy shell的使用)

    认识程序中的debug信息 https://blog.csdn.net/wei18791957243/article/details/86157707  这个博客里写了,怎么关闭这些debug信息 因 ...

  7. Scrapy将爬取的段落整合为字符串

    使用Scrapy框架爬取文章的时候,经常会遇到要爬取多个段落的问题,如果这个时候使用的是: text = response.xpath("......").extract() 那么 ...

  8. 两周从爬虫小白变大神,看完你就知道我不是标题党了【五万字教程,建议收藏】

    大家好,我是辣条,今天给大家带来最硬核的爬虫教程. 目录 Python爬虫第一天 什么是爬虫 爬虫与Web后端服务之间的关系 Python爬虫技术的相关库 常见反爬虫的策略 爬虫库urllib[重要] ...

  9. python爬取天猫_Python如何抓取天猫商品详细信息及交易记录

    本文实例为大家分享了Python抓取天猫商品详细信息及交易记录的具体代码,供大家参考,具体内容如下 一.搭建Python环境 本帖使用的是Python 2.7 涉及到的模块:spynner, scra ...

最新文章

  1. Redis 缓存穿透、雪崩、缓存数据库不一致、持久化方式、分布式锁、过期策略
  2. 程序员因拒绝带电脑回家被开除,获赔 19.4 万元
  3. 输入输出 scanf和*修饰符
  4. android handle显示加载框
  5. 初识Entity Framework CodeFirst(2)
  6. airpods2怎么查正品 ios11系统_拼多多AirPods2开箱评测,4种办法教你验真假,10个AirPods技巧教你玩...
  7. spark算子大全glom_(七)Spark Streaming 算子梳理 — repartition算子
  8. easyui java管理系统_EasyUI 后台管理系统
  9. python死锁案例_Python 多线程死锁
  10. UltraEdit 25注册机及免费破解注册教程(附带工具)
  11. 计算机毕设选题可以选什么?计算机本科毕业设计选题2023年指南
  12. 技术原理丨超高精准度IP地址定位这样实现
  13. 什么是ISCSI?ISCSI又能干什么呢?
  14. 老台式电脑怎么连热点_台式电脑怎样连接wifi热点,教你一招快速连接
  15. Blockchains Distributed L week3 爱宝授课记录(2)
  16. 亚马逊运营知识:ASIN文案编写技巧
  17. 怎么把m4a转换成mp3,分享几个方法给大家!
  18. linux学习笔记之lvm管理
  19. vue时间天气插件_基于vue.js 2.0的百度天气应用 – vue-weather
  20. 升级Win11后Office无法验证此产品的许可证怎么办?

热门文章

  1. 传统管理软件已死 智能+时代将如何“浴火重生”?
  2. windows 批处理文件
  3. 【新手学习】Excel操作指南 之一
  4. ZK zul中显示纯的HTML代码
  5. orientdb实战
  6. FME的ESRI Geodatabase (MDB)格式介绍(一)
  7. 关于树莓派编译及运行Snowboy的详细教程。
  8. 基于matlab的ofdm系统仿真及性能分析,基于MATLAB的OFDM系统性能仿真
  9. 记录-小程序720°VR(跳转H5页面实现)
  10. Flask之钩子函数