1. 安装 pip install lxml

2. 官方文档 http://lxml.de/

3. 常用类 - Element

  • 将request.get()返回的html转换为Element
from lxml import etreeres = requests.get('http://www.test.com/1.html')
page = res.text
etree_source = etree.HTML(page) #返回Element类,直接打印为<Element html at 0x255a3437648>

4. 常用方法

  • Element.xpath()

    • 返回Element类
    • 可以精确定位到想要的node
    • 如果匹配多个,可以循环
    • 如果要获取这个element下,不管多少层的child node内的text,可以用Element.xpaht(string(.))
    • 可以直接获取attribute,如Element.xpath('//a/@href')
  • Element.findall()
    • 返回Elemenet类
    • 能匹配到所有满足的路径
    • 如果匹配多个,可以循环
    • 不能直接获取attribute,如Element.xpath('//a/@href')

转载于:https://www.cnblogs.com/break-dawnn/p/9039006.html

[python3 - package] lxml相关推荐

  1. 【Chocolatey】安装python3

    目录 前言 准备 安装python3 编写 python 程序 Helloworld 前言 win10 Chocolatey : 0.10.15 准备 安装Chocolatey.参考这里. 查找pyt ...

  2. Python 中 xpath 语法 与 lxml 库解析 HTML/XML 和 CSS Selector

    The lxml.etree Tutorial :https://lxml.de/tutorial.html python3 解析 xml:https://www.cnblogs.com/deadwo ...

  3. 【Python3网络爬虫开发实战】1.3.1-lxml的安装

    [摘要]lxml是Python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高.本节中,我们了解一下lxml的安装方式,这主要从Windows.Linux和Mac三 ...

  4. 已解决Building wheels for collected packages: lxml

    已解决(pip安装第三方模块lxml模块报错)Building wheels for collected packages: lxml Building wheel for lxml (setup.p ...

  5. 已解决note: This is an issue with the package mentioned above,not pip.

    已解决(pip安装第三方模块lxml模块报错)Building wheels for collected packages: lxml Building wheel for lxml (setup.p ...

  6. Pycharm安装pycurl

    前言 学习和使用python过程中,pycharm是一款非常好用的解释器.能够非常便利快捷地安装我们想要使用的库.之前写的一篇博文中介绍了一种安装方式.但是最近,我想在pycharm上安装pycurl ...

  7. 小白请上车 | Python抓取花瓣网高清美图

    一:前言 嘀嘀嘀,上车请刷卡.昨天看到了不错的图片分享网-- 花瓣 ,里面的图片质量还不错,所以利用selenium+xpath我把它的妹子的栏目下爬取了下来,以图片栏目名称给文件夹命名分类保存到电脑 ...

  8. python etree htm参数_python笔记1--lxml.etree解析html

    前言 lxml是一种使用Python编写的库,可以迅速.灵活地处理XML和HTML,学过xpath定位的,可以立马上手 使用环境: python3.7 lxml 4.3.3 lxml安装 pip in ...

  9. 云炬WEB开发教程2-2 node.js和npm介绍和安装

    一.node.js是什么?有什么用? 1.概述: a).Node.js是基于Chrome JavaScript运行时建立的一个平台,实际上它是对Google Chrome V8引擎进行了封装,它主要用 ...

  10. 在 Windows 下部署 Go 语言环境

    http://bbs.chinaunix.net/thread-4088281-1-1.html 1. 首先下载官方二进制安装包: 32 位选择 windows-386.msi 64 位选择 wind ...

最新文章

  1. Python Socket编程基础篇
  2. 正则表达的式的基本功能
  3. central maven_一键发布到Maven Central的方法
  4. 教你使用Vue.js的DevTools来调试你的vue项目
  5. 写给那些远程办公程序员的建议!
  6. oracle 转储 mysql_Oracle中DUMP的转储方法
  7. NeHe OpenGL第四十四课:3D光晕
  8. 算法分析中的空间复杂度
  9. 3.微服务设计 --- 如何建模服务
  10. Tekla插件(材料备料定尺工具)
  11. IP Scanner Pro for Mac 4.05 局域网IP扫描工具
  12. 华为VLAN隔离配置
  13. 嗅探器c语言源码,自己做的嗅探器
  14. excel如何显示多个独立窗口
  15. # unity shader 后期轮廓(更新中)
  16. 因果系列文章(3)——有向无环图
  17. 两步教你轻松写出时事热点型软文营销文案
  18. 没睡够,周末补觉好不好
  19. 微信公众号内置地图开发ios苹果不显示地图
  20. 宋鹏:微媒体联盟微信营销成功案例

热门文章

  1. extended-insert对mysqldump及导入性能的影响
  2. java Http post请求发送json字符串
  3. [实战]MVC5+EF6+MySql企业网盘实战(20)——Bootstrap Paginator
  4. sun cluster 3.3 +oracle 10g R2 RAC with ASM on solaris 10 U9
  5. CLISP语言中的哈希表
  6. ubuntu ftp server配置
  7. [SQl读书笔记]§6.Transact-SQL(4)
  8. MySQL 是怎么死锁的?
  9. 本以为用的MyBatis框架就万无一失了,没想到还是被黑客注入了,我真的无语了!...
  10. 记得收藏这12个爆款 Java 开源项目!【附源码】