【摘要】lxml是Python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。本节中,我们了解一下lxml的安装方式,这主要从Windows、Linux和Mac三大平台来介绍。

1. 相关链接

  • 官方网站:http://lxml.de

  • GitHub:https://github.com/lxml/lxml

  • PyPI:https://pypi.python.org/pypi/lxml

2. Windows下的安装

在Windows下,可以先尝试利用pip安装,此时直接执行如下命令即可:

pip3 install lxml

如果没有任何报错,则证明安装成功。

如果出现报错,比如提示缺少libxml2库等信息,可以采用wheel方式安装。

推荐直接到这里(链接为:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)下载对应的wheel文件,找到本地安装Python版本和系统对应的lxml版本,例如Windows 64位、Python 3.6,就选择lxml‑3.8.0‑cp36‑cp36m‑win_amd64.whl,将其下载到本地。

然后利用pip安装即可,命令如下:

pip3 install lxml‑3.8.0‑cp36‑cp36m‑win_amd64.whl

这样我们就可以成功安装lxml了。

3. Linux下的安装

在Linux平台下安装问题不大,同样可以先尝试pip安装,命令如下:

pip3 install lxml

如果报错,可以尝试下面的解决方案。

CentOS、Red Hat

对于此类系统,报错主要是因为缺少必要的库。

执行如下命令安装所需的库即可:

sudo yum groupinstall -y development tools
sudo yum install -y epel-release libxslt-devel libxml2-devel openssl-devel

主要是libxslt-devel和libxml2-devel这两个库,lxml依赖它们。安装好之后,重新尝试pip安装即可。

Ubuntu、Debian和Deepin

在这些系统下,报错的原因同样可能是缺少了必要的类库,执行如下命令安装:

sudo apt-get install -y python3-dev build-essential libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev
zlib1g-dev

安装好之后,重新尝试pip安装即可。

4. Mac下的安装

在Mac平台下,仍然可以首先尝试pip安装,命令如下:

pip3 install lxml

如果产生错误,可以执行如下命令将必要的类库安装:

xcode-select --install

之后再重新尝试pip安装,就没有问题了。

lxml是一个非常重要的库,后面的Beautiful Soup、Scrapy框架都需要用到此库,所以请一定安装成功。

5. 验证安装

安装完成之后,可以在Python命令行下测试:

$ python3
>>> import lxml

如果没有错误报出,则证明库已经安装好了。

来源:华为云社区  作者:崔庆才丨静觅

【Python3网络爬虫开发实战】1.3.1-lxml的安装相关推荐

  1. 【Python3网络爬虫开发实战】1.3.4-tesserocr的安装

    在爬虫过程中,难免会遇到各种各样的验证码,而大多数验证码还是图形验证码,这时候我们可以直接用OCR来识别. 1. OCR OCR,即Optical Character Recognition,光学字符 ...

  2. 【Python3网络爬虫开发实战】1.7.3-Appium的安装

    [摘要] Appium是移动端的自动化测试工具,类似于前面所说的Selenium,利用它可以驱动Android.iOS等设备完成自动化测试,比如模拟点击.滑动.输入等操作,其官方网站为:http:// ...

  3. 【Python3网络爬虫开发实战】 1.7.1-Charles的安装

    [摘要] Charles是一个网络抓包工具,相比Fiddler,其功能更为强大,而且跨平台支持得更好,所以这里选用它来作为主要的移动端抓包工具. 1. 相关链接 官方网站:https://www.ch ...

  4. 【Python3网络爬虫开发实战】1.5.3-redis-py的安装

    [摘要] 对于Redis来说,我们要使用redis-py库来与其交互,这里就来介绍一下它的安装方法. 1. 相关链接 GitHub:https://github.com/andymccurdy/red ...

  5. 【Python3网络爬虫开发实战】1.5.2-PyMongo的安装

    [摘要] 在Python中,如果想要和MongoDB进行交互,就需要借助于PyMongo库,这里就来了解一下它的安装方法. 1. 相关链接 GitHub:https://github.com/mong ...

  6. 【Python3网络爬虫开发实战】1.5.1-PyMySQL的安装

    [摘要] 在Python 3中,如果想要将数据存储到MySQL中,就需要借助PyMySQL来操作,本节中我们介绍一下它的安装方式. 1. 相关链接 GitHub:https://github.com/ ...

  7. 【Python3网络爬虫开发实战】1.3.3-pyquery的安装

    pyquery同样是一个强大的网页解析工具,它提供了和jQuery类似的语法来解析HTML文档,支持CSS选择器,使用非常方便.本节中,我们就来了解一下它的安装方式. 1. 相关链接 GitHub:h ...

  8. 【Python3网络爬虫开发实战】1.2.6-aiohttp的安装

    [摘要]之前介绍的Requests库是一个阻塞式HTTP请求库,当我们发出一个请求后,程序会一直等待服务器响应,直到得到响应后,程序才会进行下一步处理.其实,这个过程比较耗费资源.如果程序可以在这个等 ...

  9. 【Python3网络爬虫开发实战】 1.2.2-Selenium的安装

    [摘要]Selenium是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击.下拉等操作.对于一些JavaScript渲染的页面来说,这种抓取方式非常有效.下面我们来看看Seleniu ...

最新文章

  1. 8.3 TensorFlow BP神经网络构建与超参数的选取
  2. OpenGL剪切平面和双面渲染
  3. 深度学习之图像处理---七级浮屠
  4. ubuntu下安装vmtools失败,提示The path is not a valid path to the 3.5.0-17-generic kernel headers的解决办法...
  5. 学计算机的心理300字,心理的作文300字7篇
  6. sata接口 图解 定义_硬盘有几个接口 硬盘不同接口介绍【详解】
  7. FlexSPI对写时序支持
  8. FileSystemObject操作文件的权限问题
  9. mysql5.6主从复制与基于amoeba实现读写分离
  10. Python:详解format格式化函数
  11. MongoDB——聚合管道之$limit$skip$sort操作
  12. 重庆邮电大学计算机学院蓝桥杯,第七届蓝桥杯大赛个人赛(软件类)-重庆赛区获奖名单...
  13. git pull报错Pulling is not possible because you have unmerged files
  14. 宝塔面板自定义404错误页面的设置方法
  15. api es7 删除所有数据_【译】ECMAScript 2016 (ES7) 新特性一览
  16. 申请阿里云的免费SSL证书,实现小程序HTTPS请求
  17. 赛门铁克Symantec通配型SSL证书(Symantec Secure Site Wildcard SSL Certificates)
  18. 大学计算机应用基础与计算思维,计算思维在二本院校计算机应用基础课程中应用.doc...
  19. MacbookPro电脑Hosts文件位置在哪里修改
  20. 常见的麦克风供电方式总结(幻象供电)

热门文章

  1. docker 解决php 502,Docker里两个php容器一个正常访问,一个出现502 Bad Gateway nginx/1.17.8。...
  2. java 正则提取大于等于号_Java正则表达式
  3. java写的教育管理的项目_干货分享|推荐12款适合做Java后台管理系统的项目
  4. spring催办业务_业务后台系统之流程设计
  5. python java混合编程_详解java调用python的几种用法(看这篇就够了)
  6. 修改npm安装的全局路径和配置环境变量的坑
  7. CodeForces-748D 贪心
  8. Css3 display用法
  9. shell更改目录编码
  10. mac brew安装mysql