【Python3网络爬虫开发实战】1.3.1-lxml的安装
【摘要】lxml是Python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高。本节中,我们了解一下lxml的安装方式,这主要从Windows、Linux和Mac三大平台来介绍。
1. 相关链接
官方网站:http://lxml.de
GitHub:https://github.com/lxml/lxml
PyPI:https://pypi.python.org/pypi/lxml
2. Windows下的安装
在Windows下,可以先尝试利用pip安装,此时直接执行如下命令即可:
pip3 install lxml
如果没有任何报错,则证明安装成功。
如果出现报错,比如提示缺少libxml2库等信息,可以采用wheel方式安装。
推荐直接到这里(链接为:http://www.lfd.uci.edu/~gohlke/pythonlibs/#lxml)下载对应的wheel文件,找到本地安装Python版本和系统对应的lxml版本,例如Windows 64位、Python 3.6,就选择lxml‑3.8.0‑cp36‑cp36m‑win_amd64.whl,将其下载到本地。
然后利用pip安装即可,命令如下:
pip3 install lxml‑3.8.0‑cp36‑cp36m‑win_amd64.whl
这样我们就可以成功安装lxml了。
3. Linux下的安装
在Linux平台下安装问题不大,同样可以先尝试pip安装,命令如下:
pip3 install lxml
如果报错,可以尝试下面的解决方案。
CentOS、Red Hat
对于此类系统,报错主要是因为缺少必要的库。
执行如下命令安装所需的库即可:
sudo yum groupinstall -y development tools
sudo yum install -y epel-release libxslt-devel libxml2-devel openssl-devel
主要是libxslt-devel和libxml2-devel这两个库,lxml依赖它们。安装好之后,重新尝试pip安装即可。
Ubuntu、Debian和Deepin
在这些系统下,报错的原因同样可能是缺少了必要的类库,执行如下命令安装:
sudo apt-get install -y python3-dev build-essential libssl-dev libffi-dev libxml2 libxml2-dev libxslt1-dev
zlib1g-dev
安装好之后,重新尝试pip安装即可。
4. Mac下的安装
在Mac平台下,仍然可以首先尝试pip安装,命令如下:
pip3 install lxml
如果产生错误,可以执行如下命令将必要的类库安装:
xcode-select --install
之后再重新尝试pip安装,就没有问题了。
lxml是一个非常重要的库,后面的Beautiful Soup、Scrapy框架都需要用到此库,所以请一定安装成功。
5. 验证安装
安装完成之后,可以在Python命令行下测试:
$ python3
>>> import lxml
如果没有错误报出,则证明库已经安装好了。
来源:华为云社区 作者:崔庆才丨静觅
【Python3网络爬虫开发实战】1.3.1-lxml的安装相关推荐
- 【Python3网络爬虫开发实战】1.3.4-tesserocr的安装
在爬虫过程中,难免会遇到各种各样的验证码,而大多数验证码还是图形验证码,这时候我们可以直接用OCR来识别. 1. OCR OCR,即Optical Character Recognition,光学字符 ...
- 【Python3网络爬虫开发实战】1.7.3-Appium的安装
[摘要] Appium是移动端的自动化测试工具,类似于前面所说的Selenium,利用它可以驱动Android.iOS等设备完成自动化测试,比如模拟点击.滑动.输入等操作,其官方网站为:http:// ...
- 【Python3网络爬虫开发实战】 1.7.1-Charles的安装
[摘要] Charles是一个网络抓包工具,相比Fiddler,其功能更为强大,而且跨平台支持得更好,所以这里选用它来作为主要的移动端抓包工具. 1. 相关链接 官方网站:https://www.ch ...
- 【Python3网络爬虫开发实战】1.5.3-redis-py的安装
[摘要] 对于Redis来说,我们要使用redis-py库来与其交互,这里就来介绍一下它的安装方法. 1. 相关链接 GitHub:https://github.com/andymccurdy/red ...
- 【Python3网络爬虫开发实战】1.5.2-PyMongo的安装
[摘要] 在Python中,如果想要和MongoDB进行交互,就需要借助于PyMongo库,这里就来了解一下它的安装方法. 1. 相关链接 GitHub:https://github.com/mong ...
- 【Python3网络爬虫开发实战】1.5.1-PyMySQL的安装
[摘要] 在Python 3中,如果想要将数据存储到MySQL中,就需要借助PyMySQL来操作,本节中我们介绍一下它的安装方式. 1. 相关链接 GitHub:https://github.com/ ...
- 【Python3网络爬虫开发实战】1.3.3-pyquery的安装
pyquery同样是一个强大的网页解析工具,它提供了和jQuery类似的语法来解析HTML文档,支持CSS选择器,使用非常方便.本节中,我们就来了解一下它的安装方式. 1. 相关链接 GitHub:h ...
- 【Python3网络爬虫开发实战】1.2.6-aiohttp的安装
[摘要]之前介绍的Requests库是一个阻塞式HTTP请求库,当我们发出一个请求后,程序会一直等待服务器响应,直到得到响应后,程序才会进行下一步处理.其实,这个过程比较耗费资源.如果程序可以在这个等 ...
- 【Python3网络爬虫开发实战】 1.2.2-Selenium的安装
[摘要]Selenium是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击.下拉等操作.对于一些JavaScript渲染的页面来说,这种抓取方式非常有效.下面我们来看看Seleniu ...
最新文章
- 8.3 TensorFlow BP神经网络构建与超参数的选取
- OpenGL剪切平面和双面渲染
- 深度学习之图像处理---七级浮屠
- ubuntu下安装vmtools失败,提示The path is not a valid path to the 3.5.0-17-generic kernel headers的解决办法...
- 学计算机的心理300字,心理的作文300字7篇
- sata接口 图解 定义_硬盘有几个接口 硬盘不同接口介绍【详解】
- FlexSPI对写时序支持
- FileSystemObject操作文件的权限问题
- mysql5.6主从复制与基于amoeba实现读写分离
- Python:详解format格式化函数
- MongoDB——聚合管道之$limit$skip$sort操作
- 重庆邮电大学计算机学院蓝桥杯,第七届蓝桥杯大赛个人赛(软件类)-重庆赛区获奖名单...
- git pull报错Pulling is not possible because you have unmerged files
- 宝塔面板自定义404错误页面的设置方法
- api es7 删除所有数据_【译】ECMAScript 2016 (ES7) 新特性一览
- 申请阿里云的免费SSL证书,实现小程序HTTPS请求
- 赛门铁克Symantec通配型SSL证书(Symantec Secure Site Wildcard SSL Certificates)
- 大学计算机应用基础与计算思维,计算思维在二本院校计算机应用基础课程中应用.doc...
- MacbookPro电脑Hosts文件位置在哪里修改
- 常见的麦克风供电方式总结(幻象供电)
热门文章
- docker 解决php 502,Docker里两个php容器一个正常访问,一个出现502 Bad Gateway nginx/1.17.8。...
- java 正则提取大于等于号_Java正则表达式
- java写的教育管理的项目_干货分享|推荐12款适合做Java后台管理系统的项目
- spring催办业务_业务后台系统之流程设计
- python java混合编程_详解java调用python的几种用法(看这篇就够了)
- 修改npm安装的全局路径和配置环境变量的坑
- CodeForces-748D 贪心
- Css3 display用法
- shell更改目录编码
- mac brew安装mysql