【Python3网络爬虫开发实战】 1.2.2-Selenium的安装
【摘要】Selenium是一个自动化测试工具,利用它我们可以驱动浏览器执行特定的动作,如点击、下拉等操作。对于一些JavaScript渲染的页面来说,这种抓取方式非常有效。下面我们来看看Selenium的安装过程。
1. 相关链接
官方网站:http://www.seleniumhq.org
GitHub:https://github.com/SeleniumHQ/selenium/tree/master/py
PyPI:https://pypi.python.org/pypi/selenium
官方文档:http://selenium-python.readthedocs.io
中文文档:http://selenium-python-zh.readthedocs.io
2. pip安装
这里推荐直接使用pip安装,执行如下命令即可:
pip3 install selenium
3. wheel安装
此外,也可以到PyPI下载对应的wheel文件进行安装(下载地址:https://pypi.python.org/pypi/selenium/#downloads),如最新版本为3.4.3,则下载selenium-3.4.3-py2.py3-none-any.whl即可。
然后进入wheel文件目录,使用pip安装:
pip3 install selenium-3.4.3-py2.py3-none-any.whl
4. 验证安装
进入Python命令行交互模式,导入Selenium包,如果没有报错,则证明安装成功:
12 $ python3>>> import selenium
但这样做还不够,因为我们还需要用浏览器(如Chrome、Firefox等)来配合Selenium工作。
后面我们会介绍Chrome、Firefox、PhantomJS三种浏览器的配置方式。有了浏览器,我们才可以配合Selenium进行页面的抓取。
来源:华为云社区 作者:崔庆才丨静觅
【Python3网络爬虫开发实战】 1.2.2-Selenium的安装相关推荐
- 【Python3网络爬虫开发实战】1.3.4-tesserocr的安装
在爬虫过程中,难免会遇到各种各样的验证码,而大多数验证码还是图形验证码,这时候我们可以直接用OCR来识别. 1. OCR OCR,即Optical Character Recognition,光学字符 ...
- 【Python3网络爬虫开发实战】1.7.3-Appium的安装
[摘要] Appium是移动端的自动化测试工具,类似于前面所说的Selenium,利用它可以驱动Android.iOS等设备完成自动化测试,比如模拟点击.滑动.输入等操作,其官方网站为:http:// ...
- 【Python3网络爬虫开发实战】 1.7.1-Charles的安装
[摘要] Charles是一个网络抓包工具,相比Fiddler,其功能更为强大,而且跨平台支持得更好,所以这里选用它来作为主要的移动端抓包工具. 1. 相关链接 官方网站:https://www.ch ...
- 【Python3网络爬虫开发实战】1.5.3-redis-py的安装
[摘要] 对于Redis来说,我们要使用redis-py库来与其交互,这里就来介绍一下它的安装方法. 1. 相关链接 GitHub:https://github.com/andymccurdy/red ...
- 【Python3网络爬虫开发实战】1.5.2-PyMongo的安装
[摘要] 在Python中,如果想要和MongoDB进行交互,就需要借助于PyMongo库,这里就来了解一下它的安装方法. 1. 相关链接 GitHub:https://github.com/mong ...
- 【Python3网络爬虫开发实战】1.5.1-PyMySQL的安装
[摘要] 在Python 3中,如果想要将数据存储到MySQL中,就需要借助PyMySQL来操作,本节中我们介绍一下它的安装方式. 1. 相关链接 GitHub:https://github.com/ ...
- 【Python3网络爬虫开发实战】1.3.3-pyquery的安装
pyquery同样是一个强大的网页解析工具,它提供了和jQuery类似的语法来解析HTML文档,支持CSS选择器,使用非常方便.本节中,我们就来了解一下它的安装方式. 1. 相关链接 GitHub:h ...
- 【Python3网络爬虫开发实战】1.3.1-lxml的安装
[摘要]lxml是Python的一个解析库,支持HTML和XML的解析,支持XPath解析方式,而且解析效率非常高.本节中,我们了解一下lxml的安装方式,这主要从Windows.Linux和Mac三 ...
- 【Python3网络爬虫开发实战】1.2.6-aiohttp的安装
[摘要]之前介绍的Requests库是一个阻塞式HTTP请求库,当我们发出一个请求后,程序会一直等待服务器响应,直到得到响应后,程序才会进行下一步处理.其实,这个过程比较耗费资源.如果程序可以在这个等 ...
最新文章
- CVPR2021 | PAConv:一种位置自适应卷积,点云分类、分割任务表现SOTA
- 【Java Web前端开发】HTML表单和CSS部分
- 【教程】超详细的虚拟无线控制器安装教程
- 用python做一些excel的事情,实现数据自动化
- java 方法保存变量_java – 在初始化对象或将其保存为变量并调用该方法时,调用方法的速度更快...
- 用Openswan组建Linux IPSec ---第一部分
- 12 个月 vs. 1 个月,你的年终奖是多少?
- 看我72变:解决Entity Framework中枚举类型与tinyint的映射问题
- 在cad如果用计算机,CAD如何使用快速计算器为中的变量区域功能
- 计算机三级嵌入式系统
- 手机图片怎么免费转换成PDF格式?教程来了
- EEGLAB教程-1.2通道定位
- 区分PCI总线, PCIe总线和内存总线
- 重庆计算机一级跟全国计算机一级都考什么,全国计算机等级考试一级都考什么内容?...
- 项目经理的修炼,直面需求变更
- 如何将计算机恢复到桌面快捷方式,怎样还原电脑系统默认的Windows快捷方式及其图标呀?...
- 【CSP-S 2019模拟】题解
- 3D打印机硬件驱动-马林固件最新版本2.0.X中文注释(1)marlin 2.0.9.2 截至发稿时间2021年12月16日
- 送书 | 《Django项目开发实战》
- java中pom文件详解
热门文章
- java作图如何来回移动_如何在java中连续左右移动球?
- 12v电源正负极区分_解决冬天车辆无法启动的难题——车用应急启动电源选购要点及评测...
- html5 header和group
- 02Framelayout:帧布局
- 自制割接(平滑过滤)实验大全
- [bzoj1500 维修数列](NOI2005) (splay)
- 位运算之左移右移运算之详解
- ArcGIS客户端开发学习笔记(二)——XML
- 计算机组成原理电子时钟设计与实现,《计算机组成原理》课程设计报告-基于VHDL数字电子钟设计与实现.doc...
- scss提取 vue_vue 中使用sass实现主体换肤