文章目录

  • 安装selenium
  • 下载响应的driver
  • 构建爬虫工程

安装selenium

由于我的Windows系统上安装的Anaconda,且包含两个版本python2和python3。因此,首先我使用cmd(命令行)切换到我需要使用的python3。切换的命令如下:

activate py3

接着,使用下面的命令下载selenium:

pip install -U selenium

下载过程即结果如下:

下载响应的driver

根据自己的浏览器进行选择:
Chrome: https://sites.google.com/a/chromium.org/chromedriver/downloads
Firefox: https://github.com/mozilla/geckodriver/releases
比如我使用的是火狐浏览器:

构建爬虫工程

需要采集的网页为:

采集的内容为课程的标题,如上图所示。
程序如下,其中解析部分使用的是BeautifulSoup

# -*- coding: utf-8 -*-
from selenium import webdriver
from time import sleep
from bs4 import BeautifulSoup
driver = webdriver.Firefox(executable_path='F:\program_work\python_work\TaobaoCrawler\driver\geckodriver.exe')
driver.get("http://www.w3school.com.cn/b.asp")
# 全屏幕打开
driver.maximize_window()
# 输出网页内容,这里选择一定的编码
page = driver.page_source.encode('GBK', 'ignore')
soup = BeautifulSoup(driver.page_source, "html.parser")
courses = soup.select('#course > ul > li')
for cour in courses:name = cour.textprint(name)print(page)
# 休息5秒
sleep(5)
driver.quit()

程序的输出结果如下所示:

Windows环境下基于python3 + selenium构建网络爬虫相关推荐

  1. C++:Windows环境下基于Eclipse配置C/C++开发环境

    C++:Windows环境下基于Eclipse配置C/C++开发环境 目录 Windows下的MinGW下载.安装和配置 1.MinGW下载 2.MinGW安装与配置 3.基于Eclipse配置 Wi ...

  2. 硬盘克隆带linux系统,一种Windows环境下基于DiskGenius克隆Linux系统的方法及系统与流程...

    本发明涉及服务器操作系统技术领域,特别是一种windows环境下基于diskgenius克隆linux系统的方法及系统. 背景技术: 服务器在测试过程中需要反复安装linux操作系统用于服务器的各种测 ...

  3. 在windows环境下基于sublime text3的node.js开发环境搭建

    摘自:http://blog.sina.com.cn/s/blog_5a6efa330102vcla.html  (略有修改) 首先安装sublime text3,百度一堆,自己找吧.理论上subli ...

  4. kali没有arpspoof命令_windows环境下使用python3命令

    最近kali崩溃了,于是就使用了一段时间的win 10,对于一些两种系统之间的差异也是进行了一定的协同修复. 在kali下使用python命令就是调用的python2,使用python3命令就是调用的 ...

  5. 可持续5G环境下基于机器学习的网络分片框架

    Machine Learning-Based Network Sub-Slicing Framework in a Sustainable 5G Environment 5G环境下的物联网框架 5G切 ...

  6. Freebsd 4.7环境下基于qmail系统的反病毒反垃圾邮件系统构建--fw

    Freebsd 4.7环境下基于 qmail系统的反病毒反垃圾邮件系统构建 第一部分:前 言 一.        版权信息 本文档的版权属于作者姜培军[peijun.jiang]所有.转摘时请附带本信 ...

  7. 一、在windows环境下修改pip镜像源的方法(以python3为例)

    在windows环境下修改pip镜像源的方法(以python3为例) 1.在windows文件管理器中,输入 %APPDATA% 2.会定位到一个新的目录下,在该目录下新建pip文件夹,然后到pip文 ...

  8. Windows下基于python3使用word2vec训练中文维基百科语料资料汇总

    Windows下基于python3使用word2vec训练中文维基百科语料(一):https://www.cnblogs.com/gaofighting/p/9055674.html Windows下 ...

  9. 基于Windows环境下cmd/编译器无法输入中文,显示中文乱码解决方案

    基于Windows环境下cmd/编译器无法输入中文,显示中文乱码解决方案 参考文章: (1)基于Windows环境下cmd/编译器无法输入中文,显示中文乱码解决方案 (2)https://www.cn ...

最新文章

  1. 自动驾驶汽车事故的责任追究
  2. flex4.6 图表 在module中 x轴旋转正确的做法
  3. Zabbix如何实现Server和Agent的通信加密
  4. 【AC Saber】高精度
  5. 如何看当前windows是utf8还是gbk_监理工程师5月份出教材,现在如何备考?
  6. 投递简历得不到回复,并不是你的简历不好,可能是这个原因
  7. 打印机服务器启用后自动关闭,共享打印机点击打印就自动关闭该怎么办?
  8. win10中安装centos7双系统
  9. python给手机发短信_使用 Python 发送短信
  10. python局域网文件互传
  11. -webkit-touch-callout: none;禁止ios弹出菜单,长按图片保存到手机时
  12. [Neo4j] CQL命令
  13. 25年后的晶体管会是什么样?
  14. candidate expects 1 argument, 0 provided 错误解决
  15. 时间序列分析中的移动平均趋势剔除法
  16. 关于睡眠唤醒实现开机功能
  17. 淘宝直通车的打法的方法与问题分析
  18. Python爬虫之Scrapy框架爬虫实战
  19. box-shadow无效果
  20. 《Java解惑》系列——02字符谜题——谜题17:嗯??

热门文章

  1. 面试官系统精讲Java源码及大厂真题 - 13 差异对比:集合在 Java 7 和 8 有何不同和改进
  2. 9.6分神作又出续集,这是成年人最不敢直视的现实
  3. Spring教程 - Spring核心框架教程
  4. Java8新特性教程 - 终极指南
  5. 数据可视化组件Grafana详细解读--RedHat/Fedora/CentOS/Oracle上的安装
  6. [UWP]用画中画模式(CompactOverlay Mode)让用总在最前端显示
  7. c语言 数组循环左移m位
  8. 【Nginx那些事】nginx配置实例(四)搭建高可用集群
  9. 【Python】Python库之游戏开发
  10. 【C语言】将输入的10个数排序