话不多说,先上代码和效果图。

# Author:wangdq
# Date :2021/10/31 12:07
# Describe :
from selenium import webdriverchrome_options = webdriver.ChromeOptions()
chrome_options.headless = True
chrome = webdriver.Chrome(chrome_options=chrome_options)chrome.get("https://wonderking.blog.csdn.net/")print(chrome.page_source)

效果图:

从上面的图片可以看出,获取到的chrom对象,他的page_source属性里面就是我们爬取的页面代码。

webdriver环境搭建

1、首先需要装chrome(谷歌浏览器)

2、下载对应的chromedriver,需要看你的谷歌浏览器的版本是那个。我的版本是95.0.4638.54

chromdriver下载链接

我使用的是windows,所以直接下载32位的压缩包。

下载后,将压缩包解压后获得chromedriver.exe文件,将它放到到python的安装目录下,我的是

C:\Users\admin\AppData\Local\Programs\Python\Python38-32

3、下载selenium

Python中安装selenium或者直接cmd中安装:

pip install -U selenium

4、最后一步就是测试了,参考文章开头的代码。

使用webdriver爬取网页相关推荐

  1. python爬虫爬网站数据登录_使用webdriver+urllib爬取网页数据(模拟登陆,过验证码)...

    urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得ur ...

  2. 使用webdriver+urllib爬取网页数据(模拟登陆,过验证码)

    urilib是python的标准库,当我们使用Python爬取网页数据时,往往用的是urllib模块,通过调用urllib模块的urlopen(url)方法返回网页对象,并使用read()方法获得ur ...

  3. python3爬取网页AJAX数据

    目前很多网站都使用ajax技术动态加载数据,和常规的网站不一样,数据时动态加载的,如果我们使用常规的方法爬取网页,得到的只是一堆html代码,没有任何的数据. Ajax是利用 JavaScript在保 ...

  4. python爬虫之爬取网页基础知识及环境配置概括

    记:python爬虫是爬取网页数据.统计数据必备的知识体系,当我们想统计某个网页的部分数据时,就需要python爬虫进行网络数据的爬取,英文翻译为 spider 爬虫的核心 1.爬取网页:爬取整个网页 ...

  5. 使用selenium爬取网页

    今天学习了使用selenium爬取网页. #本地Chrome浏览器的可视模式设置: from selenium import webdriver #从selenium库中调用webdriver模块 d ...

  6. 关于爬取网页的时候,抓不到元素,报没有这样元素的错误

    ** 关于爬取网页的时候,抓不到元素,报没有这样元素的错误 ** 前言: 这里是先抓到了第一页的信息,然后通过构造的网址进入了第二个界面,然后出现抓不到第二个网页的元素问题 ''' **网上的解决方式 ...

  7. Python爬取网页数据基本步骤

    Python爬取网页数据基本步骤: from urllib import request response = request.urlopen('完整的网址') import requests imp ...

  8. selenium爬取网页部分HTML代码

    selenium爬取网页部分HTML代码 1.构造webdriver启动方法 2.保存完整HTML代码 3.保存部分HTML代码,及其他方法 其他方案1:BeautifulSoup 其他方案2:lxm ...

  9. 利用脚本动态爬取网页信息

    利用脚本动态爬取网页信息 编译环境:Jupyter Notebook (Anaconda3) 调用的包:selenium,webdrive,webdriver_manager 文章目录 利用脚本动态爬 ...

最新文章

  1. mysql information schema_[MySql技术]MySQL中information_schema是什么
  2. PL/SQL 的一些用法
  3. linux驱动模型开发——linux platform总线机制讲解与实例开发
  4. python pprint_如何美观地打印 Python 对象?这个标准库可以简单实现
  5. 基于区域的OSPF简单口令认证(cisco packet tracer5.3)
  6. 「初步」Spring与commons的BeanUtil.copyProperties
  7. java的add方法的使用_Java HashSet add()方法与示例
  8. 简单的NLPIR分词 JAVA 实现
  9. em算法详细例子及推导_EM算法详解
  10. javascript延时调用函数
  11. 朗文词典第五版安装详细步骤
  12. iPhone13全系列参数对比
  13. zynq-7000系列基于zynq-zed的vivado初步设计之linux下控制PL扩展的GPIO
  14. 下载安装SQL server2008的步骤
  15. 思维正好,何不踏歌之“丑数”
  16. 智能卡 PSAM 卡片文件结构
  17. Echarts — 绘制省级地图
  18. Ext 4 概述(一)
  19. C语言实现TCP网络通信
  20. ‘underscore系列之throttle“‘

热门文章

  1. keil玩儿51单片机时遇见的错误与警告
  2. switch-case
  3. css表格文字超数量就竖排_CSS奇特技巧:控制文字竖排_css
  4. 《八步成就卓越的项目管理》--陈新春老师
  5. Python办公自动化实战 05 | Python-docx库:Python与Word的完美结合_ 利用代码实现Word中插入图片
  6. C# 获取公网ip地址
  7. SEO优化网站教程4
  8. Jenkins(10):禁止用户注册
  9. kubernetes-dashboard安装介绍(备忘)
  10. python:while循环实现星星打印【多种样式】