1.访问及关闭页面

  • 通过以下代码即可访问网站,相当于模拟人打开了一个浏览器,然后访问指定网址。
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.baidu.com/')
  • 第1行代码导入Selenium库中的webdriver功能,第2行代码声明要模拟的浏览器是谷歌浏览器,第3行代码使用browser.get()函数访问指定网址。
  • 在上述代码最后加上如下代码,就能关闭模拟浏览器。

2.获取网页源代码

  • 使用模拟浏览器打开指定网址后,通过如下代码即可获得模拟浏览器中经过动态渲染的网页源代码:
data = browser.page_source
  • 下面来试一试获取用Requests库未能获取成功的新浪财经股票信息,代码如下:
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://finance.sina.com.cn/realstock/company/sh000001/nc.shtml')
data = browser.page_source #核心代码
print(data)
  • 在pycharm中运行上述代码,在运行结果输出去可以搜索到上证指数数值,如下图所示,说明网页源代码获取成功。

用Selenium库获取网页源代码:新浪财经股票信息相关推荐

  1. python selenium 获取网页源代码

    获取网页源代码: 引入组件:[from selenium import webdriver]. [from selenium.webdriver.chrome.options import Optio ...

  2. 使用 Python3 获取网页源代码

    爬虫的数据爬取量非常大,显然不可能对每个页面都手动复制源代码,因此就有必要使用自动化的方式来获取网页源代码.requests是Python的一个第三方HTTP(Hypertext Transfer P ...

  3. Python爬虫基础-如何获取网页源代码

    Python爬虫基础-如何获取网页源代码 网络爬虫(Web Crawler),又称网页蜘蛛(Web Spider),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.爬虫程序根据一组特定的规则 ...

  4. 4.1 使用Python获取网页源代码

    1)第三方库的安装 a.在线安装 pip install 第三方库名 b.本地安装 下载对应版本的.whl文件,然后cd到文件目录下,通过 pip install xxx.whl 2)使用reques ...

  5. 获取网页源代码的最简单办法

    获取网页源代码的最简单办法,就是利用 WinInet 单元中的函数: Code uses WinInet; function GetWebPage(const Url: string):string; ...

  6. c#利用WebClient和WebRequest获取网页源代码的比较

    前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取 ...

  7. java获取页面标签_java获取网页源代码后,提取标签内容……

    java获取网页源代码后,提取标签内容-- 关注:245  答案:2  mip版 解决时间 2021-02-01 09:11 提问者咏bù琂败 2021-01-31 13:49 import java ...

  8. c#正则表达式取出数据库中带html标签的内容,C#用正则表达式 获取网页源代码标签的属性或值...

    1.有url获取到网页源代码: using System.Web; using System.IO; using System.Net; private void GetHtmlinfo(string ...

  9. js技术要点---JS 获取网页源代码

    JS 获取网页源代码 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html& ...

最新文章

  1. lintcode480- Binary Tree Paths- easy
  2. Android中SQLiteDatabase操作【附源码】
  3. wpf 使子ui元素可视区域不超过父元素_对游戏UI设计的一点思考
  4. 波士顿大学研究生计算机科学专业排名,2020年波士顿大学排名TFE Times美国最佳计算机科学硕士专业排名第52...
  5. HDU-2544-最短路( 最短路)
  6. 带有天气预报的高大上web报表制作分享
  7. Java多线程基础知识(一)
  8. 机器学习中的基本概念
  9. 【直播预告】云栖社区特邀专家蒋泽银:Jpom一款低侵入式Java运维、监控软件...
  10. 嵌入式Linux项目开发的几个步骤
  11. markdown及IDEA快捷键
  12. 学会php想转学java好学吗_Java和PHP哪个好学
  13. 手机原来也能把照片制作成视频?1分钟包你学会,发朋友圈超有范
  14. 连夜干出来一个自动处理【支付宝交易支付投诉管理系统】,支持多商户
  15. Ubuntu 微信 linux版最新可用——UOS魔改版
  16. 09-最小生成树 公路村村通
  17. 称重模块的制作的安全守护
  18. Nginx介绍及配置 (一)
  19. OpenGL超级宝典visual studio 2013开发环境配置,GLTools
  20. htc 10 t版最新ruu t-mobile htc 10最新版,可用联通volte 可修复基带丢失

热门文章

  1. 二维动态数组空间分配 c语言,科学网—C语言中动态二维数组的使用和分配 - 王一哲的博文...
  2. SaaS模式、技术与案例详解——第16章 SaaS模式可行性分析
  3. 生物信息-related
  4. 第一节 模式识别的基本概念
  5. GC导致线上CPU超100%
  6. EEGLAB直接读入Curry8软件采集的数据信号
  7. CouchDB使用小记
  8. 聊天室程序python_Python聊天室程序(基础版)_python
  9. 【公务员考试】结构化面试时间一般多长?
  10. Copying File