用Selenium库获取网页源代码:新浪财经股票信息
1.访问及关闭页面
- 通过以下代码即可访问网站,相当于模拟人打开了一个浏览器,然后访问指定网址。
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.baidu.com/')
- 第1行代码导入Selenium库中的webdriver功能,第2行代码声明要模拟的浏览器是谷歌浏览器,第3行代码使用browser.get()函数访问指定网址。
- 在上述代码最后加上如下代码,就能关闭模拟浏览器。
2.获取网页源代码
- 使用模拟浏览器打开指定网址后,通过如下代码即可获得模拟浏览器中经过动态渲染的网页源代码:
data = browser.page_source
- 下面来试一试获取用Requests库未能获取成功的新浪财经股票信息,代码如下:
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://finance.sina.com.cn/realstock/company/sh000001/nc.shtml')
data = browser.page_source #核心代码
print(data)
- 在pycharm中运行上述代码,在运行结果输出去可以搜索到上证指数数值,如下图所示,说明网页源代码获取成功。
用Selenium库获取网页源代码:新浪财经股票信息相关推荐
- python selenium 获取网页源代码
获取网页源代码: 引入组件:[from selenium import webdriver]. [from selenium.webdriver.chrome.options import Optio ...
- 使用 Python3 获取网页源代码
爬虫的数据爬取量非常大,显然不可能对每个页面都手动复制源代码,因此就有必要使用自动化的方式来获取网页源代码.requests是Python的一个第三方HTTP(Hypertext Transfer P ...
- Python爬虫基础-如何获取网页源代码
Python爬虫基础-如何获取网页源代码 网络爬虫(Web Crawler),又称网页蜘蛛(Web Spider),是一种按照一定的规则,自动地抓取万维网信息的程序或者脚本.爬虫程序根据一组特定的规则 ...
- 4.1 使用Python获取网页源代码
1)第三方库的安装 a.在线安装 pip install 第三方库名 b.本地安装 下载对应版本的.whl文件,然后cd到文件目录下,通过 pip install xxx.whl 2)使用reques ...
- 获取网页源代码的最简单办法
获取网页源代码的最简单办法,就是利用 WinInet 单元中的函数: Code uses WinInet; function GetWebPage(const Url: string):string; ...
- c#利用WebClient和WebRequest获取网页源代码的比较
前几天举例分析了用asp+xmlhttp获取网页源代码的方法,但c#中一般是可以利用WebClient类和WebRequest类获取网页源代码.下面分别说明这两种方法的实现. WebClient类获取 ...
- java获取页面标签_java获取网页源代码后,提取标签内容……
java获取网页源代码后,提取标签内容-- 关注:245 答案:2 mip版 解决时间 2021-02-01 09:11 提问者咏bù琂败 2021-01-31 13:49 import java ...
- c#正则表达式取出数据库中带html标签的内容,C#用正则表达式 获取网页源代码标签的属性或值...
1.有url获取到网页源代码: using System.Web; using System.IO; using System.Net; private void GetHtmlinfo(string ...
- js技术要点---JS 获取网页源代码
JS 获取网页源代码 <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html& ...
最新文章
- lintcode480- Binary Tree Paths- easy
- Android中SQLiteDatabase操作【附源码】
- wpf 使子ui元素可视区域不超过父元素_对游戏UI设计的一点思考
- 波士顿大学研究生计算机科学专业排名,2020年波士顿大学排名TFE Times美国最佳计算机科学硕士专业排名第52...
- HDU-2544-最短路( 最短路)
- 带有天气预报的高大上web报表制作分享
- Java多线程基础知识(一)
- 机器学习中的基本概念
- 【直播预告】云栖社区特邀专家蒋泽银:Jpom一款低侵入式Java运维、监控软件...
- 嵌入式Linux项目开发的几个步骤
- markdown及IDEA快捷键
- 学会php想转学java好学吗_Java和PHP哪个好学
- 手机原来也能把照片制作成视频?1分钟包你学会,发朋友圈超有范
- 连夜干出来一个自动处理【支付宝交易支付投诉管理系统】,支持多商户
- Ubuntu 微信 linux版最新可用——UOS魔改版
- 09-最小生成树 公路村村通
- 称重模块的制作的安全守护
- Nginx介绍及配置 (一)
- OpenGL超级宝典visual studio 2013开发环境配置,GLTools
- htc 10 t版最新ruu t-mobile htc 10最新版,可用联通volte 可修复基带丢失