page_sourse爬取渲染后的页面代码
爬页面源码(page_source)
一般来说,selenium的page_source方法可以直接返回页面源代码
爬取网页ICP号:
from selenium import webdriver
import rehtml_list=["http://anzhuo.paojiao.cn/","http://sj.zol.com.cn/android_app/","https://appgallery.huawei.com/#/Apps",
]
for url in html_list:browser = webdriver.Chrome()browser.set_page_load_timeout(20) # 网页超时加载时间try:browser.get(url)result = browser.page_sourceexcept:print("{}超时".format(url))browser.quit()else:icp_name = ""icp_list = re.findall("([京津冀晋苏浙皖闽豫鄂湘粤桂琼川蜀蒙辽吉黑沪赣鲁贵黔云滇渝藏陕秦新甘陇青宁港澳台]ICP[备|证]\d{6,8}号*(?:-[1-9]\d?)?)", result)if icp_list:icp_name = icp_list[0]print(url, icp_name)browser.quit()
如上,给了三个网页:
第一个网页超时,
第二个网
page_sourse爬取渲染后的页面代码相关推荐
- python房子代码_基于python的链家小区房价爬取——仅需60行代码!
简介 首先打开相关网页(北京链家小区信息). 注意本博客的代码适用于爬取某个城市的小区二手房房价信息. 如果需要爬取其他信息,可修改代码,链家的数据获取的基本逻辑都差不多. 效果展示 因为只需要60行 ...
- python爬虫动态加载页面_Python+Selenium爬取动态加载页面(2)
注: 上一篇<Python+Selenium爬取动态加载页面(1)>讲了基本地如何获取动态页面的数据,这里再讲一个稍微复杂一点的数据获取全国水雨情网.数据的获取过程跟人手动获取过程类似,所 ...
- python爬取南京市房价_基于python的链家小区房价爬取——仅需60行代码
简介 首先打开相关网页(北京链家小区信息). 注意本博客的代码适用于爬取某个城市的小区二手房房价信息. 如果需要爬取其他信息,可修改代码,链家的数据获取的基本逻辑都差不多. 效果展示 因为只需要60行 ...
- python 爬取豆瓣top100电影页面
python 爬取豆瓣top100电影页面 运行结果截图: 代码: (原网站:https://movie.douban.com/top250) 1.将页面保存 避免多次访问 (登陆状态需页面cooki ...
- Python爬虫:Xpath爬取网页信息(附代码)
Python爬虫:Xpath爬取网页信息(附代码) 上一次分享了使用Python简单爬取网页信息的方法.但是仅仅对于单一网页的信息爬取一般无法满足我们的数据需求.对于一般的数据需求,我们通常需要从一个 ...
- python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
- 无法爬取淘宝商品页面
问题描述:无法爬取淘宝商品页面 案例如下: import requests import redef getHTMLText(url):try: r = requests.get(url,timeou ...
- Python爬虫爬取煎蛋网图片代码实例
这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...
最新文章
- 基于yolov5的工业缺陷检测方案
- ASP.NET 验证码示例
- JavaScript简明教程之快速入门
- 21、 TRUNCATE:清空表记录
- 转:优秀程序员的45个习惯
- xcode更新之后插件失效的解决办法
- Android Studio出现Failed to open zip file. Gradle's dependency cache may be corrupt问题的解决
- JQuery中淡出和淡入动画效果
- 【PostgreSQL-9.6.3】触发器概述(普通触发器)
- UI基础UIView常见属性及方法
- windows10上Eclipse运行MapReduce wordcount程序遇到的坑
- COMSOL—— LiveLink for MATLAB学习1
- vc2017 c语言运行,vc++2017下载|vc++2017运行库 32位64位 官方版 - 软件下载 - 绿茶软件园|33LC.com...
- asyncawait的前世今生
- mysql explain row_MySQL explain详解
- 行业分析-全球与中国无线键盘和蓝牙耳机市场现状及未来发展趋势
- 虚拟机复制镜像操作方法
- 满足于一种廉价的幸福?
- 计算机网络涉及的数学知识点,计算机考研:计算机网络六大重要知识点
- 100天精通Andriod逆向——第6天:Andriod 开发入门