爬页面源码(page_source)

一般来说,selenium的page_source方法可以直接返回页面源代码

爬取网页ICP号:

from selenium import webdriver
import rehtml_list=["http://anzhuo.paojiao.cn/","http://sj.zol.com.cn/android_app/","https://appgallery.huawei.com/#/Apps",
]
for url in html_list:browser = webdriver.Chrome()browser.set_page_load_timeout(20)       # 网页超时加载时间try:browser.get(url)result = browser.page_sourceexcept:print("{}超时".format(url))browser.quit()else:icp_name = ""icp_list = re.findall("([京津冀晋苏浙皖闽豫鄂湘粤桂琼川蜀蒙辽吉黑沪赣鲁贵黔云滇渝藏陕秦新甘陇青宁港澳台]ICP[备|证]\d{6,8}号*(?:-[1-9]\d?)?)", result)if icp_list:icp_name = icp_list[0]print(url, icp_name)browser.quit()

如上,给了三个网页:

第一个网页超时,

第二个网

page_sourse爬取渲染后的页面代码相关推荐

  1. python房子代码_基于python的链家小区房价爬取——仅需60行代码!

    简介 首先打开相关网页(北京链家小区信息). 注意本博客的代码适用于爬取某个城市的小区二手房房价信息. 如果需要爬取其他信息,可修改代码,链家的数据获取的基本逻辑都差不多. 效果展示 因为只需要60行 ...

  2. python爬虫动态加载页面_Python+Selenium爬取动态加载页面(2)

    注: 上一篇<Python+Selenium爬取动态加载页面(1)>讲了基本地如何获取动态页面的数据,这里再讲一个稍微复杂一点的数据获取全国水雨情网.数据的获取过程跟人手动获取过程类似,所 ...

  3. python爬取南京市房价_基于python的链家小区房价爬取——仅需60行代码

    简介 首先打开相关网页(北京链家小区信息). 注意本博客的代码适用于爬取某个城市的小区二手房房价信息. 如果需要爬取其他信息,可修改代码,链家的数据获取的基本逻辑都差不多. 效果展示 因为只需要60行 ...

  4. python 爬取豆瓣top100电影页面

    python 爬取豆瓣top100电影页面 运行结果截图: 代码: (原网站:https://movie.douban.com/top250) 1.将页面保存 避免多次访问 (登陆状态需页面cooki ...

  5. Python爬虫:Xpath爬取网页信息(附代码)

    Python爬虫:Xpath爬取网页信息(附代码) 上一次分享了使用Python简单爬取网页信息的方法.但是仅仅对于单一网页的信息爬取一般无法满足我们的数据需求.对于一般的数据需求,我们通常需要从一个 ...

  6. python爬虫图片实例-Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  7. python爬图代码实例_Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

  8. 无法爬取淘宝商品页面

    问题描述:无法爬取淘宝商品页面 案例如下: import requests import redef getHTMLText(url):try: r = requests.get(url,timeou ...

  9. Python爬虫爬取煎蛋网图片代码实例

    这篇文章主要介绍了Python爬虫爬取煎蛋网图片代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 今天,试着爬取了煎蛋网的图片. 用到的包: ...

最新文章

  1. 基于yolov5的工业缺陷检测方案
  2. ASP.NET 验证码示例
  3. JavaScript简明教程之快速入门
  4. 21、 TRUNCATE:清空表记录
  5. 转:优秀程序员的45个习惯
  6. xcode更新之后插件失效的解决办法
  7. Android Studio出现Failed to open zip file. Gradle's dependency cache may be corrupt问题的解决
  8. JQuery中淡出和淡入动画效果
  9. 【PostgreSQL-9.6.3】触发器概述(普通触发器)
  10. UI基础UIView常见属性及方法
  11. windows10上Eclipse运行MapReduce wordcount程序遇到的坑
  12. COMSOL—— LiveLink for MATLAB学习1
  13. vc2017 c语言运行,vc++2017下载|vc++2017运行库 32位64位 官方版 - 软件下载 - 绿茶软件园|33LC.com...
  14. asyncawait的前世今生
  15. mysql explain row_MySQL explain详解
  16. 行业分析-全球与中国无线键盘和蓝牙耳机市场现状及未来发展趋势
  17. 虚拟机复制镜像操作方法
  18. 满足于一种廉价的幸福?
  19. 计算机网络涉及的数学知识点,计算机考研:计算机网络六大重要知识点
  20. 100天精通Andriod逆向——第6天:Andriod 开发入门

热门文章

  1. niuke --abc
  2. siri买的微软的服务器,微软要抢Siri饭碗:开始公开测试iOS版Cortana
  3. 基于STM32的“智能家居”课程设计
  4. CVX工具箱配合MATLAB使用心得
  5. Retrofit源码学习
  6. Maya与3dsmax对比,为什么推荐3D游戏建模新手学习3dsmax
  7. AnyBurn 免费专业的 CD/DVD/蓝光刻录和ISO编辑软件
  8. YOUChain全球节点招募马来西亚吉隆坡站圆满完成
  9. CAD制图初学入门之CAD图纸集的使用技巧
  10. 关于网站建设需要把握的细节