Python + Selenium +Chrome 批量下载网页代码修改

主要修改以下代码可以调用 本地的 user-agent.txt 和 cookie.txt

来达到在登陆状态下 批量打开并下载网页,以网页ID来保存为网页文件名

导入 webdriver

from selenium import webdriver

读取本地文件中的URL链接

address = ‘./url.txt’

fp = open(address, ‘r’)

lines = fp.readlines()

print(‘【URL链接】:%s’, lines)

调用环境变量指定的PhantomJS浏览器创建浏览器对象

driver = webdriver.PhantomJS()

driver = webdriver.Chrome()

如果没有在环境变量指定PhantomJS位置

driver = webdriver.PhantomJS(executable_path=”./phantomjs”))

for data in lines:

get方法会一直等到页面被完全加载,然后才会继续程序,通常测试会在这里选择 time.sleep(2)

driver.get(data)

向下滚动10000像素

js = “document.body.scrollTop=10000”

js=”var q=document.documentElement.scrollTop=10000”

执行JS语句

driver.execute_script(js)

查看页面快照

driver.save_screenshot(“csdn.png”)

print(‘执行中。。。’)

关闭浏览器

driver.quit()

print(‘执行结束。。。’)

关闭文件流

fp.close()

python 批量下载 代码_Python + Selenium +Chrome 批量下载网页代码修改相关推荐

  1. python webdriver save_Python + Selenium +Chrome 批量下载网页代码修改【新手必学】

    Python + Selenium +Chrome 批量下载网页代码修改 主要修改以下代码可以调用 本地的 user-agent.txt 和 cookie.txt 来达到在登陆状态下 批量打开并下载网 ...

  2. python壁纸程序代码_python实现壁纸批量下载代码实例

    前言 好久没有写文章了,因为最近都在适应新的岗位,以及利用闲暇时间学习python.这篇文章是最近的一个python学习阶段性总结,开发了一个爬虫批量下载某壁纸网站的高清壁纸. 注意:本文所属项目仅用 ...

  3. python批量检索文献_Python+Selenium,让浏览器自动帮你下文献

    在做学术.搞科研的过程中,我们往往需要针对一个特定的主题下载海量的文献.在把几百篇文献下载到电脑的过程中,假如遇到不够友好的数据库不提供批量下载的功能,怎么办?我恰好遇到了这样的批量下载的科研任务和批 ...

  4. aspx网页背景图片设置代码_python requests,BeautifulSoup批量下载360图片

    本代码演示通过python的requests,BeautifulSoup库批量下载360图片,并保存在本机的路径 代码如下: #BeautifulSoup库是网页爬虫解析库,主要用来对HTML源代码进 ...

  5. python实现qq登录_python实现QQ批量登录功能

    本文实例为大家分享了python实现QQ批量登录功能的具体代码,供大家参考,具体内容如下 小编收集整理的第一份代码:python3.6批量登陆QQ import os import time impo ...

  6. python爬取好友qq空间_python + selenium +chrome爬取qq空间好友说说并存入mongodb数据库...

    title: python + selenium +chrome爬取qq空间好友说说并存入mongodb数据库 准备阶段 在正式开始在前需要先准备好做爬虫的工具,本例使用chrome无头浏览器进行爬取 ...

  7. python自动化控制运动_Python +selenium自动化帮你预订运动场地

    导语 炎热的夏天,正是换上短裤短裙晒身材的时候.但是,身材不好怎么办?运动是一个选择,特别是像我们程序员行业,天天坐在空调办公室,更应该出出汗,正所谓:冬练三九,夏练三伏. 下班后,约上公司的妹子,打 ...

  8. python抓取教学_Python Selenium 实战教学:爬取每日天气

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 作者:气象学渣 一.准备工作 1.Selenium的介绍与安装 Selen ...

  9. python教程app下载地址_Python爬取APP下载链接的实现方法

    首先是准备工作 Python 2.7.11:下载python 其中python2和python3目前同步发行,我这里使用的是python2作为环境.Pycharm是一款比较高效的Python IDE, ...

最新文章

  1. Java 修饰符的总结
  2. tableau必知必会之如何在同一视图中进行相同分析维度图表的切换
  3. 怎么一键排版_做了这么久的PPT!终于找到可以自动排版的插件了
  4. Specified VM install not found: type Standard VM, name jdk1.6_ 的疑问
  5. JAVA.IO字节流
  6. css_01_承接部分html+css快速入门
  7. Android-support-v4源码查看
  8. 浏览器 制作---TWebBrowser 控件
  9. Atitit refact art 重构的艺术 目录 1. Concept 1 1.1. Bp 1 2. Prob 2 3. Tool 2 1.Concept 1. legacy code遗留代
  10. 瑞信:区块链技术还在半山腰 2025年才能真正成熟
  11. 【Scratch画图100例】图40-scratch实心五角星 少儿编程 scratch编程画图案例教程 考级比赛画图集训案例
  12. linux vi替换字符串
  13. biopython教程与手册_使用biopython处理序列数据
  14. pandas算加权平均值_Pandas数据帧中多列的加权平均数
  15. UE4_模型_Bound(边界)
  16. Twrp recovery 编译教程(译文)
  17. minIO如何设置直接通过访问链接在浏览器中打开文件
  18. 一个人运营公众号,像是一场马拉松
  19. 时空之巅服务器在线玩,天域之巅 - 《神鬼传奇》官方网站
  20. 微信小程序--小程序及微信生态圈

热门文章

  1. AAAI 2021 最「严」一届发榜,1692 篇论文中选,录取率仅为 21%
  2. 炫技,从12.67s到1.06s的网站性能优化实战
  3. 漫话:如何给女朋友解释什么是 Git 和 GitHub?
  4. 用数据分析蔡徐坤1亿转发量幕后推手被封后能否动摇饭圈文化?
  5. Scrapy框架的概念、作用和工作流程
  6. mongodb的聚合操作
  7. python判断语句if...elif...else、if嵌套、三目运算符
  8. 复习计算机网络基础 day9--应用层
  9. python报错 ValueError: dictionary update sequence element #0 has length 1; 2 is require
  10. python RE库的基本使用!基本定义详细讲解!来源于MOOCpython,课程链接文章末尾有!