from selenium import webdriver
import os,timedriver=webdriver.PhantomJS()driver.get('https://movie.douban.com/typerank?type_name=%E5%89%A7%E6%83%85&type=11&interval_id=100:90&action=')
time.sleep(10)
driver.save_screenshot('douban/movie1.png')#滚动条滚动
js='document.body.scrollTop=10000'
time.sleep(3)
driver.execute_script(js)
time.sleep(10)
driver.save_screenshot('douban/movie2.png')content=driver.page_sourcewith open('douban/movie.html','w',encoding='utf-8') as f:f.write(content)driver.quit()

/Library/Frameworks/Python.framework/Versions/3.6/bin/python3.6 /Users/apple/PycharmProjects/stage4/spider/2018_3_14/04scroll.py

Process finished with exit code 0

Python3-爬虫~selenium\phantomjs\爬取XX网页电影过程中向下滚动网页问题相关推荐

  1. python3爬虫selenium+chrom爬取今日头条热点新闻保存到数据库

    本人是菜鸟一枚,学了python爬虫有一段时间了,想找个网站练练手,网上搜索今日头条是动态加载的页面,用requests库,需要破as:A175DBDFDEC7024 cp: 5BFE87208254 ...

  2. python3爬虫 selenium+pyquery爬取人才网简历实战

    不废话,直接贴代码,各位看官要是觉得可以的话,麻烦点个赞~ import requests, pymysql,pyquery,time from bs4 import BeautifulSoup fr ...

  3. python+selenium+phantomJS爬取国家地表水水质自动监测实时数据发布系统——动态网页爬虫

    一.关于phantomjs 1.介绍 PhantomJS是一个为自动化而生的利器,它本质上是一个基于webkit内核的无界面浏览器,并可使用JavaScript或CoffeeScript进行编程.由于 ...

  4. python爬取bilibili数据_python基础教程之selenium+phantomjs爬取bilibili

    selenium+phantomjs爬取bilibili 首先我们要下载phantomjs 你可以到 http://phantomjs.org/download.html 这里去下载 下载完之后解压到 ...

  5. python3爬虫之多线程爬取英雄联盟所有皮肤图片

    python3爬虫之多线程爬取英雄联盟所有皮肤图片 线程不要太高,容易出错,大约用时1分钟左右. import requests import json import os import thread ...

  6. [python爬虫] Selenium定向爬取PubMed生物医学摘要信息

    本文主要是自己的在线代码笔记.在生物医学本体Ontology构建过程中,我使用Selenium定向爬取生物医学PubMed数据库的内容.         PubMed是一个免费的搜寻引擎,提供生物医学 ...

  7. [python爬虫] BeautifulSoup和Selenium对比爬取豆瓣Top250电影信息

    这篇文章主要对比BeautifulSoup和Selenium爬取豆瓣Top250电影信息,两种方法从本质上都是一样的,都是通过分析网页的DOM树结构进行元素定位,再定向爬取具体的电影信息,通过代码的对 ...

  8. python3爬虫模拟登录爬取教务系统成绩单(获取cookie操作)

    前言 今天来写写爬取教务系统的爬虫,此次的爬虫目的是爬取教务系统里面的成绩单,涉及到的库依旧是selenium,re,beautifulsoup,Options,今天多了个csv库用来处理爬取的数据, ...

  9. selenium+ Phantomjs爬取动态网页

    对于动态加载,Selenium+Phantomjs的强大打开网页查看网页源码(注意不是检查元素)会发现要爬取的信息并不在源码里面.Selenium+Phantomjs的强大一方面就在于能将完整的源码抓 ...

  10. 用scrapy+selenium + phantomjs 爬取vip网页,保存为json格式,写入到mysql数据库,下载图片(二)

    接上一编 weipin.py文件的代码 : # -*- coding: utf-8 -*- import scrapy from weipinhui.items import WeipinhuiIte ...

最新文章

  1. 迪克森沉思录之做Global SAP项目的弊端
  2. 前端工程基础知识点--Browserslist (基于官方文档翻译)
  3. 【计算理论】可判定性 ( 对角线方法 | 使用对角线方法证明 通用任务图灵机 语言 不可判定 )
  4. 多线程安全问题产生解决方案
  5. 用Sql添加删除字段,判断字段是否存在的方法
  6. java文件编码格式环境变量_Jenkins maven 构建乱码,修改file.encoding系统变量编码为UTF-8...
  7. jstl表达式替换某些字符
  8. ASP.NET企业开发框架IsLine FrameWork系列之五--DataProvider 数据访问(中)
  9. 老罗Android开发视频教程( android解析json数据 )4集集合
  10. 无缓冲channel与容量为1的channel的区别
  11. linux 进程 转存储,Linux memory management——(进程虚存空间的管理)(转)
  12. 23. Linux 主机上的用户信息传递
  13. FFmpeg总结(十一)用ffmpeg进行转格式,Android下播放网络音频流
  14. 商城项目html pc,Vue实战篇(PC端商城项目)
  15. Visual C++ 2010 Express 下载及详细安装教程(VC2010)
  16. pytorch(8)-- resnet101 迁移学习记录
  17. 模数转换器(ADC)选型参考指南
  18. java计算机毕业设计小小银动漫网站源码+系统+数据库+lw文档+mybatis+运行部署
  19. python画美女代码_3分钟画字符画跟女神表白,利用python字符串、列表方法
  20. 读 Robert C. Solomon 之《哲学导论》

热门文章

  1. python接口自动化3-自动发帖(session)
  2. 2023年天津天狮学院专升本报名考试的安排
  3. 如何在Python中异步操作数据库
  4. 如何在 Python 中异步操作数据库?aiomysql、asyncpg、aioredis 使用介绍
  5. 土地资源管理就业怎么这么难_我所理解的土地资源管理专业
  6. springboot将模板生成pdf文件
  7. windows service and target‏
  8. setPositiveButton和setNegativeButton的区别
  9. linux防火墙_专业的linux web应用防火墙国内排名推荐
  10. 计算机突然蓝屏重启,最近电脑经常蓝屏重启。