Python爬虫selenium、PhanmJs
selenium:可以模拟鼠标进行一些操作
实例1:实现自动打开google浏览器,进行百度搜索,并关闭浏览器
from selenium import webdriver from time import sleep #指定安装google浏览器驱动程序 bro = webdriver.Chrome(r'E:\Spider爬虫视频\day03\chromedriver_win32\chromedriver.exe')#打开浏览器发起请求 bro.get('https://www.baidu.com')sleep(2)#定位到搜索框 my_text = bro.find_element_by_id('kw') #向搜索框中输入一个关键字 my_text.send_keys('西红柿首富')sleep(5)#定位到搜索按钮 my_button = bro.find_element_by_id('su') my_button.click()sleep(6) #关闭浏览器 bro.quit()
PhanmJs:无界面浏览器
from selenium import webdriver from time import sleep#指定phantomjs驱动 bro = webdriver.PhantomJS(r'E:\Spider爬虫视频\day03\phantomjs-2.1.1-windows\bin\phantomjs.exe')#打开浏览器发起请求 bro.get('https://www.baidu.com') bro.save_screenshot('./首页.png')#用来截屏 sleep(2)#定位到搜索框 my_text = bro.find_element_by_id('kw') #向搜索框中输入一个关键字 my_text.send_keys('人民币') bro.save_screenshot('./2.png') sleep(2)#定位到搜索按钮 my_button = bro.find_element_by_id('su') my_button.click()sleep(5) bro.save_screenshot('./3.png') #关闭浏览器 bro.quit()
转载于:https://www.cnblogs.com/yangzhizong/p/9714387.html
Python爬虫selenium、PhanmJs相关推荐
- [Python爬虫] Selenium获取百度百科旅游景点的InfoBox消息盒
前面我讲述过如何通过BeautifulSoup获取维基百科的消息盒,同样可以通过Spider获取网站内容,最近学习了Selenium+Phantomjs后,准备利用它们获取百度百科的旅游景点消息盒(I ...
- [Python爬虫] Selenium+Phantomjs动态获取CSDN下载资源信息和评论
前面几篇文章介绍了Selenium.PhantomJS的基础知识及安装过程,这篇文章是一篇应用.通过Selenium调用Phantomjs获取CSDN下载资源的信息,最重要的是动态获取资源的评论,它是 ...
- [Python爬虫] Selenium实现自动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现访问Firefox浏览器并自动搜索"Eastmount"关键字及截图的功能.而这篇文章主要简单介绍如何实现自动登录163邮箱,同时 ...
- [python爬虫] Selenium常见元素定位方法和操作的学习介绍(转载)
转载地址:[python爬虫] Selenium常见元素定位方法和操作的学习介绍 一. 定位元素方法 官网地址:http://selenium-python.readthedocs.org/locat ...
- Python爬虫 Selenium实现自动登录163邮箱和Locating Elements介绍
Python爬虫视频教程零基础小白到scrapy爬虫高手-轻松入门 https://item.taobao.com/item.htm?spm=a1z38n.10677092.0.0.482434a6E ...
- Python 爬虫 Selenium 基本使用
Python 爬虫 Selenium 基本使用 1. 基础知识 1.1 下载浏览器驱动 1.2 帮助文档 2. 浏览器操作 2.1 浏览器导航 2.2 窗口和选项卡 2.3 Frames and If ...
- Python爬虫-Selenium(1)
Python爬虫-Selenium(1) @(博客)[python, 爬虫, selenium, Python] Python爬虫-Selenium(1) 前言 前期准备 基础使用 进阶使用 浏览器操 ...
- [Python爬虫] Selenium实现自己主动登录163邮箱和Locating Elements介绍
前三篇文章介绍了安装过程和通过Selenium实现訪问Firefox浏览器并自己主动搜索"Eastmount"keyword及截图的功能.而这篇文章主要简介怎样实现 ...
- python爬虫selenium爬不到frame 的tag标记下#document==0的内容解决
python爬虫selenium爬不到frame 的tag标记下#document==0的内容解决 前言 按理来说,selenium可以获取当前页面的所有源代码,但却爬不到frame 的tag标记下# ...
- python 爬虫+selenium 全自动化下载JS动态加载漫画
** python 爬虫+selenium 全自动化下载JS动态加载漫画 最近刚学的python,代码可能并不规范,希望大家见谅! 爬取之前,我们首先需要做一些准备工作,因为很多网站都有反爬检索,为了 ...
最新文章
- 神经网络中,设计loss function有哪些技巧?
- Spark入门教程(二)Spark2.2源码编译及安装配置
- python字符串数组中最短的_python求解数组中两个字符串的最小距离
- ACM 题目分类POJ(自用,精)
- bwl老二吃嘲讽吗_怀旧服BWL2小时全通最简打法!时光点燃一次过
- gx works2 存储器空间或桌面堆栈不足_2020福清市gx螺旋输送机价格厂家发货-衡泰...
- 安装教程 | 在谷歌安装印象笔记插件(实用,在谷歌浏览器添加印象笔记插件,整理遇到bug,收藏解决bug的文章)
- 6.11 如何在Excel自选图形中显示公式的数值 [原创Excel教程]
- LODOP打印分页出现空白页
- Android开发————简易App设计(三)
- 开学作业——如何做好课堂笔记
- ArcGIS中矢量裁剪栅格影像及影像合并【附练习数据下载】
- python string类型的英文句子逆序输出
- STM32三种BOOT启动模式详解(全网最全)
- yield()函数的使用
- 区块链投资分歧:蔡文胜麦刚入局 朱啸虎张颖看衰
- 【mud】文字mud游戏的魅力(龟跑比赛)
- 华为:研发协同,为什么说效率是第一重要的事儿?
- 第一章计算机网络概述
- Adobe Photoshop CC 2019 20.0.6软件免费下载及安装教程