python已打开页面获取信息_python+selenium实现自动登录网页获取信息(一)
我用的是一个教师继续教育的网站,进行演示和模拟,网站:http://cas.study.yanxiu.jsyxsq.com/auth/login?service=http%3A%2F%2Fwww.17ahgp.study.yanxiu.jsyxsq.com%2Fuc%2Findex.htm&renew=true&share=share&isGate=false
一、需要的环境
1.python环境,我用的是3.8.2,大家可以百度搜索安装配置。
1
2.浏览器,我配置的谷歌。要对应chromedriver版本进行下载驱动。详细参考:https://blog.csdn.net/yoyocat915/article/details/80580066
3.安装selenium,Selenium是一个WEB自动化测试工具,它运行时会直接实例化出一个浏览器,完全模拟用户的操作,比如点击链接、输入表单,点击按钮提交等。在cmd中输入pip install selenium ,完成即可。pip install selenium
二、获取模拟登录网站的Xpath和滑块验证
1.用python打开谷歌浏览器,打开网站。from seleniumimport webdriver #selenium网页工具
import time#时间函数库
driver= webdriver.Chrome() #打开谷歌浏览器
driver.maximize_window() #将窗口最大化
driver.get('http://cas.study.yanxiu.jsyxsq.com/auth/loginservice=http%3A%2F%2F17lhjgzffz.study.yanxiu.jsyxsq.com%2Fuc%2Findex.htm&renew=true&share=share&isGate=false') #打开网页
2.打开网站后我们想要自动输入账号密码,F12打开网页的源码。
2
找到账号的输入地方,然后在源码中,复制它的Xpath。
复制Xpath
密码框也同样操作,Xpth的我的理解就是一种路径。//*[@id="username"] 就是账号框的Xpath,用代码driver.find_element_by_xpath('//*[@id="username"]'),来找这个位置。
接下来通过代码找到输入框输入账号密码。driver.find_element_by_xpath('//*[@id="username"]').send_keys('id') #发送帐号名 id就是输入你的账号
time.sleep(1)
driver.find_element_by_xpath('//*[@id="password"]').send_keys('key') #发送密码 key就是输入你的密码
time.sleep(1)
咱们跑一下试试~
模拟登录实现账号密码输入
3.滑块登录
本来我们可以通过Xpath找到登录的按钮,.click()就可以,但因为有滑块验证,所以我们模拟鼠标动作进行滑块登录。代码需要导入库。from selenium.webdriverimport ActionChains
然后同样方法,我们先Xpath找到滑块。
滑块Xpath
通用模拟滑块登录的代码:def typeSlide(browser):
browser.implicitly_wait(1)
# 找到滑块
button= browser.find_element_by_xpath('//*[@id="verify-wrap"]/span[1]') #这里的Xpath是刚才复制的
# 实例化一个action对象
action= ActionChains(browser)
action.move_to_element(button).perform()
action.click_and_hold(button).perform()
ActionChains(driver).move_by_offset(xoffset=160, yoffset=0).perform() #160是我们通过实验得到的
typeSlide(driver)
上面滑块登录,的两个参数xoffset,yoffset可以理解为对滑块进行的家里坐标系,x轴数据和Y轴数据,我们先试着挪动滑块,看滑块究竟位移了多少。上图:
测试滑块位移
滑块成功的位移
上图我们可以看到滑块的,最终水平滑动距离160。我们把160赋值给xoffset这个X轴。这样我们就可以模拟出,滑块的一个自动位移,从而验证成功。然后找到登录的Xpath,点击。driver.find_element_by_xpath('//*[@id="fm1"]/div/div[4]/a').click()
三、实现登录
登录:
实现了自动登录
往后会更新网页信息获取等操作。
以上操作的源码:from selenium.webdriverimport ActionChains#Action Chains类常用于模拟鼠标的行为,比如单击,双击,拖拽等行为,
from seleniumimport webdriver#selenium网页工具
import time#时间函数库
driver= webdriver.Chrome()
driver.maximize_window()
driver.get('http://cas.study.yanxiu.jsyxsq.com/auth/login?service=http%3A%2F%2F17lhjgzffz.study.yanxiu.jsyxsq.com%2Fuc%2Findex.htm&renew=true&share=share&isGate=false')
driver.find_element_by_xpath('//*[@id="username"]').send_keys('id') #发送帐号名
time.sleep(1)
driver.find_element_by_xpath('//*[@id="password"]').send_keys('key')
def typeSlide(browser):
browser.implicitly_wait(1)
# 找到滑块
button= browser.find_element_by_xpath('//*[@id="verify-wrap"]/span[1]')
# 实例化一个action对象
action= ActionChains(browser)
action.move_to_element(button).perform()
action.click_and_hold(button).perform()
ActionChains(driver).move_by_offset(xoffset=160, yoffset=0).perform()
typeSlide(driver)
driver.find_element_by_xpath('//*[@id="fm1"]/div/div[4]/a').click()
python已打开页面获取信息_python+selenium实现自动登录网页获取信息(一)相关推荐
- python自动输入账号密码_Python如何基于selenium实现自动登录博客园
这篇文章主要介绍了Python如何基于selenium实现自动登录博客园,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 需要做的准备: 本文章是使用 ...
- python实现自动登录网页版_Python实现自动登录站点
如果我们想要实现自动登录,那么我们就需要能够驱动浏览器(比如谷歌浏览器)来实现操作,ChromeDriver 刚好能够帮助我们这一点(非谷歌浏览器的驱动有所不同). 一.确认软件版本 首先我们需要确认 ...
- python基础教程:Python如何基于selenium实现自动登录博客园
这篇文章主要介绍了Python如何基于selenium实现自动登录博客园,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下 需要做的准备: 本文章是使用 ...
- python+selenium实现自动刷新网页
Selenium是一个用于Web应用程序测试的工具,本文介绍利用python+selenium实现自动刷新网页. 一.安装 selenium pip install selenium 二.下载并导入浏 ...
- selenium 实现自动登录校网(网页版)
文章目录 selenium 实现自动登录校网 1.安装 python3.7 2.安装 selenium 3.安装 chrome 和驱动 4.定时任务 5.实现代码 selenium 实现自动登录校网 ...
- python爬虫 豆瓣影评的爬取cookies实现自动登录账号
python爬虫 豆瓣影评的爬取cookies实现自动登录账号 频繁的登录网页会让豆瓣锁定你的账号-- 网页请求 使用cookies来实现的自动登录账号,这里的cookies因为涉及到账号我屏蔽了,具 ...
- 利用selenium模拟自动登录链家、贝壳、安居客等网站(超级实用,推荐收藏!)
大家好, 今天跟大家分享一个利用selenium模拟自动登录王连某家.an聚客等网站. 文章内容超级实用,尽快在小本本上记录下来哟. 特别说明,以下代码仅用于交流学习,不做其他商业用途,切记切记! 上 ...
- Crawler/ML:爬虫技术(基于urllib.request库从网页获取图片)+HierarchicalClustering层次聚类算法,实现自动从网页获取图片然后根据图片色调自动分类
Crawler/ML:爬虫技术(基于urllib.request库从网页获取图片)+HierarchicalClustering层次聚类算法,实现自动从网页获取图片然后根据图片色调自动分类 目录 一. ...
- python爬取qq群成员_Python selenium 加载并保存QQ群成员,去除其群主、管理员信息的示例代码...
一位伙计自己开了个游戏室,想在群里拉点人,就用所学知识帮帮忙,于是就有了这篇文章,今天小编特此通过实例代码给大家介绍下Python selenium 加载并保存QQ群成员去除其群主.管理员信息的示例代 ...
最新文章
- 八种简易健康减肥瘦身法
- Ubuntu9.10 安装试水
- 在windows 2008/2012中配置RADIUS 客户端计算机上网WiFi 认证
- Max retries exceeded with url 解决方案
- Git安装教程(windows)
- 学会科学饮水令你越喝越美
- javascript实例:路由的跳转
- elementUI给树控件中的节点添加图标
- Distance Dependent Infinite Latent Feature Model 阅读笔记1
- 手机文档转html,手机金山文档怎么转换成Word文档电脑手机?
- sql2000 sp3、sql2000 sp4升级补丁下载和安装须知:
- 中国多接收器电感耦合等离子体质谱仪市场行业产销需求与投资预测分析报告2022-2028年
- dell服务器安装系统加载驱动,DELL服务器使用U盘加载驱动安装Win2003.doc
- Python 基础 - Day 1 Assignment - Three tier menu 三级菜单
- 安卓 APP更新的两种途径
- PBR之IBL和球谐的梳理
- Qualcomm 处理器 Krait架构
- 计算机应用在航天,国产CPU的航天计算机应用
- 点分治 【BZOJ3784】树上路径
- 多线程二死锁,活锁,饿死,阻塞的理解
热门文章
- “掌商工程”让海派盆景与白领互添绿意
- php如何运行vbs文件,HTML_用vbs实现在启动 Windows 资源管理器时打开特定文件夹,my-script.vbs c:\scripts 在文件夹 - phpStudy...
- hMailServer搭建邮件服务器,用自己的域名邮箱,酷一些吧
- linux实现虚拟专用网
- 如何正确地学习Java
- 用Selenium爬取网页简单操作
- 【详解】机器学习库-Matplotlib+Numpy+Pandas
- JNI语法 JNI参考 JNI函数大全
- 火狐浏览器自动加滚动条,如何去除?
- ZK zul中显示纯的HTML代码