python已打开页面获取信息_python+selenium实现自动登录网页获取信息（一）

我用的是一个教师继续教育的网站，进行演示和模拟，网站：http://cas.study.yanxiu.jsyxsq.com/auth/login?service=http%3A%2F%2Fwww.17ahgp.study.yanxiu.jsyxsq.com%2Fuc%2Findex.htm&renew=true&share=share&isGate=false

一、需要的环境

1.python环境，我用的是3.8.2，大家可以百度搜索安装配置。

2.浏览器，我配置的谷歌。要对应chromedriver版本进行下载驱动。详细参考：https://blog.csdn.net/yoyocat915/article/details/80580066

3.安装selenium，Selenium是一个WEB自动化测试工具，它运行时会直接实例化出一个浏览器，完全模拟用户的操作，比如点击链接、输入表单，点击按钮提交等。在cmd中输入pip install selenium ，完成即可。pip install selenium

二、获取模拟登录网站的Xpath和滑块验证

1.用python打开谷歌浏览器，打开网站。from seleniumimport webdriver #selenium网页工具

import time#时间函数库

driver= webdriver.Chrome() #打开谷歌浏览器

driver.maximize_window() #将窗口最大化

driver.get('http://cas.study.yanxiu.jsyxsq.com/auth/loginservice=http%3A%2F%2F17lhjgzffz.study.yanxiu.jsyxsq.com%2Fuc%2Findex.htm&renew=true&share=share&isGate=false') #打开网页

2.打开网站后我们想要自动输入账号密码，F12打开网页的源码。

找到账号的输入地方，然后在源码中，复制它的Xpath。

复制Xpath

密码框也同样操作，Xpth的我的理解就是一种路径。//*[@id="username"] 就是账号框的Xpath，用代码driver.find_element_by_xpath('//*[@id="username"]')，来找这个位置。

接下来通过代码找到输入框输入账号密码。driver.find_element_by_xpath('//*[@id="username"]').send_keys('id') #发送帐号名 id就是输入你的账号

time.sleep(1)

driver.find_element_by_xpath('//*[@id="password"]').send_keys('key') #发送密码 key就是输入你的密码

time.sleep(1)

咱们跑一下试试~

模拟登录实现账号密码输入

3.滑块登录

本来我们可以通过Xpath找到登录的按钮，.click()就可以，但因为有滑块验证，所以我们模拟鼠标动作进行滑块登录。代码需要导入库。from selenium.webdriverimport ActionChains

然后同样方法，我们先Xpath找到滑块。

滑块Xpath

通用模拟滑块登录的代码：def typeSlide(browser):

browser.implicitly_wait(1)

# 找到滑块

button= browser.find_element_by_xpath('//*[@id="verify-wrap"]/span[1]') #这里的Xpath是刚才复制的

# 实例化一个action对象

action= ActionChains(browser)

action.move_to_element(button).perform()

action.click_and_hold(button).perform()

ActionChains(driver).move_by_offset(xoffset=160, yoffset=0).perform() #160是我们通过实验得到的

typeSlide(driver)

上面滑块登录，的两个参数xoffset，yoffset可以理解为对滑块进行的家里坐标系，x轴数据和Y轴数据，我们先试着挪动滑块，看滑块究竟位移了多少。上图：

测试滑块位移

滑块成功的位移

上图我们可以看到滑块的，最终水平滑动距离160。我们把160赋值给xoffset这个X轴。这样我们就可以模拟出，滑块的一个自动位移，从而验证成功。然后找到登录的Xpath，点击。driver.find_element_by_xpath('//*[@id="fm1"]/div/div[4]/a').click()

三、实现登录

实现了自动登录

往后会更新网页信息获取等操作。

以上操作的源码：from selenium.webdriverimport ActionChains#Action Chains类常用于模拟鼠标的行为，比如单击，双击，拖拽等行为，

from seleniumimport webdriver#selenium网页工具

import time#时间函数库

driver= webdriver.Chrome()

driver.maximize_window()

driver.get('http://cas.study.yanxiu.jsyxsq.com/auth/login?service=http%3A%2F%2F17lhjgzffz.study.yanxiu.jsyxsq.com%2Fuc%2Findex.htm&renew=true&share=share&isGate=false')

driver.find_element_by_xpath('//*[@id="username"]').send_keys('id') #发送帐号名

time.sleep(1)

driver.find_element_by_xpath('//*[@id="password"]').send_keys('key')

def typeSlide(browser):

browser.implicitly_wait(1)

# 找到滑块

button= browser.find_element_by_xpath('//*[@id="verify-wrap"]/span[1]')

# 实例化一个action对象

action= ActionChains(browser)

action.move_to_element(button).perform()

action.click_and_hold(button).perform()

ActionChains(driver).move_by_offset(xoffset=160, yoffset=0).perform()

typeSlide(driver)

driver.find_element_by_xpath('//*[@id="fm1"]/div/div[4]/a').click()

python已打开页面获取信息_python+selenium实现自动登录网页获取信息（一）相关推荐

python自动输入账号密码_Python如何基于selenium实现自动登录博客园
这篇文章主要介绍了Python如何基于selenium实现自动登录博客园,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下需要做的准备: 本文章是使用 ...
python实现自动登录网页版_Python实现自动登录站点
如果我们想要实现自动登录,那么我们就需要能够驱动浏览器(比如谷歌浏览器)来实现操作,ChromeDriver 刚好能够帮助我们这一点(非谷歌浏览器的驱动有所不同). 一.确认软件版本首先我们需要确认 ...
python基础教程：Python如何基于selenium实现自动登录博客园
这篇文章主要介绍了Python如何基于selenium实现自动登录博客园,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下需要做的准备: 本文章是使用 ...
python+selenium实现自动刷新网页
Selenium是一个用于Web应用程序测试的工具,本文介绍利用python+selenium实现自动刷新网页. 一.安装 selenium pip install selenium 二.下载并导入浏 ...
selenium 实现自动登录校网（网页版）
文章目录 selenium 实现自动登录校网 1.安装 python3.7 2.安装 selenium 3.安装 chrome 和驱动 4.定时任务 5.实现代码 selenium 实现自动登录校网 ...
python爬虫豆瓣影评的爬取cookies实现自动登录账号
python爬虫豆瓣影评的爬取cookies实现自动登录账号频繁的登录网页会让豆瓣锁定你的账号-- 网页请求使用cookies来实现的自动登录账号,这里的cookies因为涉及到账号我屏蔽了,具 ...
利用selenium模拟自动登录链家、贝壳、安居客等网站（超级实用，推荐收藏！）
大家好, 今天跟大家分享一个利用selenium模拟自动登录王连某家.an聚客等网站. 文章内容超级实用,尽快在小本本上记录下来哟. 特别说明,以下代码仅用于交流学习,不做其他商业用途,切记切记! 上 ...
Crawler/ML：爬虫技术(基于urllib.request库从网页获取图片)+HierarchicalClustering层次聚类算法，实现自动从网页获取图片然后根据图片色调自动分类
Crawler/ML:爬虫技术(基于urllib.request库从网页获取图片)+HierarchicalClustering层次聚类算法,实现自动从网页获取图片然后根据图片色调自动分类目录一. ...
python爬取qq群成员_Python selenium 加载并保存QQ群成员,去除其群主、管理员信息的示例代码...
一位伙计自己开了个游戏室,想在群里拉点人,就用所学知识帮帮忙,于是就有了这篇文章,今天小编特此通过实例代码给大家介绍下Python selenium 加载并保存QQ群成员去除其群主.管理员信息的示例代 ...

python已打开页面获取信息_python+selenium实现自动登录网页获取信息（一）

python已打开页面获取信息_python+selenium实现自动登录网页获取信息（一）相关推荐

最新文章

热门文章