selenium模拟登陆拉勾网
初学selenium,尝试了一下模拟登录拉勾网,感觉还挺好玩的
就剩下最后的验证码不会处理了。。。
思路就是在网页代码中找到对应的框的属性进行查询,然后点击、输入就进行了。
之后就会看到Chrome弹出来自动完成一系列动作,感觉很有意思:
开代码:
from selenium import webdriverurl = "https://www.lagou.com/"#拉勾网首页urldriver = webdriver.Chrome()#选择Chrome浏览器
driver.get(url)
driver.implicitly_wait(15)button_1 = driver.find_element_by_xpath('//*[@id="cboxClose"]')#开始会蹦出来一个选择地区的框,把他关闭
button_1.click()#自动点击弹出来的框右上角的叉号#点击页面右上角的登录按钮
button_2 = driver.find_element_by_xpath('//*[@id="lg_tbar"]/div/ul/li[1]/a')
button_2.click()#登陆后,会变页面,同时url也会改变
url_1 = driver.current_url#获取翻新页面后的urldriver.get(url_1)#获取页面
driver.implicitly_wait(10)#设置加载时间#选择账号,密码框输入账号密码
input_1 = driver.find_element_by_xpath('/html/body/section/div[2]/div[1]/div[2]/form/div[1]/input')
input_1.send_keys('python')input_2 = driver.find_element_by_xpath('/html/body/section/div[2]/div[1]/div[2]/form/div[2]/input')
input_2.send_keys('python')#点击登录框,完成登录
button_3 = driver.find_element_by_xpath('/html/body/section/div[2]/div[1]/div[2]/form/div[5]/input')
button_3.click()#验证码还有待学习。。。。。。。。。。
selenium模拟登陆拉勾网相关推荐
- selenium模拟登陆豆瓣并获取cookies
验证码处理与模拟登陆豆瓣,首先我们看到豆瓣没有cookies,我们需要用程序来模拟登陆获取cookies(当前有些情况下自己手动登陆后复制粘贴cookies也能登陆),该文主要讲方法,如何用selen ...
- 爬取知乎壁纸:selenium模拟登陆获取cookies,再将cookies传递给requests
selenium很好用,但是爬取大量数据时速度较慢. 通过selenium模拟登陆,获取cookies,再将cookies传递给requests,通过requests爬取加快速度. 以为知乎网爬取壁纸 ...
- selenium模拟登陆淘宝遇到的问题及解决
今天忽然想用爬虫登陆淘宝,于是就试着写一下, 我是用selenium模拟登陆,我先是打开淘宝登陆页面发现淘宝的登陆界面是这样的 我就用代码写了一个模拟登陆:如下这是最终代码 import time f ...
- java使用Selenium模拟登陆58(验证码登陆密码登陆)若快平台识别文字点击验证码
文章目录 写在前面 配置环境 Selenium入门 使用Selenium登陆58 若快平台识别文字点击验证码 附: By对象中的 xpath & cssSelector获取方式** 不打开浏览 ...
- selenium模拟登陆时截取验证码
模拟登陆时,经常会遇到有验证码的问题,那么就需要把验证码给截取下来. 如下为截取验证码程序,该程序的原始地址为:http://www.cnblogs.com/donaldlee2008/p/53045 ...
- selenium模拟登陆豆瓣网
前言 随着网站安全做的越来越好,不少网站,直接去爬取数据是无法爬出来的,必须要验证登陆,即登陆之后才能做后面的操作,因此需要解决的第一步就是登陆 登陆的常用方式: 1.使用request库,模拟pos ...
- selenium模拟登陆之截屏验证码位置跑偏
在用selenium做爬虫的模拟登陆时遇到验证码图片截取下来的和目标区域的图片不匹配 截到的: 目标是这样的: 明显坐标写的不对,导致截屏区域不是验证码的区域. 只能一步一步取修改坐标,来确定具体的图 ...
- selenium模拟登陆教务系统
之前学习了selenium的安装和上手,现在来一次模拟登陆教务系统.有基础的同学可以直接拿走代码,去写抢课的脚本,但是估计效果不会蛮好.登陆页面如下 解除右键禁用 当然在此之前因为这个教务系统网站不能 ...
- python实例豆瓣代码_Python实例:通过selenium模拟登陆豆瓣
前几天写的<Python实例:分析豆瓣影片评论Ver 1.0版本>文章中,关于爬取数据过频繁导致IP被封禁的事情让我对豆瓣数据的爬取中断了.忽然想到之前有写过关于关于使用selenium库 ...
- selenium 模拟登陆 古诗文网 含验证码
ocr.py / 阿里云市场 import base64 import json import urllib.request from urllib import parse import ssl s ...
最新文章
- Hadoop集群搭建(四:Zookeeper环境安装)
- GEO/SRA数据库
- 为什么说GAN很快就要替代现有摄影技术了?
- vccode运行调试python_VSCODE安装以及使用Python运行调试代码的简单记录
- Lady Layton with Math(杜教筛)
- 数据挖掘应用实战-一文教你如何全面分析股市数据特征
- drupal 迁移_关于如何迁移到Drupal的4个技巧
- 微信上线“拍一拍”功能,结果被网友激情吐槽...
- 细胞亚器互作之细胞代谢调节液泡与线粒体的接触位Cellular Metabolism Regulates Contact Sites between Vacuoles and Mitochondria
- 查看服务器文件命令大全,查看服务器文件的命令
- 计算机管理说文件缺失lnk,Win10系统右键管理打不开提示Windows找不到文件Server manager.lnk如何解决...
- 湘潭大学计算机学院考研喜报,湘潭大学化学学院考研率连续七年在全校排名第一...
- Moss到底算不算叛逃?
- shell命令以及运行原理和Linux权限
- 从裸机到嵌入式Linux—总纲
- 商店管理系统的设计与实现
- 遥感数据集Million-AID介绍及数据预处理
- 一种适用于主流工业机器人的简单的码垛算法
- 泸州市的电子计算机学校名称,泸州市电子机械学校 学校图片简介
- 机器学习自学成才的十条戒律