python验证码_Python验证码登录(Tesseract安装配置)
1.安装py库:pytesseract,PIL
pip install pytesseract
pip install PILLOW
如果安装时,出现权限不足:
pip install --user pytesseract
pip install --user PILLOW
2.tesseract程序下载安装
2.2 环境变量配置
用户变量,系统变量都添加:PATH C:\Program Files (x86)\Tesseract-OCR; //这是tesseract的安装目录
系统变量添加:TESSDATA_PREFIX C:\Program Files (x86)\Tesseract-OCR
//有的博文写到“TESSDATA_PREFIX”目录需要到tessdata,但是我电脑配置到tessdata就会多一级tessdata目录,命令测试时会找不到,所以这里自己依据调试哪个OK用哪个~
2.3 验证是否安装/配置成功
在需识别的图片目录下执行命令:tesseract test.png output_1 –l eng
test.png:徐识别的文件
output_1:识别后存入的文件名(默认txt格式)
-l eng:语言包 英文
3.pycharm验证码登录
验证码图片清晰,不去需要背景去噪(干扰线),转换为灰度图
# 验证码登录
import time
from PIL import ImageEnhance
from selenium import webdriver
# 避免出现系统错误:[WinError 2] 系统找不到指定的文件
try:
import Image
except ImportError:
from PIL import Image
import pytesseract
pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'
# 打开浏览器
url = "http://XXX.XX.XX.XX:XXX/SPMTest/login.html"
browser = webdriver.Chrome()
browser.implicitly_wait(10)
browser.maximize_window()
browser.get(url)
# 用户元素
userElement = browser.find_element_by_id("loginname")
passElement = browser.find_element_by_id("password1")
codeElement = browser.find_element_by_id("code")
lgButton = browser.find_element_by_id("login_value")
# 验证码截取+识别(页面验证码地址不是固定连接,所以采用截图方式)
# 截取屏幕内容,保存到本地
browser.save_screenshot("D://PyDemo/01.png")
# 打开截图,获取验证码位置,截取保存验证码
ran = Image.open("D://PyDemo/01.png")
box = (1165, 380, 1240, 415) # 获取验证码位置,手动定位(左,上,右,下)--验证码图片的绝对定位
ran.crop(box).save("D://PyDemo/02.png")
# 获取验证码图片,读取验证码
code = pytesseract.image_to_string(Image.open('D://PyDemo/02.png'))
print(code)
# 输入数据登录
userElement.send_keys('tt')
passElement.send_keys('1234')
codeElement.send_keys(code)
time.sleep(3)
lgButton.click()
记录下,这个系统的登录脚本,特殊情况~(场景:密码输入框有两个id处理.....)
python验证码_Python验证码登录(Tesseract安装配置)相关推荐
- python开发环境的安装与配置_Python开发环境的安装配置
要学习Python,我们首先要安装配置好Python的运行环境. 那么安装Python 2 还是 Python 3 呢? 当然是要选择Python 3 .这里来教大家安装稳定版Python3 的版本是 ...
- python 3.7.0如何使用_python 3.7.0 安装配置方法图文教程
本文记录了python 3.7.0 安装配置方法,供大家参考,具体内容如下 S1登入Python官网下载网址 S2下载后缀为exe的可执行文件,并根据自己电脑/主机的系统选择32位还是64位. 双击选 ...
- Python学习笔记一简介及安装配置
Python学习笔记一 参考教程:廖雪峰官网https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e54 ...
- python爬虫scrapy安装_零基础写python爬虫之爬虫框架Scrapy安装配置
前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识, 用来解决简单的贴吧下载,绩点运算自然不在话下. 不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点. 于是乎,爬虫 ...
- 安装python3.7.0的步骤_python 3.7.0 安装配置方法图文教程
本文记录了python 3.7.0 安装配置方法,供大家参考,具体内容如下 s1登入python官网 s2下载后缀为exe的可执行文件,并根据自己电脑/主机的系统选择32位还是64位. 双击选择&qu ...
- atom配置python环境_Python编程:用VScode配置Python开发环境
前言 VScode是一个相当优秀的IDE,具备开源.跨平台.模块化.插件丰富.启动时间快.颜值高.可高度定制等等优秀的特质,不愧是微软爸爸的私生子.所以用VScode来编写Python,也是相当的好用 ...
- pythonscrapy爬虫安装_零基础写python爬虫之爬虫框架Scrapy安装配置
前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识, 用来解决简单的贴吧下载,绩点运算自然不在话下. 不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点. 于是乎,爬虫 ...
- python环境搭建和pycharm的安装配置及汉化(零基础小白版)
前言:写这篇文章主要是介绍一下python的环境搭建和pycharm的安装配置,适合零基础的同学观看.这篇文章你会学到python的环境搭建和python比较好用的IDE pycharm的安装与基础配 ...
- python 识别图形验证码_Python验证码识别
大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...
最新文章
- windows和linux主机名,windows和linux下如何远程获取操作系统版本和主机名
- mac上配置mysql与redis server,并结合Pydev准备某爬虫环境
- 【刷题】BZOJ 1023 [SHOI2008]cactus仙人掌图
- 开发工具Charles for Mac(信息抓取) v4.6.3b1
- openvswitch安装、基本操作
- [Windows] 【黑科技】在线视频一键下载器:无尽一键视频下载v0.2主流视频网站想下就下...
- 使用Rider和Emmylua进行UnLua配置
- Markdown常用字体 大小 颜色和背景设置
- des加密 php7.1,php实现des加密
- 东南大学计算机学院分数线,2017年东南大学录取分数线
- Java 中获取Exception的详细信息
- 面向金融的R语言_L3
- android曲面屏点击事件无响应,都说曲面屏中看不中用,主要原因有四点,第三点是关键!...
- 《富爸爸穷爸爸》书摘-富爸爸穷爸爸
- Python Java 滑块识别-通杀滑块
- oracle10g centos 安装,Centos下静默安装oracle10g
- 检测网页是否打开开发者工具(检测F12)
- 电脑计算器所有快捷键
- iconfont阿里图标引入不生效的解决方法,三种引入方式详细步骤。
- 论信息系统项目的需求管理
热门文章
- matlab数组元素对应相减,MATLAB下矩阵的运算 看完你就知道了
- .mb是什么文件_神经网络长什么样不知道? 这有一份简单的 pytorch可视化技巧(1)
- 2019-10-14 无约束条件的泛函极值问题的举例说明
- ASP.NET Web API中展示实体Link相关的方面
- Linear_algebra_02_行列式
- CDQ 分治算法模板
- Python学习之路:内置函数
- [分享]运维分享一一阿里云linux系统mysql密码修改脚本
- chapter16 计算机体系结构基础
- 怎么查看端口占用情况?