1.安装py库:pytesseract,PIL

pip install pytesseract

pip install PILLOW

如果安装时,出现权限不足:

pip install --user pytesseract

pip install --user PILLOW

2.tesseract程序下载安装

2.2 环境变量配置

用户变量,系统变量都添加:PATH     C:\Program Files (x86)\Tesseract-OCR;    //这是tesseract的安装目录

系统变量添加:TESSDATA_PREFIX    C:\Program Files (x86)\Tesseract-OCR

//有的博文写到“TESSDATA_PREFIX”目录需要到tessdata,但是我电脑配置到tessdata就会多一级tessdata目录,命令测试时会找不到,所以这里自己依据调试哪个OK用哪个~

2.3 验证是否安装/配置成功

在需识别的图片目录下执行命令:tesseract test.png output_1 –l eng

test.png:徐识别的文件

output_1:识别后存入的文件名(默认txt格式)

-l eng:语言包 英文

3.pycharm验证码登录

验证码图片清晰,不去需要背景去噪(干扰线),转换为灰度图

# 验证码登录

import time

from PIL import ImageEnhance

from selenium import webdriver

# 避免出现系统错误:[WinError 2] 系统找不到指定的文件

try:

import Image

except ImportError:

from PIL import Image

import pytesseract

pytesseract.pytesseract.tesseract_cmd = r'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

# 打开浏览器

url = "http://XXX.XX.XX.XX:XXX/SPMTest/login.html"

browser = webdriver.Chrome()

browser.implicitly_wait(10)

browser.maximize_window()

browser.get(url)

# 用户元素

userElement = browser.find_element_by_id("loginname")

passElement = browser.find_element_by_id("password1")

codeElement = browser.find_element_by_id("code")

lgButton = browser.find_element_by_id("login_value")

# 验证码截取+识别(页面验证码地址不是固定连接,所以采用截图方式)

# 截取屏幕内容,保存到本地

browser.save_screenshot("D://PyDemo/01.png")

# 打开截图,获取验证码位置,截取保存验证码

ran = Image.open("D://PyDemo/01.png")

box = (1165, 380, 1240, 415) # 获取验证码位置,手动定位(左,上,右,下)--验证码图片的绝对定位

ran.crop(box).save("D://PyDemo/02.png")

# 获取验证码图片,读取验证码

code = pytesseract.image_to_string(Image.open('D://PyDemo/02.png'))

print(code)

# 输入数据登录

userElement.send_keys('tt')

passElement.send_keys('1234')

codeElement.send_keys(code)

time.sleep(3)

lgButton.click()

记录下,这个系统的登录脚本,特殊情况~(场景:密码输入框有两个id处理.....)

python验证码_Python验证码登录(Tesseract安装配置)相关推荐

  1. python开发环境的安装与配置_Python开发环境的安装配置

    要学习Python,我们首先要安装配置好Python的运行环境. 那么安装Python 2 还是 Python 3 呢? 当然是要选择Python 3 .这里来教大家安装稳定版Python3 的版本是 ...

  2. python 3.7.0如何使用_python 3.7.0 安装配置方法图文教程

    本文记录了python 3.7.0 安装配置方法,供大家参考,具体内容如下 S1登入Python官网下载网址 S2下载后缀为exe的可执行文件,并根据自己电脑/主机的系统选择32位还是64位. 双击选 ...

  3. Python学习笔记一简介及安装配置

    Python学习笔记一 参考教程:廖雪峰官网https://www.liaoxuefeng.com/wiki/0014316089557264a6b348958f449949df42a6d3a2e54 ...

  4. python爬虫scrapy安装_零基础写python爬虫之爬虫框架Scrapy安装配置

    前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识, 用来解决简单的贴吧下载,绩点运算自然不在话下. 不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点. 于是乎,爬虫 ...

  5. 安装python3.7.0的步骤_python 3.7.0 安装配置方法图文教程

    本文记录了python 3.7.0 安装配置方法,供大家参考,具体内容如下 s1登入python官网 s2下载后缀为exe的可执行文件,并根据自己电脑/主机的系统选择32位还是64位. 双击选择&qu ...

  6. atom配置python环境_Python编程:用VScode配置Python开发环境

    前言 VScode是一个相当优秀的IDE,具备开源.跨平台.模块化.插件丰富.启动时间快.颜值高.可高度定制等等优秀的特质,不愧是微软爸爸的私生子.所以用VScode来编写Python,也是相当的好用 ...

  7. pythonscrapy爬虫安装_零基础写python爬虫之爬虫框架Scrapy安装配置

    前面十章爬虫笔记陆陆续续记录了一些简单的Python爬虫知识, 用来解决简单的贴吧下载,绩点运算自然不在话下. 不过要想批量下载大量的内容,比如知乎的所有的问答,那便显得游刃不有余了点. 于是乎,爬虫 ...

  8. python环境搭建和pycharm的安装配置及汉化(零基础小白版)

    前言:写这篇文章主要是介绍一下python的环境搭建和pycharm的安装配置,适合零基础的同学观看.这篇文章你会学到python的环境搭建和python比较好用的IDE pycharm的安装与基础配 ...

  9. python 识别图形验证码_Python验证码识别

    大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...

最新文章

  1. windows和linux主机名,windows和linux下如何远程获取操作系统版本和主机名
  2. mac上配置mysql与redis server,并结合Pydev准备某爬虫环境
  3. 【刷题】BZOJ 1023 [SHOI2008]cactus仙人掌图
  4. 开发工具Charles for Mac(信息抓取) v4.6.3b1
  5. openvswitch安装、基本操作
  6. [Windows] 【黑科技】在线视频一键下载器:无尽一键视频下载v0.2主流视频网站想下就下...
  7. 使用Rider和Emmylua进行UnLua配置
  8. Markdown常用字体 大小 颜色和背景设置
  9. des加密 php7.1,php实现des加密
  10. 东南大学计算机学院分数线,2017年东南大学录取分数线
  11. Java 中获取Exception的详细信息
  12. 面向金融的R语言_L3
  13. android曲面屏点击事件无响应,都说曲面屏中看不中用,主要原因有四点,第三点是关键!...
  14. 《富爸爸穷爸爸》书摘-富爸爸穷爸爸
  15. Python Java 滑块识别-通杀滑块
  16. oracle10g centos 安装,Centos下静默安装oracle10g
  17. 检测网页是否打开开发者工具(检测F12)
  18. 电脑计算器所有快捷键
  19. iconfont阿里图标引入不生效的解决方法,三种引入方式详细步骤。
  20. 论信息系统项目的需求管理

热门文章

  1. matlab数组元素对应相减,MATLAB下矩阵的运算 看完你就知道了
  2. .mb是什么文件_神经网络长什么样不知道? 这有一份简单的 pytorch可视化技巧(1)
  3. 2019-10-14 无约束条件的泛函极值问题的举例说明
  4. ASP.NET Web API中展示实体Link相关的方面
  5. Linear_algebra_02_行列式
  6. CDQ 分治算法模板
  7. Python学习之路:内置函数
  8. [分享]运维分享一一阿里云linux系统mysql密码修改脚本
  9. chapter16 计算机体系结构基础
  10. 怎么查看端口占用情况?