准备工作

1、下载OCR识别库tesseract ,下载地址:https://digi.bib.uni-mannheim.de/tesseract/,根据自己的系统选择合适的版本。

2、下载完成后执行安装,记录下自己的安装位置,我的默认安装路径是 “C:\Program Files\Tesseract-OCR\”

3、配置操作系统的环境变量,分为两步:

修改Path变量,新增 tesseract 的安装路径,如“C:\Program Files\Tesseract-OCR\”

新增环境变量“TESSDATA_PREFIX”,值为“C:\Program Files\Tesseract-OCR\tessdata”

4、修改当前用户python临时环境变量中的pytesseract.py文件,这个文件每个用户的保存位置不同,可以使用搜索工具,查找 pytesseract.py文件,我的这个文件是“C:\Users\xxxxxxx\AppData\Local\Packages\PythonSoftwareFoundation.Python.3.9_qbz5n2kfra8p0\LocalCache\local-packages\Python39\site-packages\pytesseract\pytesseract.py”,修改文件的第30行,原来写的是:

tesseract_cmd = 'tesseract'

修改为:

tesseract_cmd = r'C:\\Program Files\\Tesseract-OCR\\tesseract.exe'

修改完之后保存。

准备工作完成后,就可以愉快的编写二维码的识别文件了,本人代码如下参考:

import requests
from PIL import Image
import pytesseracturl_verfircode = "http://xxxxxxxxxxxxx/verifycode"res  = requests.get(url=url_verfircode).content
with open('verifycode.gif','wb') as v: #保存二维码图片到本地同目录下v.write(res)image = Image.open('verifycode.gif')
#image.show() #查看原始图片
image = image.convert('L') #转化为灰度图
#image.show() #查看转化成灰度图的图片
threshold = 140 #设定的二值化阈值
table = [] #table是设定的一个表,下面的for循环可以理解为一个规则,小于阈值的,就设定为0,大于阈值的,就设定为1
for i in range(256):if i < threshold:table.append(0)else:table.append(1)
image = image.point(table,'1') #对灰度图进行二值化处理,按照table的规则(也就是上面的for循环)
image.show()text = pytesseract.image_to_string(image)
print(text)

python3识别简单验证码相关推荐

  1. 一种识别简单验证码的方法

    本文主要讲述了一种识别简单验证码的方法,本文重点不是识别这些简单的数字,而是通过识别数字这个过程理解到图片的数字构造.任何一张图片都是由三个图层构成的,每个图层是一张二维矩阵表,三张表上位置相同的三个 ...

  2. python识别中文验证码_Python识别简单验证码

    12.1 更新 已经有完整的代码了 ======================================= 新手, 多多指教 大概思路: 1. 转换图片为黑白, 2. 去除干扰, 3. 切割, ...

  3. Python3 识别图片验证码的步骤

    注:需要导入 PIL中的Image和ImageEnhance.pytesseract 处理思路: 1.进入登录页,使用截图功能将当前页面截图 2.定位验证码位置 3.获取验证码x,y坐标轴 4.获取验 ...

  4. 使用pytesseract识别简单验证码

    from PIL import Image import pytesseract from pytesseract import *rep={'O':'0', #替换列表'I':'1','L':'1' ...

  5. python识别中文验证码_Python实现验证码识别

    大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...

  6. python语音验证码识别_python验证码自动识别

    在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验证码,识别 ...

  7. python 识别图形验证码_Python验证码识别

    大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...

  8. python语音验证码识别_Python验证码识别

    大致介绍 在python爬虫爬取某些网站的验证码的时候可能会遇到验证码识别的问题,现在的验证码大多分为四类: 1.计算验证码 2.滑块验证码 3.识图验证码 4.语音验证码 这篇博客主要写的就是识图验 ...

  9. 基于TensorFlow的简单验证码识别

    TensorFlow 可以用来实现验证码识别的过程,这里识别的验证码是图形验证码,首先用标注好的数据来训练一个模型,然后再用模型来实现这个验证码的识别. 生成验证码 首先生成验证码,这里使用 Pyth ...

最新文章

  1. Android进程保活方案
  2. [论文阅读][ICP变种] Generalized-ICP
  3. 数据随机丢失情况下多传感器多速率鲁棒融合估计
  4. APIcloud启动页
  5. 使用JRTPLIB收发RTP数据包
  6. 图像处理笔记2-直方图与直方图均衡化histogram equalization
  7. 计算机换算单位 gb,gb和mb的换算-KB,MB,GB之间的换算关系
  8. ​​​​​​​Carryon 数数字
  9. 二代神经计算棒NCS2+YOLOv3+ROS加速目标检测
  10. 3229: 硬币组合
  11. 阿里云七天训练营学习(4):服务器管理软件(putty、ccaa)
  12. 【题解】Cutting Woods
  13. LPC1768 PWM1输出PWM示例
  14. 大学计算机长文档排版教学视频教程,大学计算机基础中Word长文档排版的教学思考...
  15. Python实现消息发送
  16. 互联网晚报 | 11月8日 星期一 | 美团外卖公开“订单分配”算法规则;英雄联盟首部动画剧集上线;神舟十三号航天员首次出舱...
  17. B. Alyona and a Narrow Fridge 【 思维题 】
  18. linux C 遍历目录及其子目录 opendir -> readdir -> closedir
  19. C++循环语句之在0-1000之间找出水仙花数。
  20. 计算机操作系统 (第四版汤小丹老师) 复习笔记第一章

热门文章

  1. 小黄鸟抓包京东APPCK
  2. 启动Spring项目报错,Springboot启动报错 Disconnected from the target VM 解决过程
  3. DNS 区域传送漏洞(dns-zone-tranfer)学习
  4. 力扣题 <爬楼梯> 递归结合表
  5. iOS8.0 使用Photos.framework对相册的常用操作
  6. 查询计算机u盘记录时间,怎么通过系统日志查看u盘的拔出时间
  7. H5+echarts模拟全国程序员可视化大数据【附完整源码】
  8. IOS视频分解图片、图片合成视频
  9. 电信“青年一派”电话卡【沉默停机】解决方法
  10. android圆角glide,Glide加载圆角图片的方法