在很久之前,分享过一次Python代码实现验证码识别的办法。

当时采用的是pillow+pytesseract,优点是免费,较为易用。但其识别精度一般,若想要更高要求的验证码识别,初学者就只能去选择使用百度API接口了。

但其实百度API接口和pytesseract其实都需要进行前期配置,对于初学者来说就不太友好了。

而且百度API必须要联网,对于某些机器不能联网的朋友而言,就得pass了

最近群里有位群友分享了一个新库,试用一下发现非常实用,特意今天分享给大家。

Github地址:https://github.com/sml2h3/ddddocr

该库名也是非常有趣 —— ddddocr(谐音带带弟弟OCR)

环境要求

python >= 3.8
Windows/Linux/Macox..

可以通过以下命令安装

pip install ddddocr

参数说明

在网上随机寻找了一个验证码图片,使用这个库来实战一下。

来源:百度搜索
import ddddocrocr = ddddocr.DdddOcr()
with open('1.png', 'rb') as f:img_bytes = f.read()
res = ocr.classification(img_bytes)print(res)

成功识别出来了验证码文字!

而且优点也非常明显:首先代码非常精简,对比前文提到的两种方法,不需要额外设置环境变量等等,5行代码即可轻松识别验证码图片。另一方面,我们使用魔法命令%%time也测试出来吗,这段代码识别速度非常快。

下面用更多的验证码图片继续测试:

我又找了6个验证码图片来测试,观察结果,发现这类简单的验证码基本可以进行快速识别。但也有部分结果有问题——字母大小写没有进行区分(比如第6张图片)。

总而言之,如果你需要进行验证码识别,且对精度要求不是过高。

那么,带带弟弟OCR(ddddocr)这个库是一个不错的选择~

——END——

最近发现一个点外卖每顿饭都能少花5-20元的宝藏号。

就是她,↓点击下面名片关注公众号↓

进入公众号点击菜单领取红包最低5元,最高56元!

5行Python实现验证码识别,太稳了!相关推荐

  1. 5行Python实现验证码识别,太稳了

    很久之前,分享过一次Python代码实现验证码识别的办法. 当时采用的是pillow+pytesseract,优点是免费,较为易用.但其识别精度一般,若想要更高要求的验证码识别,初学者就只能去选择使用 ...

  2. 6行Python实现验证码识别,太稳了!

    之前有个爬虫需求,但每次请求都需要进行验证码识别,故需要ocr识别,推荐一个Python免费的验证码识别-ddddocr(谐音带带弟弟OCR) 安装 pip install ddddocr -i ht ...

  3. 毕业设计 - 题目:基于python的验证码识别 - 机器视觉 验证码识别

    文章目录 0 前言 1 项目简介 2 验证码识别步骤 2.1 灰度处理&二值化 2.2 去除边框 2.3 图像降噪 2.4 字符切割 2.5 识别 3 基于tensorflow的验证码识别 3 ...

  4. 基于Python的验证码识别技术

    基于Python的验证码识别技术 作者:强哥 概述 前言 准备工作 识别原理 图像处理 切割图像 人工标注 训练数据 检测结果 搞笑一刻 福利一刻 推荐阅读 前言 很多网站登录都需要输入验证码,如果要 ...

  5. 关于利用python进行验证码识别的一些想法

    关于利用python进行验证码识别的一些想法 - 小五义 - 博客园 关于利用python进行验证码识别的一些想法 转载请注明:@小五义http://www.cnblogs.com/xiaowuyi ...

  6. python 实现验证码识别

    python 实现验证码识别 环境安装 1.1 python安装(此处不详细介绍,自行百度) 1.2 安装Tesseract-OCR 第一步:依赖安装 第二步:下载安装Leptonica 第三步: 下 ...

  7. 基于python的验证码识别

    基于python的验证码识别 在利用python对一些网站进行批量操作的时候,验证码是个绕不过去的东西,虽然现在网上有很多图像识别的api,但是可能不适用于你的项目,我为了批量爬取班上同学的学分绩点写 ...

  8. 五行Python实现验证码识别,太稳了

    大家好 在很久之前,分享过一次Python代码实现验证码识别的办法. 当时采用的是pillow+pytesseract,优点是免费,较为易用.但其识别精度一般,若想要更高要求的验证码识别,初学者就只能 ...

  9. python selenium 验证码识别_Python网络爬虫之如何用代码识别图片验证码

    验证码 当我们在爬取某些网站的时候,对于一些频繁请求,网站会识别你是机器还是人.如果是机器,直接不允许你访问这个网站了,直接返回404或者禁止访问. 最常见的方式就是验证码.验证码的主要功能就是区分当 ...

最新文章

  1. R语言optim函数进行函数优化实战(和lm函数进行对比)
  2. 用Go语言建立一个简单的区块链part3:持久化和命令行接口
  3. 业界首个高性能交互式自动标注工具EISeg正式开源,跨越式提升你的标注体验...
  4. (*长期更新)软考网络工程师学习笔记——Section 15 无线网络技术
  5. delphi7存取配置文件与sqlserver数据库连接_Delphi7存取配置文件与SQLServer数据库连接...
  6. 08.15《CEP职业发展规划课》
  7. Mybatis中resultMap
  8. c语言dfs算法全排列代码,c语言dfs解决全排列问题
  9. python判断某一天是周几
  10. 它又又又来了,Fastjson 最新高危漏洞来袭!快升级吧
  11. 计算机编辑文档教程,word文档怎么编辑pdf的教程
  12. CAD图纸一键共享,永久轻松办公!
  13. 麦当劳中国首个IT战略研发中心在南京启用;大食代积极布局中国西南市场 | 美通企业日报...
  14. 解决同一办公环境局域网下无法添加打印机的情况
  15. 陈顼oracle,一次视图合并引起的性能问题
  16. 输入一个三位数,如果是水仙花数,输出YES,否则的话,输出NO;
  17. 小程序前景无限,还能一键转换成App?
  18. linux 下打开png文件,png文件扩展名,png文件怎么打开?
  19. 无能狂怒之我对配置类一无所知之自动填充和分页
  20. go语言自动化编写word

热门文章

  1. 高并发设计方案二(秒杀架构)
  2. 在Linux环境下mysql的root密码忘记解决方法(三种)
  3. Docker与虚拟机
  4. Linux的Nginx四:功能|模块
  5. ansa打开catia文件_关于CATIA文件格式的那些事儿
  6. python 中cookie_使用Python分析Cookies
  7. python文件输出中文_【python】中文的输出,打印,文件编码问题解决方法
  8. linux ls使用方法,Linux/Ubuntu ls命令详解使用格式和方法
  9. 正则表达式:密码中至少包含大写字母、小写字母、数字、特殊字符等字符中的2种或3种
  10. tdd干扰波形_LTE常见干扰排查(中国移动)