Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字

  • Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字
    • 以下是代码实现,

Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字

利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字。首先需注册获取 API 调用的 ID 和 key,步骤如下:

打开百度AI开放平台,进入控制台中的文字识别应用(需要有百度账号)。

创建一个应用,并进入管理应用,记下 AppID, API Key, Secrect Key,调用 API需用到。

最后安装 python 的百度ai接口的的库
pip install baidu-aip

**

以下是代码实现,

【注意】需将所有识别的图片放进名为 picture 的文件夹。

**

#!/usr/bin/env python
# -*- coding = utf-8 -*-"""
Created on Tue Jun 12 09:37:38 2018
利用百度api实现图片文本识别
@author: XnCSD
"""import glob
from os import path
import os
from aip import AipOcr
from PIL import Imagedef convertimg(picfile, outdir):'''调整图片大小,对于过大的图片进行压缩picfile:    图片路径outdir:    图片输出路径'''img = Image.open(picfile)width, height = img.sizewhile (width * height > 4000000):  # 该数值压缩后的图片大约 两百多kwidth = width // 2height = height // 2new_img = img.resize((width, height), Image.BILINEAR)new_img.save(path.join(outdir, os.path.basename(picfile)))def baiduOCR(picfile, outfile):"""利用百度api识别文本,并保存提取的文字picfile:    图片文件名outfile:    输出文件"""filename = path.basename(picfile)APP_ID = '******'  # 刚刚注册获取的 ID,下同API_KEY = '******'SECRECT_KEY = '******'client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)i = open(picfile, 'rb')img = i.read()print("正在识别图片:\t" + filename)message = client.basicGeneral(img)  # 通用文字识别,每天 50 000 次免费# message = client.basicAccurate(img)   # 通用文字高精度识别,每天 800 次免费print("识别成功!")i.close();with open(outfile, 'a+') as fo:fo.writelines("+" * 60 + '\n')fo.writelines("识别图片:\t" + filename + "\n" * 2)fo.writelines("文本内容:\n")# 输出文本内容for text in message.get('words_result'):fo.writelines(text.get('words') + '\n')fo.writelines('\n' * 2)print("文本导出成功!")print()if __name__ == "__main__":outfile = 'export.txt'outdir = 'tmp'if path.exists(outfile):os.remove(outfile)if not path.exists(outdir):os.mkdir(outdir)print("压缩过大的图片...")for picfile in glob.glob("picture/*"):convertimg(picfile, outdir)print("图片识别...")for picfile in glob.glob("tmp/*"):baiduOCR(picfile, outfile)os.remove(picfile)print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile)os.removedirs(outdir)

Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字相关推荐

  1. Python 利用百度文字识别 API 识别并提取图片中文字

    Python 利用百度文字识别 API 识别并提取图片中文字 利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字.首先需注册获取 API 调用的 ID 和 key,步骤如下: ...

  2. python几行代码识别验证码_Python有多强?文字识别(验证码识别)只需三行代码!...

    不要说这都是在借用其它语言的代码,其实这些东西真的无关紧要.何为Python高级语言,黑猫白猫能捉到老鼠的就是好猫!如果真的有那么高冷,那么任何程序你都要敲代码而不用任何模块? 再开个玩笑,要不用0和 ...

  3. 利用百度ocr识别验证码

    前言: tesserocr是很早的一款OCR文字识别技术,就现在来说可能有点老. CODE: from aip import AipOcr from PIL import Image import c ...

  4. python(自动化)利用selenium+百度ocr文字识别验证码实现自动登陆登陆CET-四级报名系统

    操作步骤: 1:登陆打开CET-考试系统 2:填写相关登陆信息 3:调用百度ocr实现文字验证码识别 4:实现登陆 如何使用和调用百度ocr文字识别接口 1:进入百度AI开发平台:链接 2:在页面上选 ...

  5. python 利用百度AI实现文字识别(cv2 + aip module)

    python 利用百度AI实现文字识别(cv2 + aip module) (该案例将利用cv2,aip等模块,详细的安装以及使用的方法将在后文进行简单的介绍.) 一.KNN算法的简介(机器学习算法之 ...

  6. python利用百度云接口实现文字OCR功能

    python利用百度云接口实现文字OCR功能 1. 前言 在日常生活中有时我们需要从图片中获取文字,虽然QQ上面已经有了相关的功能,但是出于学习的目的,我打算利用百度智能云的文字OCR接口来实现OCR ...

  7. Python利用百度AI提取图片中的文字信息

    Python利用百度AI提取图片中的文字信息 安装百度AI : pip install baidu-aip 到https://console.bce.baidu.com/ai/创建文字识别应用,获取A ...

  8. python调用百度AI识别文字和表格

    python调用百度AI识别文字和表格 获取账户信息 1.需要先注册百度AI,获得ID和密钥.百度AI社区关于注册的详细说明:https://ai.baidu.com/forum/topic/show ...

  9. python调用qq识别图片文字_Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解...

    百度OCR体验地址: 腾讯OCR体验地址: 测试结果是:腾讯的效果要比百度的好 腾讯云目前额度是: 每个接口 1,000次/月免费,有6个文字识别的接口,一共是6,000次/月 百度接口调用之前写过文 ...

最新文章

  1. opencv源码解析之(6):hog源码分析
  2. How to mannuly configure vmtools in VM-Ware?
  3. pcm 采样率转换_44.1KHz够用吗?我们是否需要更高的采样率?
  4. WebFlux基础之响应式编程
  5. Linux上压缩目录以及目录下的所有文件
  6. N 年沉淀,腾讯这套系统终于开源!
  7. P3435 [POI2006]OKR-Periods of Words kmp + fail指针
  8. 树莓派入门教程 - 0 - 准备篇 - 0.4 树莓派安装FTP服务器
  9. 属于服务器端运行的程序_服务器端编程Java 引起人们的注意很大程度上始于 applet...
  10. linux版百度导航软件,百度导航2019新版
  11. BUUCTF Cipher writeup
  12. OUC2021秋-数值分析-期末(回忆版)
  13. 2022年湖南省自考考试学前特殊儿童教育练习题及答案
  14. 【机器学习线性代数】17 利用SVD进行彩色图片压缩
  15. 期货基本面分析:,马来西亚10月1-10日棕榈油出口量较上月同期下降17.3%,但对中国出口创一年新高
  16. 计算机技术在医学领域的运用,计算机在医疗系统中的应用
  17. js实现用户输入年月份,判断是否为闰年,该月份有多少天
  18. linux内存管理之 ION 内存管理器浅析Ⅰ(system heap)
  19. 关于Axure-9组合交互内联框架问题
  20. 解决IDEA报错:Could not find resource mybatis-config.xml

热门文章

  1. 小青柑的功效与作用以及不适人群
  2. 字符串上的动态规划算法--------单字符串的情况
  3. vue-tsc --noEmit导致打包报TS类型错误
  4. 2000w播放冲上B站热门,UP主、品牌跟风二创席卷B站
  5. 有关于simulink无法打开slx:错误使用open(line 162) no such file or directory
  6. Linux文件查找与tar包管理、企业级sed应用 软件包管理与编译安装httpd
  7. 曝光机与曝光能量_亚微米i线投影曝光机曝光能量积分和快门控制系统
  8. 基于vue-router vuex+Element ui+echarts+axios +mysql的后台管理系统
  9. vue打包不生成dist文件夹(IDEA使用命令行npm run build命令打包)
  10. 张飞比关羽还能打?一位酷爱三国的日本程序员,用NLP分析了武将们的战斗力...