Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字
Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字
- Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字
- 以下是代码实现,
Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字
利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字。首先需注册获取 API 调用的 ID 和 key,步骤如下:
打开百度AI开放平台,进入控制台中的文字识别应用(需要有百度账号)。
创建一个应用,并进入管理应用,记下 AppID, API Key, Secrect Key,调用 API需用到。
最后安装 python 的百度ai接口的的库
pip install baidu-aip
**
以下是代码实现,
【注意】需将所有识别的图片放进名为 picture 的文件夹。
**
#!/usr/bin/env python
# -*- coding = utf-8 -*-"""
Created on Tue Jun 12 09:37:38 2018
利用百度api实现图片文本识别
@author: XnCSD
"""import glob
from os import path
import os
from aip import AipOcr
from PIL import Imagedef convertimg(picfile, outdir):'''调整图片大小,对于过大的图片进行压缩picfile: 图片路径outdir: 图片输出路径'''img = Image.open(picfile)width, height = img.sizewhile (width * height > 4000000): # 该数值压缩后的图片大约 两百多kwidth = width // 2height = height // 2new_img = img.resize((width, height), Image.BILINEAR)new_img.save(path.join(outdir, os.path.basename(picfile)))def baiduOCR(picfile, outfile):"""利用百度api识别文本,并保存提取的文字picfile: 图片文件名outfile: 输出文件"""filename = path.basename(picfile)APP_ID = '******' # 刚刚注册获取的 ID,下同API_KEY = '******'SECRECT_KEY = '******'client = AipOcr(APP_ID, API_KEY, SECRECT_KEY)i = open(picfile, 'rb')img = i.read()print("正在识别图片:\t" + filename)message = client.basicGeneral(img) # 通用文字识别,每天 50 000 次免费# message = client.basicAccurate(img) # 通用文字高精度识别,每天 800 次免费print("识别成功!")i.close();with open(outfile, 'a+') as fo:fo.writelines("+" * 60 + '\n')fo.writelines("识别图片:\t" + filename + "\n" * 2)fo.writelines("文本内容:\n")# 输出文本内容for text in message.get('words_result'):fo.writelines(text.get('words') + '\n')fo.writelines('\n' * 2)print("文本导出成功!")print()if __name__ == "__main__":outfile = 'export.txt'outdir = 'tmp'if path.exists(outfile):os.remove(outfile)if not path.exists(outdir):os.mkdir(outdir)print("压缩过大的图片...")for picfile in glob.glob("picture/*"):convertimg(picfile, outdir)print("图片识别...")for picfile in glob.glob("tmp/*"):baiduOCR(picfile, outfile)os.remove(picfile)print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile)os.removedirs(outdir)
Python 利用百度文字识别验证码、文字、图片并提取图片中文字或数字相关推荐
- Python 利用百度文字识别 API 识别并提取图片中文字
Python 利用百度文字识别 API 识别并提取图片中文字 利用百度 AI 开发平台的 OCR 文字识别 API 识别并提取图片中的文字.首先需注册获取 API 调用的 ID 和 key,步骤如下: ...
- python几行代码识别验证码_Python有多强?文字识别(验证码识别)只需三行代码!...
不要说这都是在借用其它语言的代码,其实这些东西真的无关紧要.何为Python高级语言,黑猫白猫能捉到老鼠的就是好猫!如果真的有那么高冷,那么任何程序你都要敲代码而不用任何模块? 再开个玩笑,要不用0和 ...
- 利用百度ocr识别验证码
前言: tesserocr是很早的一款OCR文字识别技术,就现在来说可能有点老. CODE: from aip import AipOcr from PIL import Image import c ...
- python(自动化)利用selenium+百度ocr文字识别验证码实现自动登陆登陆CET-四级报名系统
操作步骤: 1:登陆打开CET-考试系统 2:填写相关登陆信息 3:调用百度ocr实现文字验证码识别 4:实现登陆 如何使用和调用百度ocr文字识别接口 1:进入百度AI开发平台:链接 2:在页面上选 ...
- python 利用百度AI实现文字识别(cv2 + aip module)
python 利用百度AI实现文字识别(cv2 + aip module) (该案例将利用cv2,aip等模块,详细的安装以及使用的方法将在后文进行简单的介绍.) 一.KNN算法的简介(机器学习算法之 ...
- python利用百度云接口实现文字OCR功能
python利用百度云接口实现文字OCR功能 1. 前言 在日常生活中有时我们需要从图片中获取文字,虽然QQ上面已经有了相关的功能,但是出于学习的目的,我打算利用百度智能云的文字OCR接口来实现OCR ...
- Python利用百度AI提取图片中的文字信息
Python利用百度AI提取图片中的文字信息 安装百度AI : pip install baidu-aip 到https://console.bce.baidu.com/ai/创建文字识别应用,获取A ...
- python调用百度AI识别文字和表格
python调用百度AI识别文字和表格 获取账户信息 1.需要先注册百度AI,获得ID和密钥.百度AI社区关于注册的详细说明:https://ai.baidu.com/forum/topic/show ...
- python调用qq识别图片文字_Python3使用腾讯云文字识别(腾讯OCR)提取图片中的文字内容实例详解...
百度OCR体验地址: 腾讯OCR体验地址: 测试结果是:腾讯的效果要比百度的好 腾讯云目前额度是: 每个接口 1,000次/月免费,有6个文字识别的接口,一共是6,000次/月 百度接口调用之前写过文 ...
最新文章
- opencv源码解析之(6):hog源码分析
- How to mannuly configure vmtools in VM-Ware?
- pcm 采样率转换_44.1KHz够用吗?我们是否需要更高的采样率?
- WebFlux基础之响应式编程
- Linux上压缩目录以及目录下的所有文件
- N 年沉淀,腾讯这套系统终于开源!
- P3435 [POI2006]OKR-Periods of Words kmp + fail指针
- 树莓派入门教程 - 0 - 准备篇 - 0.4 树莓派安装FTP服务器
- 属于服务器端运行的程序_服务器端编程Java 引起人们的注意很大程度上始于 applet...
- linux版百度导航软件,百度导航2019新版
- BUUCTF Cipher writeup
- OUC2021秋-数值分析-期末(回忆版)
- 2022年湖南省自考考试学前特殊儿童教育练习题及答案
- 【机器学习线性代数】17 利用SVD进行彩色图片压缩
- 期货基本面分析:,马来西亚10月1-10日棕榈油出口量较上月同期下降17.3%,但对中国出口创一年新高
- 计算机技术在医学领域的运用,计算机在医疗系统中的应用
- js实现用户输入年月份,判断是否为闰年,该月份有多少天
- linux内存管理之 ION 内存管理器浅析Ⅰ(system heap)
- 关于Axure-9组合交互内联框架问题
- 解决IDEA报错:Could not find resource mybatis-config.xml
热门文章
- 小青柑的功效与作用以及不适人群
- 字符串上的动态规划算法--------单字符串的情况
- vue-tsc --noEmit导致打包报TS类型错误
- 2000w播放冲上B站热门,UP主、品牌跟风二创席卷B站
- 有关于simulink无法打开slx:错误使用open(line 162) no such file or directory
- Linux文件查找与tar包管理、企业级sed应用 软件包管理与编译安装httpd
- 曝光机与曝光能量_亚微米i线投影曝光机曝光能量积分和快门控制系统
- 基于vue-router vuex+Element ui+echarts+axios +mysql的后台管理系统
- vue打包不生成dist文件夹(IDEA使用命令行npm run build命令打包)
- 张飞比关羽还能打?一位酷爱三国的日本程序员,用NLP分析了武将们的战斗力...