python实现批量图片文字识别(ocr)
最近有ocr方面的需求,而且是批量的,python能不能干这么件事呢,肯定是可以的,基于百度智能云和python结合,实现了我们的需求,今天分享出来,做个备份
import glob
from os import path
import os
from aip import AipOcr
from PIL import Image'''使用时只需要修改百度智能云接口,位于baiduOCR函数,和图片存放位置,位于倒数第三行'''def baiduOCR(outfile):"""利用百度api识别文本,并保存提取的文字picfile: 图片文件名outfile: 输出文件"""filename = path.basename(picfile)APP_ID = '你的APP_ID'API_KEY = '你的API_KEY'SECRET_KEY = '你的SECRET_KEY'client = AipOcr(APP_ID, API_KEY,SECRET_KEY)i = open(picfile, 'rb')img = i.read()print("正在识别图片:\t" + filename)message = client.basicGeneral(img) # 通用文字识别,每天 50 000 次免费# message = client.basicAccurate(img) # 通用文字高精度识别,每天 500 次免费print("识别成功!")i.close()with open(outfile, 'a+',encoding='utf-8') as fo:fo.writelines("+" * 60 + '\n')fo.writelines("识别图片:\t" + filename + "\n" * 2)fo.writelines("文本内容:\n")# 输出文本内容for text in message.get('words_result'):fo.writelines(text.get('words') + '\n')fo.writelines('\n' * 2)print("文本导出成功!")print()if __name__ == "__main__":open('result.txt', 'a+',encoding='utf-8').close()outfile = 'result.txt'for picfile in glob.glob("C:\\Users\\25801路西\\Desktop\\test_image\\*"):baiduOCR(outfile)print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile)
使用时只需要修改百度智能云接口,位于baiduOCR函数,和图片存放位置,位于倒数第三行
获取百度智能云接口的教程有很多,我就不做赘述了,识别效果还是很不错的哦
效果展示
python实现批量(上万张)图片文字识别并写入excel表格
python实现批量图片文字识别(ocr)相关推荐
- 批量图片文字识别OCR场景试用体验-静图变活字,腐朽变神奇
[优爱酷]图片转文字,批量转.多任务并行转.离线转.场景转,支持表格https://gitee.com/uicoolcn/UiCoolOCR 动态OCR: 针对短视频文案.音频歌词.电影字幕.动态网页 ...
- python实现中文图片文字识别--OCR about chinese text--tesseract
0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: tesseract ...
- python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...
0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...
- 吴恩达《Machine Learning》精炼笔记 12:大规模机器学习和图片文字识别 OCR
作者 | Peter 编辑 | AI有道 系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习 吴恩达<Machine Learning>精 ...
- 轻量级图片文字识别 OCR Paddle 使用说明
百度轻量级 图片文字识别OCR 1.原文链接:https://www.paddlepaddle.org.cn/hub/scene/ocr 2.快速安装 https://github.com/P ...
- 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用
开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...
- 吴恩达《机器学习》第十八章:图片文字识别OCR
文章目录 十八.应用实例:图片文字识别OCR 18.1 问题描述和流程图 18.2 滑动窗口 18.3 获取大量数据和人工数据 18.4 上限分析:下一步工作 十八.应用实例:图片文字识别OCR 18 ...
- 图片文字识别OCR模型免费API接口工具及DEMO
jiaying系列 网页版演示地址:ai.moneymeeting.club 一.简介: paddleocr是一个开源的图片文字识别工具. 目前我们提供的免费在线API支持png.jpg文件格式. ...
- python学习----网页图片文字识别(简单)
在接触python后想对图片进行一些处理 python实现的代码很简单 但是关键在于一些包的导入 我使用的python 软件是 pycharm 可以在setting中去下载requests这个包 ...
- 【图片识别】java 图片文字识别 ocr (转)
http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...
最新文章
- Windbg新手入坑指南
- python向sqlite数据库中插入数据(变量)
- 八张图彻底了解JDK8 GC调优秘籍-附PDF下载
- 编写原生的Node.js模块
- .NET 6 中 gRPC 的新功能
- sql 百分号_SQL思维导图和代码分享
- python函数示例_使用Python中的示例的input()函数
- qq浏览器翻译功能启用划词插件教程
- 关于struts线程问题 转
- Spring整合Struts2,Hibernate的xml方式
- 如何使用apktool反编译APK
- Selenium和Firefox对应版本及注意事项
- 2020长安杯网站重构部分
- 计算机音乐大学排名,2019音乐类大学排行榜_2019年世界十大权威大学排名报告发布,中国891所高...
- 光致变色染料的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
- [ArcGIS].txt或.xlxs(Excel)格式如何转为.shp格式?
- 官网稳定版微信小程序下载地址
- 【Python】np.polyfit点拟合曲线
- 阿里云ACP云计算认证通过总结
- 支付宝nfc sim android,告别实体公交卡 支付宝钱包帮你实现
热门文章
- Spring Cloud Eureka源码分析之心跳续约及自我保护机制
- 我是一个粉刷匠用计算机弹,《我是一个粉刷匠》,钢琴双手弹的谱子,,,急用,,,谢谢...
- 关于Spring Boot报错:LoggerFactory is not a Logback LoggerContext but Logback is on the classpath
- ObjectARX标注公差简单实例
- FFFfrance博客介绍
- beyond compare 强制使用二进制传输,保证文件一样
- ffplay flv mp4 转_FLV与MP4格式视频转换
- 货效,坪效,人效,这三效怎么理解?
- 移动硬盘计算机管理无法显示,为什么移动硬盘插在电脑上不显示_移动硬盘为什么在电脑上面显示不出来-系统城...
- Jenkins - Publish Over SSH