最近有ocr方面的需求,而且是批量的,python能不能干这么件事呢,肯定是可以的,基于百度智能云和python结合,实现了我们的需求,今天分享出来,做个备份

import glob
from os import path
import os
from aip import AipOcr
from PIL import Image'''使用时只需要修改百度智能云接口,位于baiduOCR函数,和图片存放位置,位于倒数第三行'''def baiduOCR(outfile):"""利用百度api识别文本,并保存提取的文字picfile:    图片文件名outfile:    输出文件"""filename = path.basename(picfile)APP_ID = '你的APP_ID'API_KEY = '你的API_KEY'SECRET_KEY = '你的SECRET_KEY'client = AipOcr(APP_ID, API_KEY,SECRET_KEY)i = open(picfile, 'rb')img = i.read()print("正在识别图片:\t" + filename)message = client.basicGeneral(img)  # 通用文字识别,每天 50 000 次免费# message = client.basicAccurate(img)   # 通用文字高精度识别,每天 500 次免费print("识别成功!")i.close()with open(outfile, 'a+',encoding='utf-8') as fo:fo.writelines("+" * 60 + '\n')fo.writelines("识别图片:\t" + filename + "\n" * 2)fo.writelines("文本内容:\n")# 输出文本内容for text in message.get('words_result'):fo.writelines(text.get('words') + '\n')fo.writelines('\n' * 2)print("文本导出成功!")print()if __name__ == "__main__":open('result.txt', 'a+',encoding='utf-8').close()outfile = 'result.txt'for picfile in glob.glob("C:\\Users\\25801路西\\Desktop\\test_image\\*"):baiduOCR(outfile)print('图片文本提取结束!文本输出结果位于 %s 文件中。' % outfile)

使用时只需要修改百度智能云接口,位于baiduOCR函数,和图片存放位置,位于倒数第三行

获取百度智能云接口的教程有很多,我就不做赘述了,识别效果还是很不错的哦

效果展示

python实现批量(上万张)图片文字识别并写入excel表格

python实现批量图片文字识别(ocr)相关推荐

  1. 批量图片文字识别OCR场景试用体验-静图变活字,腐朽变神奇

    [优爱酷]图片转文字,批量转.多任务并行转.离线转.场景转,支持表格https://gitee.com/uicoolcn/UiCoolOCR 动态OCR: 针对短视频文案.音频歌词.电影字幕.动态网页 ...

  2. python实现中文图片文字识别--OCR about chinese text--tesseract

    0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: tesseract ...

  3. python批量识别图片中文字_python实现中文图片文字识别--OCR about chinese text--tesseract...

    0.我的环境: win7 32bits python 3.5 pycharm 5.0 1.相关库 安装pillow: pip install pillow 安装tesseract: 自带了英文语言包, ...

  4. 吴恩达《Machine Learning》精炼笔记 12:大规模机器学习和图片文字识别 OCR

    作者 | Peter 编辑 | AI有道 系列文章: 吴恩达<Machine Learning>精炼笔记 1:监督学习与非监督学习 吴恩达<Machine Learning>精 ...

  5. 轻量级图片文字识别 OCR Paddle 使用说明

    百度轻量级 图片文字识别OCR 1.原文链接:https://www.paddlepaddle.org.cn/hub/scene/ocr 2.快速安装     https://github.com/P ...

  6. 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用

    开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...

  7. 吴恩达《机器学习》第十八章:图片文字识别OCR

    文章目录 十八.应用实例:图片文字识别OCR 18.1 问题描述和流程图 18.2 滑动窗口 18.3 获取大量数据和人工数据 18.4 上限分析:下一步工作 十八.应用实例:图片文字识别OCR 18 ...

  8. 图片文字识别OCR模型免费API接口工具及DEMO

    jiaying系列 网页版演示地址:ai.moneymeeting.club 一.简介: paddleocr是一个开源的图片文字识别工具​. 目前我们提供的免费在线API支持png.jpg​文件格式. ...

  9. python学习----网页图片文字识别(简单)

    在接触python后想对图片进行一些处理  python实现的代码很简单 但是关键在于一些包的导入 我使用的python 软件是 pycharm  可以在setting中去下载requests这个包 ...

  10. 【图片识别】java 图片文字识别 ocr (转)

    http://www.cnblogs.com/inkflower/p/6642264.html 最近在开发的时候需要识别图片中的一些文字,网上找了相关资料之后,发现google有一个离线的工具,以下为 ...

最新文章

  1. Windbg新手入坑指南
  2. python向sqlite数据库中插入数据(变量)
  3. 八张图彻底了解JDK8 GC调优秘籍-附PDF下载
  4. 编写原生的Node.js模块
  5. .NET 6 中 gRPC 的新功能
  6. sql 百分号_SQL思维导图和代码分享
  7. python函数示例_使用Python中的示例的input()函数
  8. qq浏览器翻译功能启用划词插件教程
  9. 关于struts线程问题 转
  10. Spring整合Struts2,Hibernate的xml方式
  11. 如何使用apktool反编译APK
  12. Selenium和Firefox对应版本及注意事项
  13. 2020长安杯网站重构部分
  14. 计算机音乐大学排名,2019音乐类大学排行榜_2019年世界十大权威大学排名报告发布,中国891所高...
  15. 光致变色染料的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告
  16. [ArcGIS].txt或.xlxs(Excel)格式如何转为.shp格式?
  17. 官网稳定版微信小程序下载地址
  18. 【Python】np.polyfit点拟合曲线
  19. 阿里云ACP云计算认证通过总结
  20. 支付宝nfc sim android,告别实体公交卡 支付宝钱包帮你实现

热门文章

  1. Spring Cloud Eureka源码分析之心跳续约及自我保护机制
  2. 我是一个粉刷匠用计算机弹,《我是一个粉刷匠》,钢琴双手弹的谱子,,,急用,,,谢谢...
  3. 关于Spring Boot报错:LoggerFactory is not a Logback LoggerContext but Logback is on the classpath
  4. ObjectARX标注公差简单实例
  5. FFFfrance博客介绍
  6. beyond compare 强制使用二进制传输,保证文件一样
  7. ffplay flv mp4 转_FLV与MP4格式视频转换
  8. 货效,坪效,人效,这三效怎么理解?
  9. 移动硬盘计算机管理无法显示,为什么移动硬盘插在电脑上不显示_移动硬盘为什么在电脑上面显示不出来-系统城...
  10. Jenkins - Publish Over SSH