1. 调用百度文字识别接口&识别图片内容

百度识别接口申请地址

修改MyPath 路径即可

MyPath = 'E:\\pdf-图片\\'
filesoure = MyPathdef baiduduqu(filesoure, filename):from aip import AipOcrimport reimport osAPP_ID = '26646243'API_KEY = 'uH8dMfFHRBI0DTr6yzGCoD4X'SECRET_KEY = ''client = AipOcr(APP_ID, API_KEY, SECRET_KEY)dakai = open(filename, 'rb')duqu = dakai.read()message = client.basicGeneral(duqu)result = message.get('words_result')if result is not None:for duqu in message.get('words_result'):print(duqu.get('words'))with open("1pdf.txt", encoding='utf-8', mode="a") as f:f.write(duqu.get('words') + '\n')def filename(fielsoure, filetype):import ospathDir = os.listdir(filesoure)for allDir in pathDir:child = os.path.join('%s%s' % (filesoure, allDir))print(child)baiduduqu(filesoure, child)def run():import osos.chdir(filesoure)for i in os.listdir(os.getcwd()):postfix = os.path.splitext(i)[1]if postfix == '.jpeg' or postfix == '.png':filename(filesoure, postfix)if __name__ == '__main__':run()

2. 使用easyocr库识别

2.1 安装Python 3环境

Python官网

2.2 安装easyocr

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ easyocr

2.3 安装模型

网盘链接:

https://pan.baidu.com/s/1xyPsKORak447jS82Pt-JHg

提取码: onvl
复制到用户目录(python安装路径lib里面搜索) .EasyOCR\model

2.4 安装cv2

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple/ opencv-python

2.5 代码

model_storage_directory 是模型所在本地路径

import easyocrdef run():reader = easyocr.Reader(['ch_sim', 'en'], gpu=False, model_storage_directory=r'C:\Users\Work\AppData\Local\Programs'r'\Python\Python37\Lib\site-packages'r'\easyocr\model')context = ''for i in range(53, 1507):print('#' * 200 + ' 第{}页'.format(i))path = r'E:\pdfImage-1\{}.png'.format(i)result = reader.readtext(path)print('#' * 200 + '长度:{}'.format(len(result)))for j in range(5, len(result)):print(result[j][1])if __name__ == '__main__':run()

Python OCR 识别图片内容相关推荐

  1. Python实现识别图片内容的方法分析

    Python实现识别图片内容的方法分析 本文实例讲述了Python实现识别图片内容的方法.分享给大家供大家参考,具体如下: python识别图片内容. 这里我的环境为windows64位,python ...

  2. Python OCR识别图片验证码(二)

    操作系统:Windows Python:3.5 欢迎加入学习交流QQ群:657341423 上节讲到验证码的简单识别 但对于一些复杂的验证码,我们需要做一些简单的图片处理才能识别. 例如,我要识别这些 ...

  3. python ocr识别身份证_不告诉你我用了它配合Python简简单单开发OCR识别,带你识别手写体、印刷体、身份证等N种,附代码!...

    一.你心目中的OCR二.成果展示(一)手写体成果展示(一)印刷体成果展示(三)名片识别成果展示(四)身份证(同样是模板)成果展示(五)表格识别成果展示:(六)整题识别成果展示:三.前期准备四.开发过程 ...

  4. 傻瓜式 Python OCR 识别库 — ddddocr

    爬虫时,你是否碰到过这种验证码比较的头疼 依赖库的安装 pip install ddddocr 带带弟弟 OCR 可以识别三种验证码,小编就用这三种来实验一下. 滑块验证码 import ddddoc ...

  5. python ocr 识别中文pdf_轻松识别文字,这款Python OCR库支持超过80种语言

    OCR是什么? 有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字. 所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息. OCR的 ...

  6. python ocr 识别车牌_python+opencv+TESSERT-OCR实现车牌的检测与识别

    python+opencv+TESSERT-OCR实现车牌的检测与识别 开学花了十天时间0基础搞出来的,分享给大家,如果有什么错误希望大家给我指正.python师从小甲鱼,opencv师从贾志刚,B站 ...

  7. python ocr识别库_轻松识别文字,这款Python OCR库支持超过80种语言

    OCR是什么? 有一款软件叫扫描全能王,想必一些小伙伴听过,这是一个OCR集成软件,可以将图像内容扫描成文字. 所以说,OCR作用是对文本资料的图像文件进行分析识别处理,获取文字及版面信息. OCR的 ...

  8. python ocr 识别中文pdf_pytesseract识别PDF文件中的文字(OCR)

    前言:由于要利用一些比较老的文献中的数据,手工输入费时费力,于是乎找到了下面的方法.如果不差钱可以使用Adobe Acrobat Reader中的文字识别,也可以尝试其中的试用版.下面的方法完全室开源 ...

  9. python ocr 识别发票真伪_增值税发票识别系统(OCR System of Invoice)

    增值税发票识别系统(OCR System of Invoice) Example Note 1.开发本系统的目的是进行增值税发票的真伪校验,因此只需识别出开票代码,开票号码,开票日期和税前金额这四个特 ...

最新文章

  1. Linux网络编程中的几组类似功能的区别
  2. Java对象初始化顺序
  3. Linux shell 对于文件的删除,复制,修改文件名等操作
  4. python 实现文本自动翻译功能
  5. 03_dbcp数据源依赖jar包,DBCP中API介绍,不同过dbcp方式使用dbcp数据库连接池,通过配置文件使用dbcp数据库连接池
  6. 别问我跨域了,我想吐
  7. linux下php可以实现哪些功能,基于Linux的远程管理系统的设计与实现(PHP)
  8. 用户注册PHP,PHP制作用户注册系统,php制作用户注册_PHP教程
  9. 前端面试常考的手写代码不是背出来的!
  10. AndroidStudio_Gradle命令行的使用_使用gradle命令编译出apk_以及依赖管理---Android原生开发工作笔记77
  11. MySQL日期时间处理函数
  12. 杨森翔的书法(对联、斗方、圆光)
  13. Flutter使用简报
  14. 【CS224N-2019】斯坦福CS224N-2019自然语言处理----作业详解
  15. java fop_java – 未找到类FOP
  16. ppt流程图按步骤链接_【PPT教程】在PowerPoint中5分钟制作一个流程图
  17. C#WinFormRS232串口工具
  18. C++Error2208:…尝试引用已删除的函数
  19. 数字化时代的新形式下,如何提升客户满意度,实现客户成功?
  20. RestTemplete

热门文章

  1. 玉米田(cowfood)
  2. CleanMyMac不停要求输入密码进行更改
  3. Revit标注墙偏移如何简便标注呢?万能标注?
  4. 区块链基础知识与关键技术解析
  5. B站UP主恰饭新思路:产品糅合进有意思的内容里
  6. 【知识兔】Excel查找替换的6大典型用法
  7. 实现一个直播视频app源码的邀请码功能
  8. NETDMIS5.0端面圆跳动2023
  9. 【紫光同创国产FPGA教程】【第三章】按键检测实验
  10. ios html自动进入app,iOS 通过浏览器打开app