文章目录

  • 简介
  • chineseocr_lite
  • PaddleOCR

简介

  • OCR(Optical Character Recognition)全称光学字符识别, 通俗的讲就是计算机识别图像上面的文字并且提取出来。这对提取运算速度以及识别准确率都有很高的要求。
  • 两个项目均CRNN网络结构
  • chineseocr_lite运行方式简单,PaddleOCR自定义功能强
  • 笔者运行环境:Anaconda3的Python3.7 完美运行两个项目

chineseocr_lite

  • gitHub地址:https://github.com/ouyanghuiyu/chineseocr_lite
  • 项目有Python版、C++Demo、androidDemo、C#Demo。
  • 使用方式:
# 安装模块
pip install -r ./requirements.txt -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
# 运行main文件运行项目
python backend/main.py
  • 项目运行成功:
  • PC界面:
    - Android界面:

PaddleOCR

  • gitHub地址:https://github.com/PaddlePaddle/PaddleOCR
  • PaddlePaddle百度多年的深度学习技术研究平台,大厂的文档也写的很全面,项目运行虽然没有像chineseocr_lite那样简单,但是文档非常清晰,也有文档可以参考自己训练模型。项目还配置了PPOCRLabel半自动化图形标注工具使用户自己添加数据集。
  • 使用方式:
# 1. 这里个人建议安装2.0cpu版本,笔者使用1.8.5会产生bug
pip install paddlepaddle==2.0.0rc1 -i https://mirror.baidu.com/pypi/simple# 2. 安装paddle, paddlehub PS:中途可能提示缺少几个模块的问题,安装即可
pip install paddle
pip3 install paddlehub --upgrade -i https://pypi.tuna.tsinghua.edu.cn/simple# 3. 下载官方训练好的模型,这里建议参考官方文档: https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/deploy/hubserving/readme.md
检测模型:.\PaddleOCR_dygraph\deploy\hubserving\ocr_det
识别模型:.\PaddleOCR_dygraph\deploy\hubserving\ocr_rec
方向分类器:.\PaddleOCR_dygraph\deploy\hubserving\ocr_cls
模型库下载地址:https://github.com/PaddlePaddle/PaddleOCR/blob/dygraph/doc/doc_ch/models_list.md
* 下载对应的模型后解压,然后修改hubserving目录下,ocr_det\params.py, ocr_rec\params.py, ocr_cls\params.py, ocr_system\params.py四个文件里的模型路径# 4. 安装模块
# 安装检测服务模块:
hub install .\deploy\hubserving\ocr_det\
# 安装分类服务模块:
hub install .\deploy\hubserving\ocr_cls\
# 安装识别服务模块:
hub install .\deploy\hubserving\ocr_rec\
# 安装检测+识别串联服务模块:
hub install .\deploy\hubserving\ocr_system\# 5.开启服务
hub serving start -c .\deploy\hubserving\ocr_det\config.json
hub serving start -c .\deploy\hubserving\ocr_cls\config.json
hub serving start -c .\deploy\hubserving\ocr_rec\config.json
hub serving start -c .\deploy\hubserving\ocr_system\config.json# 6.没有图形化界面所以只能在终端内测试
#               测试文件                    ocr_system服务地址                  需测试图片路径
python .\tools\test_hubserving.py http://127.0.0.1:8868/predict/ocr_system  .\img.jpg

易用的两个OCR(图像文字识别提取)开源项目相关推荐

  1. Prizmo Pro for Mac(OCR图像文字识别工具)

    Prizmo Pro mac版可以自动扫描相机中的图片,可根据用户选择的文档类型进行特殊处理,支持常用的扫描仪.数码相机.iPhone.iPad 等,也支持自动截图桌面部分区域然后识别出文字,非常的有 ...

  2. Python 图像文字识别提取的两种简单方案(Windows)

    百度文字识别API参考:https://www.jianshu.com/p/816cc6ef571b 本地tesseract_ocr参考:https://blog.csdn.net/jclian91/ ...

  3. pdf和图像文字识别提取工具

    在线ocr转换: http://www.onlineocr.net/ http://www.ocrconvert.com/ http://cn.diywz.com/OCR/ 推荐:http://www ...

  4. 一款免费的ocr图片文字识别提取工具网站

    市场上ocr很成熟,但是都有各种限制,比如强制登陆,转换限制,收费过高等!有时候我们只是简单的提取一下图片中的数据.或者暂时的图片文字识别和提取.这个我感觉还可以,大家要就拿去不谢!https://o ...

  5. 【文字识别】OCR截图文字识别提取(无需安装)拖拽图片,打开图片,图片PDF转文字的好帮手

    软件无需安装,双击打开就能用,适用于Windows 7以上平台: 具有截图文字识别,拖拽文字识别,打开文字识别,翻译文字等功能 可用于图片和PDF中文字的识别提取中,电脑一切看得见的文件都可以识别,支 ...

  6. TOOLFK工具-在线OCR图片文字识别工具

    本文要推荐的[TOOLFK]在线OCR图片文字识别工具 ,提供图像文字识别,提取图片文字,OCR图片文字识别,图片转文字,把图片拖拽到上传框中自动上传识别,图片文件最大3M 網站名稱:ToolFk 網 ...

  7. 比天若OCR,PandaOCR更方便使用的OCR扫描文字识别软件,易用AI

    目前市面上各种各样的OCR软件从技术上大概可以分为两大类,离线版和云端在线版.离线版的代表如 Abbyy FineReader,在线版如各大头部AI平台开放的OCR接口能力.一般在线版比离线版的识别能 ...

  8. 如何使用Python实现图像文字识别OCR

    要使用Python实现图像文字识别OCR,可以使用以下步骤: 安装Tesseract OCR引擎 Tesseract是一种开源OCR引擎,可以处理多种语言和字体.要使用Python进行OCR,需要安装 ...

  9. 基于Python实现的图像文字识别OCR工具

    引言 最近在技术交流群里聊到一个关于图像文字识别的需求,在工作.生活中常常会用到,比如票据.漫画.扫描件.照片的文本提取. 博主基于 PyQt + labelme + PaddleOCR 写了一个桌面 ...

  10. 基于Python实现的图像文字识别OCR工具,包含GUI界面附完整版代码可直接运行

    引言 最近在技术交流群里聊到一个关于图像文字识别的需求,在工作.生活中常常会用到,比如票据.漫画.扫描件.照片的文本提取. 博主基于 PyQt + labelme + PaddleOCR 写了一个桌面 ...

最新文章

  1. 防止IFRAME页被嵌套
  2. 【C语言】控制台窗口图形界面编程(二)窗口信息和填充缓冲区
  3. Silverlight 打印
  4. 【2018.4.7】模拟赛之四-ssl2385 猜数【水题】
  5. OpenCV学习笔记(十五):图像仿射变换:warpAffine(),getRotationMatrix2D()
  6. 快逸报表之在IE打印问题
  7. 数据建模工具存在的价值
  8. 虚拟机(VMware Workstation Pro)安装CentOS7镜像
  9. 工程项目全过程,工程项目建设分为几个阶段?
  10. 怎么 把计算机里的照片变成背景,用画图怎么改照片底色
  11. 性能测试脚本用例模版
  12. 微博营销有什么优势与缺点?如何利用微博开展营销?
  13. WebDAV之葫芦儿·派盘+Ever play播放器
  14. 图新地球(LSV)常见问题汇总(图源、全景、倾斜摄影、点云应用、图新地球模糊等等)------持续更新
  15. HTML图像和超链接及文字颜色与排版
  16. 2020年,微信的基地属性正在悄然转向。
  17. Sanity Check: SRM, AA test
  18. [高考真题]2012年普通高等学校招生全国统一考试 英语(四川卷)
  19. 水库水雨情监测系统方案分享-水库水位监测-水情监测
  20. linux 可读可写可执行权限 chmod

热门文章

  1. 腾讯的企业级分布式 HTAP 数据库管理系统 TBase 正式开源
  2. 应广单片机mini-c中用指针实现数组数功能
  3. 关于Hilbert矩阵的几道编程题
  4. Python 迷宫算法
  5. PMP 第10章 项目沟通管理
  6. 如何下载历史版本的App Store中的APP
  7. PLC有几种编程语言以及它们的特点是什么
  8. C++高级编程资料汇总(参考手册+电子书+编程思想+算法分析)
  9. 关于ChartControl的绑定数据源使用
  10. rational rose mysql_用Rational Rose逆向工程(java)生成类图(教程和错误解决)