人工智能学习--文本识别实践-tesseract-ocr
前提假设:
1. 所要检测的图片是纯文本或者文字,最好是只有一行; 或者截图只有一行文本的图片。如下图
图片名称: text03.jpg
2. 从文本检测(深度学习网络)软件检测到的 包含文本区域的图片。
开源文本识别软件(OCR)
Tesseract-OCR
下载链接:https://digi.bib.uni-mannheim.de/tesseract/
可以根据自己的电脑操作系统位数决定下载32位 或者 64位,按照时间顺序,可以下载最新的版本。
安装步骤:
下载完后,是 .exe格式文件,点击安装,一直下一步就可以了。
注释: 如果有提示:选择下载包(在additional language data (download 下选择中数学公式库和中文库Chinese(simplified)(traditional)),两者都选上, 点击“next”继续
注释:如果选中additional的√ 钩号, 安装时可能提示一个错误,不管它,直接按 enter 键盘按键,直到装完。
笔者是装在 E:| 盘,,,目录是E:\ Tesseract-OCR
环境配置:
1. 将Tesseract-OCR安装目录(E:\Tesseract-OCR)加入环境变量path中; 环境变量获取方式:右键 桌面上的 “计算机”图标, 然后如下图所示。 双击 PATH 在最末尾加入刚刚软件安装的目录。
2 新建环境变量,变量名TESSDATA_PREFIX 并赋值为E:\Tesseract-OCR\tessdata
运行方法:
Windows的 cmd命令行模式下 运行, 如下图红色框里,可以正确检测前面 text.jpg 图片里的英文内容。
tesseract 是命令
第一个目录是要识别的图片目录和文件名
第二个目录是结果要保存的目录和文件名
-l 是选项符号,(-后面那个小写字母是L的小写)
eng 是English的缩写,在目录 E:\Tesseract-OCR\tessdata目录下, 完整名称是下图的红色框内 eng.traineddata文件名。
makebox是固定的写法
注释:如果想要检测中文文字的图片,则需要下载 chi_sim.traineddata文件, 下载地址:https://github.com/tesseract-ocr/tessdata
注释: 如果以上GitHub打不开可以试试,CSDN的加速计划 https://codechina.csdn.net/mirrors/tesseract-ocr/tessdata?utm_source=csdn_github_accelerator
运行结果:
运行结果是一个 .box 文件, 可以用 文本类编辑工具软件打开或记事本打开 查看内容
结果是一行一个字母,如果图像比较干净,无干扰背景纹理的话,检测准确率很高。
Python 版本,没测试:可以参考:
https://zhuanlan.zhihu.com/p/113961004
https://blog.csdn.net/qq_41030861/article/details/99842001?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control&dist_request_id=&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromMachineLearnPai2-1.control
总结:
用于简单的图片,例如白底黑字,一行或者多行文字,字符直接比较松散,则检测结果质量较高,准确率较高。
若,图片中背景颜色很杂很多干扰因素,或者黑底白粗字,或者倾斜或者 其他门牌号广告牌等大字体,艺术字体,则几乎无法正确识别。 想要识别这些场景下的文字,则需要用深度学习神经网络模型,网上有很多开源软件,需要GPU伺候。
人工智能学习--文本识别实践-tesseract-ocr相关推荐
- 人工智能学习--文本检测实践
注释:文本检测 和 文本识别是两回事. 可能现在已经有 end-to-end的深度神经网络可以将文本检测和识别一起实现,这个要去搜相关的sci论文. 文本检测,是从一张图片中找到文字区域,并用矩形框标 ...
- python opencv 文字识别_文本识别 使用 Tesseract 进行 OpenCV OCR 和 文本识别
文本识别 用 Tesseract 进行 OpenCV OCR 和 文本识 在本教程中,您将学习如何应用OpenCV OCR(光学字符识别).我们将使用OpenCV,Python和Tesseract 执 ...
- 文本识别 使用 Tesseract 进行 OpenCV OCR 和 文本识别
原文链接 文本识别 使用 Tesseract 进行 OpenCV OCR 和 文本识别 在 2019年7月18日 上张贴 由 hotdog发表回复 文本识别 用 Tesseract 进行 OpenCV ...
- 人工智能学习--文本检测和识别综述(2021)
文本检测和文本识别可以分成两个部分: 目前的深度学习方案也有很多端到端的系统. 本质也是计算机视觉中的一种物体检测和识别分支: -- 传统方法用手工特征提取检测是否文本区域: 之后通过传统的机器学习方 ...
- 入门深度学习文本识别
论文地址:https://arxiv.org/pdf/1507.05717v1.pdf 代码地址:GitHub - Holmeyoung/crnn-pytorch: Pytorch implement ...
- 深度学习文本识别之表格识别
一.简介 实现简单的横竖表格图片的识别,提取表格并生成对应的Word文档 二.架构与部署 1.本项目为B/S架构 2.显示页面采用Python的web框架Django搭建页面,负责传入单张的表格图片 ...
- 人工智能学习--文本检测初探
一.相关概念和综述: 转自知乎热心网友 燕小花女士的内容,供学习使用,若侵权则删.貌似写于2018年12月,之后这几年的流行方法更新,自行搜索sci顶刊和会议论文. https://zhuanlan. ...
- 个人永久性免费-Excel催化剂功能第86波-人工智能之图像OCR文本识别全覆盖
在上一年中,Excel催化剂已经送上一波人工智能系列功能,鉴于部分高端用户的需求,再次给予实现了复杂的图像OCR识别,包含几乎所有日常场景,让公司个人手头的图像非结构化数据瞬间变为可进行结构化处理分析 ...
- 文本的检测、识别实战:使用 Tesseract 进行 OpenCV OCR 和文本识别
在本篇文章中,我们将使用 OpenCV.Python 和 Tesseract 执行 (1) 文本检测和 (2) 文本识别. 上篇文章,我向您展示了如何使用 OpenCV 的 EAST 深度学习模型执行 ...
最新文章
- 有没有想过,自己手写一个连接池?
- 三代纠错软件LoRDEC安装和使用(0.6版本)
- vscode如何搜索?ctrl+shift+p
- VTK:vtkAnnotatedCubeActor用法实战
- 阿里云轻应用服务器 宝塔面板 mongodb 配置外网连接 其二 配置账号密码
- 十二、用Axis操作 Header头部信息
- itextpdf 加密解密
- 一次性通过CISSP考试之旅
- 前端布局面典型案例 面试题
- pearson相关系数_SPSS相关性分析及相关系数计算方法(点二列相关系数)——【杏花开医学统计】...
- CF1654-G. Snowy Mountain(2900) GOOD
- 10年攒一百万回老家一个月6千利息,现实么
- Perfmon - Windows 自带系统监测工具
- PythonOCC基础使用:曲面建模
- CCF推荐列表重磅更新, RecSys升级成为B类会议, 中国科学: 信息科学成为A类期刊......
- DSGN: Deep Stereo Geometry Network for 3D Object Detection---基于双目视觉的3D目标检测(1)
- GTY‘s gay friends 线段树+前缀和
- google-chrome 启动报错 nss_util.cc(627)] NSS_VersionCheck(3.26) failed. NSS = 3.26 is required
- tensorflow多层卷积网络实现CNN文本分类
- 中国科学院数学所二阶椭圆偏微分方程考博试题
热门文章
- 2021.12.20用ULN2003驱动四线步进电机
- TensorFlow:简单的卷积层、池化层(采样层)示例
- uva1505(暴力)
- 2021-01-16 英文写作中“因为”
- Python与Golang协程异同
- ML机器学习导论学习笔记
- eclipse创建Maven的动态web工程
- Android源码学习(3) Handler之MessageQueue
- 【iOS atomic、nonatomic、assign、copy、retain、weak、strong】的定义和区别详解
- windows下开发准备