文字识别:Tesseract OCR
一、安装并配置Tesseract
1、下载Tesseract-OCR (网上直接下载即可)
2、双击安装,选择所有人均可使用,避免权限问题
勾选最后一项添加语言包,但是全部勾选需要1.3G,可以点开加号,选择自己所需的语言包即可。
注意:这里最好装在C盘,之前装在F盘报错,无法使用Tesseract
备注:在这里先复制好安装路径,后面还需要将其添加至环境变量中。C:\Program Files (x86)\Tesseract-OCR
这一步是创建快捷方式,在这里勾选不创建
安装过程中,如果出现错误,点击确定即可,并不影响后续使用。
安装完成后,需要将刚才的安装路径添加至环境变量中。在此电脑上右键,选择属性,选择高级系统设置
在高级中选择环境变量
分别在用户变量和系统变量中修改path
双击Path,点击新建,然后将刚才复制的安装路径复制进来
点击确定后,在系统变量中双击Path,添加,点击确定。
然后在系统变量中,点击新建,新建一个变量名为:TESSDATA_PREFIX
值为:刚才的路径加上 \tessdata
此时,Tesseract 环境配置完成。如何测试是否可以使用?
Win+R 在cmd中输入:tesseract -v 可以查看版本信息
出现以下结果证明已经可以正常使用:
补充:输入:
tesseract --list-langs 来查看本地 Tesseract-ORC 支持语言库
二、使用Tesseract 进行文字识别
1、将需要测试的图片保存为test.jpg ,然后新建一个test.txt文件
(这样测试图片中的文字就会直接读写到文本文件中)
在cmd中先进入桌面,使用 cd desktop , 然后输入: tesseract+空格+路径+空格+文本文件名,回车
然后可以在文本文件中看到所识别的文字信息,如下图所示:
文字识别:Tesseract OCR相关推荐
- android自动识别文字,Android文字识别tesseract ocr -训练样本库 识别字库
目录 安装tesseract ocr引擎和jTessBoxEditor 安装jTessBoxEditor 开始制作box 准备好训练的图片 将图片转为tif格式的样本图片 合并样本图片 修改box文件 ...
- 【白皮书分享】智能文字识别(OCR)能力评测与应用白皮书.pdf(附下载链接)...
大家好,我是文文(微信:sscbg2020),今天给大家分享中国信通院云计算与大数据研究所.中国人工智能产业发展联盟和腾讯于2020年9月联合发布的白皮书<智能文字识别(OCR)能力评测与应用白 ...
- 百度文字识别 百度OCR接口申请
1.百度文字识别 百度OCR 的接口申请 https://blog.csdn.net/biao197/article/details/102907492
- 人工智能Java SDK:文字识别(OCR)工具箱
文字识别(OCR)工具箱 文字识别(OCR)目前在多个行业中得到了广泛应用,比如金融行业的单据识别输入,餐饮行业中的发票识别, 交通领域的车票识别,企业中各种表单识别,以及日常工作生活中常用的身份证, ...
- python 离线图片文字识别(OCR)Tesseract
本人最近也是在使用和学习python遇到各种问题,公司内网控制严格 没有网络,同时也不允许安装exe文件,做python 十分的费劲,也研究了好几款文字识别的OCR ,要么是收费的 要么是离线不能用, ...
- python文字识别算法_Python图像处理之图片文字识别(OCR)
OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR).可以实现OCR 的底层库并不多,目前很多库都是使用共同的几 ...
- Android文字识别tess-two OCR
OCR Tesseract tess-two文字识别Android Studio实现 1.简介 OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫 ...
- 【Python】调用百度云API文字识别服务 OCR
# encoding:utf-8 # !/usr/local/bin/python3# 百度云:文字识别服务 # 应用名称:文字识别练习项目import urllib3 from urllib.par ...
- 模板 字段_劲爆新功能:轻流文字识别(OCR)功能支持自定义识别模板啦
Hi,又和大家见面啦- 前段时间我们的文字识别(OCR)功能推出后,由于只支持系统提供的固定识别模板,很多客户跟我们反馈说:希望可以自定义识别模板! 现应大家的要求,轻流「文字识别(OCR)」的「自定 ...
- 华为云鲲鹏云服务器系列的规格,#化鲲为鹏,我有话说#使用华为云鲲鹏弹性云服务器部署文字识别Tesseract...
分配的弹性云服务器规格:2vCPUs|4G|CentOS6.5 64bit 首先登录上华为云官网,在控制台找到分配的弹性云服务器复制IP,打开桌面上的XFce,执行如下代码,将EIP修改为IP: LA ...
最新文章
- tomcat与resin的比较
- 正则表达式中问号等特殊字符的转义(转)
- 可以获取python整数类型帮助的是什么-下列选项中可以获取Python整数类型帮助的是()。...
- Perl正则表达式--练习1
- 用友 提示“尚有已全部暂估报销的单据未进行处理,不能进行12月的期末处理!”...
- 老男孩python爬虫视频教程_python爬虫入门
- 不会真的有人拿了上万甚至几十万在网络上赌博吧?
- 一起谈.NET技术,Microsoft NLayerApp案例理论与实践 - 项目简介与环境搭建
- think in java 读书笔记 1 ——移位
- OPENROWSET访问CSV格式文件
- 计算机网络实验二 VLAN间路由
- 6120:学长的沙包
- lzg_ad:Windows Embedded Standard 安装说明
- R16之Access to Unlicensed Spectrum(3)
- Pyspark回归--IsotonicRegression
- umi 约定式路由 关于 history.goBack() 的奇奇怪怪问题
- Ensemble Learning(集成学习--AdaBoost,GBDT,Xgboost等)
- oracle销售订单导入错误,通过传XML格式导入到ORACLE的销售订单
- Linux实战技巧--文件系统操作(三)--复制和移动文件或者目录(cp/mv)
- 计算机网络ap图片,苹果AirPort Express无线AP开箱图赏
热门文章
- 2021-11-09 jQuery常用方法及事件
- Hibernate的一对一,一对多/多对一关联保存
- 在Micrium uC/Probe中添加IAR生成的.out文件的问题
- hard link soft link
- 【zhasite】托业英语阅读技巧有哪些
- 浦发招聘笔试计算机部分考啥,2019浦发银行校园招聘考试题型及题量分布
- 电脑小米手机,小米手机怎么连接电脑?
- 加速度、陀螺仪传感器工作原理
- E3 1200 系列服务器,至强E3-1200 v2增加图形核心_服务器评测与技术-中关村在线
- 国内做三维GIS的公司总结-cesium和threejs