java ocr linux_linux (centos7)上装Tesseract-OCR最新版本(5.0)
由于在服务器上安装tesseract yum只能拉到3.X版本 而测试来看4.0以上版本识别效果比3.x要好很多。于是只能通过编译代码形式安装最新版了
首先在机器上找个目录 打开官方git https://github.com/tesseract-ocr
打到4.1分支 我们在服务器上找个目录 git clone https://github.com/tesseract-ocr/tesseract.git
如果新机器就随手安装上工具包
yum install gtk2-devel yasm glibc.i686 libstdc++.so.6 libgtk-x11-2.0.so libatk-1.0.so.0 libcairo.so.2 libcups.so.2 libgdk-x11-2.0.so.0 libgdk_pixbuf-2.0.so.0 libgtk-x11-2.0.so.0 libpango-1.0.so.0 libpangocairo-1.0.so.0 libICE.so.6 libSM.so.6 libmng.so.1 libpng12.so.0 libGLU.so.1 -y
安装开发工具
yum groupinstall "Development Tools"
安装leptonica1.7(4.0要修必须在1.74以上)
wget http://www.leptonica.org/source/leptonica-1.74.4.tar.gz
tar -xzvf leptonica-1.74.4.tar.gz
cd leptonica-1.74.4./configure --prefix=/usr/local/
make && make install
配置环境
vim \etc\bashrc
加入
PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/lib/pkgconfig
export PKG_CONFIG_PATH
CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/include/
export CPLUS_INCLUDE_PATH
C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica
export C_INCLUDE_PATH
LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib
export LD_LIBRARY_PATH
LIBRARY_PATH=$LIBRARY_PATH:/usr/local/lib
export LIBRARY_PATH
TESSDATA_PREFIX=/root/tesseract/
export TESSDATA_PREFIX
最后刷新
source /etc/bashrc
回到tesseract目录,开始安装
./autogen.sh
./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/include
注:这时有可能会报 configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.
明明我们已经安装了的。为什么还会报呢?
那就要加入环境变量
vim /etc/profile
在最后插入
export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/lib
export LIBLEPT_HEADERSDIR=/usr/local/include
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
最后刷新下文件
source /etc/profile
然后我们再执行
./autogen.sh./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/include
这时就没有 leptonica问题啦,随后make下
make && sudo make install
最后我们用代码测试一切都正常,但到项目中却莫明奇妙地失败,断点服务直接崩掉,cache不住,找不到报错
各种百度google最后确认下来可能少了tess4j要的linux依赖库
执行下
cp /usr/local/lib/*.so.* /usr/lib64/
如果报
Error in findTiffCompression: function not present
Error in pixReadStreamTiff: function not present
Error in pixReadStream: tiff: no pix returned
Error in pixRead: pix not read
Unsupported image type.
相关。
那就是没有少了png和jpge依赖库
yum install libjpeg-develyum install libpng-devel
进入leptonica的安装文件夹重新编译
./configuremake
make install
到此基本所有问题都 解决了。运行项目正常
java ocr linux_linux (centos7)上装Tesseract-OCR最新版本(5.0)相关推荐
- Google Chrome 浏览器最新版本 71.0.3578.98(正式版本) (64 位)
Google Chrome 浏览器 最新版本 71.0.3578.98(正式版本) (64 位) 链接地址:https://share.weiyun.com/5uX1wRc 转载于:https://w ...
- php 7.0 nts,PHP最新版本7.0.1-nts-Win32-VC14-x86
[实例简介] PHP最新版本7.0.1-nts-Win32-VC14-x86 VC14 x86 Non Thread Safe (2015-Dec-16 23:44:11) 官方版本 [实例截图] [ ...
- tomcat 7 最新版本 apache-tomcat-7.0.109
tomcat 7 漏洞修复 tomcat 7 最新版本 apache-tomcat-7.0.109.zip 下载地址: https://wwm.lanzouy.com/i8YMK07hu7na apa ...
- 升级至win10 最新版本10.0.17134,远程桌面连接Window Server时报错信息如下
升级至win10 最新版本10.0.17134,远程桌面连接Window Server时报错信息如下: 出现身份验证错误,要求的函数不正确,这可能是由于CredSSP加密Oracle修正. 解决方法: ...
- 关于虚拟串口驱动专业版 Eltima Virtual Serial Port Driver Pro 最新版本 V10.0.979
关于虚拟串口驱动专业版 Eltima Virtual Serial Port Driver Pro 最新版本 V10.0.979 Virtual Serial Port Driver PRO 是基于「 ...
- java最新版怎么安装_Java JDK 最新版本安装与环境配置
Java 更新速度越来越快,版本迭代也是越来越多,以前的教程中的页面和流程亦有变化,故更新一下.本文使用日前最新版本 Java SE 15为模版. 1. 下载 Java SE 15 地址 下载完成后即 ...
- CentOS7(图显)安装最新版本NVIDIA 显卡驱动
System Version:CentOS 7.9.2009 内核版本:Linux localhost.localdomain 3.10.0-1160.el7.x86_64 #1 SMP Mon Oc ...
- Centos7 安装向日葵(最新版本)
你安装的向日葵是否出现版本过低,月底不再提供更新,需要更新向日葵远程软件版本 1.首先从向日葵官网上下载最新版本的向日葵软件(.rpm) 2.然后下载好的rpm文件,放到服务器指定目录 /usr/sr ...
- mysql8.0.12url_使用最新版本MySQL8.0.12报错记录
使用最新版本MySQL报错,MySQL版本8.0.12. 报错1: Sun Oct 14 00:45:30 CST 2018 WARN: Establishing SSL connection wit ...
- mysql8 修改密码_最新版本mysql8.0.18windows x64部署手册
mysql是Web世界中使用最广泛的数据库服务器.SQLite的特点是轻量级.可嵌入,但不能承受高并发访问,适合桌面和移动应用.而mysql是为服务器端设计的数据库,能承受高并发访问,同时占用的内存也 ...
最新文章
- 【网络爬虫】(1) 网络请求,urllib库介绍
- 八百客CRM:微信提现收费,仅仅用户钱包受了伤?
- 学习python需要什么基础-python编程学习需要哪些基础和准备工作?
- java array to string_数组到字符串转换(Array to string conversion)
- ViT (Vision Transformer) ---- RNN
- xgboost4j jar包下载
- Linux的匿名访问Samba
- VS2010+OpenCV2.4.6永久性配置方法
- 机器学习笔记1-What is Machine Learning
- DS homework-队列
- 【论文】Track to Detect and Segment: An Online Multi-Object Tracker
- 从头开始设计我的网游
- 前端js面试题(高级)
- win产品密钥大搜集
- matlab离群值处理,数据平滑和离群值检测
- ROS发布/订阅Float64MultiArray数组类消息(C++和Python相互发布和订阅)
- 病毒木马查杀实战第007篇:熊猫烧香之逆向分析(下)
- 小梅哥FPGA:基于线性序列机的TLC5620型DAC驱动设计
- 浙江大学计算机云南分数线,985大学在云南录取分数排名,想上清北、浙大、南大至少这个成绩...
- 美国老师用的思维导图书,真正培养孩子的思维能力!
热门文章
- 鸿蒙hpm网站,【HarmonyOS HiSpark IPC试用】用hpm获取源码方式环境-hpm安装 鸿蒙HarmonyOS技术社区PCB联盟网 - Powered by Discuz!...
- 2020 豆瓣电影榜单出炉,直接在豆瓣上看电影吧
- 推荐几款优秀的开源编程字体
- Linux性能优化(九)——Kernel Bypass
- 《Java程序员面试宝典(第4版)》试读感想
- PHP开发从入门到实战教程分享
- 食住玩|3dmax2009到3dmax2022下载安装软件渲染器VRAY与CORONA,提升3dmax疯狂模渲大师一点儿不难!
- php 扫描器源代码,php端口扫描器代码
- 基于时空网络的出租车OD需求预测-模型框架(附数据集下载方式)
- Protel 99SE安装向导