由于在服务器上安装tesseract  yum只能拉到3.X版本 而测试来看4.0以上版本识别效果比3.x要好很多。于是只能通过编译代码形式安装最新版了

首先在机器上找个目录 打开官方git   https://github.com/tesseract-ocr

打到4.1分支 我们在服务器上找个目录  git clone https://github.com/tesseract-ocr/tesseract.git

如果新机器就随手安装上工具包

yum install gtk2-devel yasm glibc.i686 libstdc++.so.6 libgtk-x11-2.0.so libatk-1.0.so.0 libcairo.so.2 libcups.so.2 libgdk-x11-2.0.so.0 libgdk_pixbuf-2.0.so.0 libgtk-x11-2.0.so.0 libpango-1.0.so.0 libpangocairo-1.0.so.0 libICE.so.6 libSM.so.6 libmng.so.1 libpng12.so.0 libGLU.so.1 -y

安装开发工具

yum groupinstall "Development Tools"

安装leptonica1.7(4.0要修必须在1.74以上)

wget http://www.leptonica.org/source/leptonica-1.74.4.tar.gz

tar -xzvf leptonica-1.74.4.tar.gz

cd leptonica-1.74.4./configure --prefix=/usr/local/

make && make install

配置环境

vim \etc\bashrc

加入

PKG_CONFIG_PATH=$PKG_CONFIG_PATH:/usr/local/lib/pkgconfig

export PKG_CONFIG_PATH

CPLUS_INCLUDE_PATH=$CPLUS_INCLUDE_PATH:/usr/local/include/

export CPLUS_INCLUDE_PATH

C_INCLUDE_PATH=$C_INCLUDE_PATH:/usr/local/leptonica/include/leptonica

export C_INCLUDE_PATH

LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/lib

export LD_LIBRARY_PATH

LIBRARY_PATH=$LIBRARY_PATH:/usr/local/lib

export LIBRARY_PATH

TESSDATA_PREFIX=/root/tesseract/

export TESSDATA_PREFIX

最后刷新

source /etc/bashrc

回到tesseract目录,开始安装

./autogen.sh

./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/include

注:这时有可能会报 configure: error: Leptonica 1.74 or higher is required. Try to install libleptonica-dev package.

明明我们已经安装了的。为什么还会报呢?

那就要加入环境变量

vim /etc/profile

在最后插入

export LD_LIBRARY_PATH=$LD_LIBRARY_PAYT:/usr/local/lib

export LIBLEPT_HEADERSDIR=/usr/local/include

export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig

最后刷新下文件

source /etc/profile

然后我们再执行

./autogen.sh./configure --with-extra-includes=/usr/local/include --with-extra-libraries=/usr/local/include

这时就没有 leptonica问题啦,随后make下

make && sudo make install

最后我们用代码测试一切都正常,但到项目中却莫明奇妙地失败,断点服务直接崩掉,cache不住,找不到报错

各种百度google最后确认下来可能少了tess4j要的linux依赖库

执行下

cp /usr/local/lib/*.so.* /usr/lib64/

如果报

Error in findTiffCompression: function not present

Error in pixReadStreamTiff: function not present

Error in pixReadStream: tiff: no pix returned

Error in pixRead: pix not read

Unsupported image type.

相关。

那就是没有少了png和jpge依赖库

yum install libjpeg-develyum install libpng-devel

进入leptonica的安装文件夹重新编译

./configuremake

make install

到此基本所有问题都 解决了。运行项目正常

java ocr linux_linux (centos7)上装Tesseract-OCR最新版本(5.0)相关推荐

  1. Google Chrome 浏览器最新版本 71.0.3578.98(正式版本) (64 位)

    Google Chrome 浏览器 最新版本 71.0.3578.98(正式版本) (64 位) 链接地址:https://share.weiyun.com/5uX1wRc 转载于:https://w ...

  2. php 7.0 nts,PHP最新版本7.0.1-nts-Win32-VC14-x86

    [实例简介] PHP最新版本7.0.1-nts-Win32-VC14-x86 VC14 x86 Non Thread Safe (2015-Dec-16 23:44:11) 官方版本 [实例截图] [ ...

  3. tomcat 7 最新版本 apache-tomcat-7.0.109

    tomcat 7 漏洞修复 tomcat 7 最新版本 apache-tomcat-7.0.109.zip 下载地址: https://wwm.lanzouy.com/i8YMK07hu7na apa ...

  4. 升级至win10 最新版本10.0.17134,远程桌面连接Window Server时报错信息如下

    升级至win10 最新版本10.0.17134,远程桌面连接Window Server时报错信息如下: 出现身份验证错误,要求的函数不正确,这可能是由于CredSSP加密Oracle修正. 解决方法: ...

  5. 关于虚拟串口驱动专业版 Eltima Virtual Serial Port Driver Pro 最新版本 V10.0.979

    关于虚拟串口驱动专业版 Eltima Virtual Serial Port Driver Pro 最新版本 V10.0.979 Virtual Serial Port Driver PRO 是基于「 ...

  6. java最新版怎么安装_Java JDK 最新版本安装与环境配置

    Java 更新速度越来越快,版本迭代也是越来越多,以前的教程中的页面和流程亦有变化,故更新一下.本文使用日前最新版本 Java SE 15为模版. 1. 下载 Java SE 15 地址 下载完成后即 ...

  7. CentOS7(图显)安装最新版本NVIDIA 显卡驱动

    System Version:CentOS 7.9.2009 内核版本:Linux localhost.localdomain 3.10.0-1160.el7.x86_64 #1 SMP Mon Oc ...

  8. Centos7 安装向日葵(最新版本)

    你安装的向日葵是否出现版本过低,月底不再提供更新,需要更新向日葵远程软件版本 1.首先从向日葵官网上下载最新版本的向日葵软件(.rpm) 2.然后下载好的rpm文件,放到服务器指定目录 /usr/sr ...

  9. mysql8.0.12url_使用最新版本MySQL8.0.12报错记录

    使用最新版本MySQL报错,MySQL版本8.0.12. 报错1: Sun Oct 14 00:45:30 CST 2018 WARN: Establishing SSL connection wit ...

  10. mysql8 修改密码_最新版本mysql8.0.18windows x64部署手册

    mysql是Web世界中使用最广泛的数据库服务器.SQLite的特点是轻量级.可嵌入,但不能承受高并发访问,适合桌面和移动应用.而mysql是为服务器端设计的数据库,能承受高并发访问,同时占用的内存也 ...

最新文章

  1. 【网络爬虫】(1) 网络请求,urllib库介绍
  2. 八百客CRM:微信提现收费,仅仅用户钱包受了伤?
  3. 学习python需要什么基础-python编程学习需要哪些基础和准备工作?
  4. java array to string_数组到字符串转换(Array to string conversion)
  5. ViT (Vision Transformer) ---- RNN
  6. xgboost4j jar包下载
  7. Linux的匿名访问Samba
  8. VS2010+OpenCV2.4.6永久性配置方法
  9. 机器学习笔记1-What is Machine Learning
  10. DS homework-队列
  11. 【论文】Track to Detect and Segment: An Online Multi-Object Tracker
  12. 从头开始设计我的网游
  13. 前端js面试题(高级)
  14. win产品密钥大搜集
  15. matlab离群值处理,数据平滑和离群值检测
  16. ROS发布/订阅Float64MultiArray数组类消息(C++和Python相互发布和订阅)
  17. 病毒木马查杀实战第007篇:熊猫烧香之逆向分析(下)
  18. 小梅哥FPGA:基于线性序列机的TLC5620型DAC驱动设计
  19. 浙江大学计算机云南分数线,985大学在云南录取分数排名,想上清北、浙大、南大至少这个成绩...
  20. 美国老师用的思维导图书,真正培养孩子的思维能力!

热门文章

  1. 鸿蒙hpm网站,【HarmonyOS HiSpark IPC试用】用hpm获取源码方式环境-hpm安装 鸿蒙HarmonyOS技术社区PCB联盟网 - Powered by Discuz!...
  2. 2020 豆瓣电影榜单出炉,直接在豆瓣上看电影吧
  3. 推荐几款优秀的开源编程字体
  4. Linux性能优化(九)——Kernel Bypass
  5. 《Java程序员面试宝典(第4版)》试读感想
  6. PHP开发从入门到实战教程分享
  7. 食住玩|3dmax2009到3dmax2022下载安装软件渲染器VRAY与CORONA,提升3dmax疯狂模渲大师一点儿不难!
  8. php 扫描器源代码,php端口扫描器代码
  9. 基于时空网络的出租车OD需求预测-模型框架(附数据集下载方式)
  10. Protel 99SE安装向导