下面code是对Tesseract-OCR 3.04版本进行简单使用的举例:包括两段,一个是读入带有中文字符的图像,一个是读入仅有英文字符的图像:

#include "funset.hpp"#include <iostream>
#include <string>
#include <vector>#include <allheaders.h>#include <baseapi.h>
#include <basedir.h>
#include <renderer.h>
#include <strngs.h>
#include <tprintf.h>
#include <openclwrapper.h>namespace {#ifdef _MSC_VER
void utf8_to_gbk(const char* utf8, char* gbk)
{const int maxlen = 128;wchar_t unicode_str[maxlen];int outlen = MultiByteToWideChar(CP_UTF8, 0, utf8, strlen(utf8), unicode_str, maxlen);outlen = WideCharToMultiByte(CP_ACP, 0, unicode_str, outlen, gbk, 128, nullptr, nullptr);gbk[outlen] = '\0';
}
#endif} // namespaceint test_recognize_image_content_1()
{// reference: https://github.com/tesseract-ocr/tesseract/wiki/APIExample
{ // chinese// Initialize tesseract-ocrtesseract::TessBaseAPI* api = new tesseract::TessBaseAPI();const char* datapath{ "E:/GitCode/OCR_Test/test_data/tessdata/" };if (api->Init(datapath, "chi_sim")) {fprintf(stderr, "Could not initialize tesseract.\n");return -1;}// Open input image with leptonica libraryPix* image = pixRead("E:/GitCode/OCR_Test/test_data/chi_sim_1.png");api->SetImage(image);// Get OCR resultchar* outText = api->GetUTF8Text();char gbk[256];utf8_to_gbk(outText, gbk);fprintf(stdout, "OCR output: %s\n", gbk);// Destroy used object and release memoryapi->End();delete api;delete[] outText;pixDestroy(&image);
}{ // english// Initialize tesseract-ocrtesseract::TessBaseAPI* api = new tesseract::TessBaseAPI();const char* datapath{ "E:/GitCode/OCR_Test/test_data/tessdata/" };if (api->Init(datapath, "eng")) {fprintf(stderr, "Could not initialize tesseract.\n");return -1;}// Open input image with leptonica libraryPix* image = pixRead("E:/GitCode/OCR_Test/test_data/eng_1.png");api->SetImage(image);// Get OCR resultchar* outText = api->GetUTF8Text();char gbk[256];utf8_to_gbk(outText, gbk);fprintf(stdout, "OCR output: %s\n", gbk);// Destroy used object and release memoryapi->End();delete api;delete[] outText;pixDestroy(&image);
}return 0;
}

测试图像如下:

执行结果如下:

GitHub: https://github.com/fengbingchun/OCR_Test

Tesseract-OCR 3.04简单使用举例(读入图像输出识别结果)相关推荐

  1. Tesseract OCR简介(三)--安装及参数使用

    参考:AI-Tesseract-OCR简介_花熊的博客-CSDN博客_tesseract坐标 一.windows 1.1 Tesseract安装 适用于Tesseract 3.05和Tesseract ...

  2. 关于Tesseract OCR 中文训练识别小试(java调用Tess4j)

    2017.9.20日小结 最近接到是关于消防系统协议解析仪器的项目,目的是从协议解析仪器获取有效数据,并解析数据(目的是不希望消防主机的数据信息再传给主机厂商而是最后能给自己收集调用).由于各个消防器 ...

  3. Tesseract OCR与文本智能识别

    博主简介 博主是一名大二学生,主攻人工智能研究.感谢让我们在CSDN相遇,博主致力于在这里分享关于人工智能,c++,Python,爬虫等方面知识的分享. 如果有需要的小伙伴可以关注博主,博主会继续更新 ...

  4. Tesseract OCR——Windows 10 + CMake-GUI + Visual Studio 2019下编译和使用解决方案

    基本概念 Tesseract OCR:Tesseract-OCR 引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一.然而,HP不久便决定放弃OCR业务 ...

  5. C#使用Tesseract OCR 解析验证码

    下面介绍一个开源的OCR引擎Tesseract2.值得庆幸的是虽然是开源的但是它的识别率较高,并不比其他引擎差劲.网上介绍Tessnet2也是当时时间排名第三的识别引擎,只是后来慢慢不维护了,目前是G ...

  6. [转]tesseract OCR Engine overview字符识别学习

    原文地址:http://blog.csdn.net/viewcode/article/details/7790065 正文: 原文: An Overview of the Tesseract OCR ...

  7. android自动识别文字,Android文字识别tesseract ocr -训练样本库 识别字库

    目录 安装tesseract ocr引擎和jTessBoxEditor 安装jTessBoxEditor 开始制作box 准备好训练的图片 将图片转为tif格式的样本图片 合并样本图片 修改box文件 ...

  8. Tesseract OCR简介(一)

    简介 Tesseract(/'tesərækt/) 这个词的意思是"超立方体",指的是几何学里的四维标准方体,又称"正八胞体".右图是一个正八胞体绕着两个四维空 ...

  9. An Overview of the Tesseract OCR Engine译文

    An Overview of the Tesseract OCR Engine译文 Abstract Tesseract OCR引擎以及UNLV OCR精度第四次年度测试中的HP Research P ...

最新文章

  1. centos上安装zookeeper
  2. Vista下的Asp.net Mvc安装
  3. 虚幻UE4常见问题最全集合
  4. 专访 | 德国大神Hans Uszkoreit:语言才是AI的关键,深度学习无法解决NLP的核心问题...
  5. matlab z变换离散化_用C++编写一个简单的光栅化渲染器:3D篇
  6. ie下按keydown事件会触发button
  7. 875. Koko Eating Bananas
  8. php表单提交邮箱_最全实现dede订单表单提交发送到指定邮箱(附前台设置)
  9. 【OpenCV 例程200篇】42. 图像的灰度变换(比特平面分层)
  10. 阶段1 语言基础+高级_1-3-Java语言高级_06-File类与IO流_01 File类_3_绝对路径和相对路径...
  11. [笔记]深入解析Windows操作系统《二》系统架构
  12. arduino控制雨滴传感器
  13. 一元二次方程极简新解法
  14. SAP内部订单BAPI扩展字段
  15. navicat cannot create file 文件名、目录名或卷标语法不正确 解决方法
  16. 短信与社交app的好处
  17. Unity 打包快手
  18. v-show和v-if
  19. .NET 6新东西--PeriodicTimer
  20. Pygraphviz安装失败应该怎么办?

热门文章

  1. Socket:注意事项
  2. C++:map用法示例
  3. LabVIEW OCR 实现车牌识别(实战篇—3)
  4. 爱好历史的程序员,不容错过!
  5. LeetCode刷题记录8——605. Can Place Flowers(easy)
  6. 关于hp惠普笔记本电脑清洗(真的要水洗哟)
  7. 解决微信H5获取SDK授权报错提示errMsg: “config:fail,Error: 系统错误,错误码:63002,invalid signature [20200908 22:17:17][]“
  8. 【力扣网练习题】合并两个有序链表
  9. 在Blender中制作火箭发射烟雾和火焰模拟的动画
  10. Lumion模型库 Unique Pro Lumion Library 2021