1.基础样例

#include <tesseract/baseapi.h>
#include <leptonica/allheaders.h>int main()
{char *outText;tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();// 初始化tesseract-ocr，使用英语，不指定数据路径if (api->Init(NULL, "eng")) {fprintf(stderr, "Could not initialize tesseract.\n");exit(1);}// 使用 leptonica library 打开图片Pix *image = pixRead("/usr/src/tesseract/testing/phototest.tif");api->SetImage(image);// 获得最终的结果outText = api->GetUTF8Text();printf("OCR output:\n%s", outText);// 删除对象释放内存api->End();delete [] outText;pixDestroy(&image);return 0;
}

2.获得元素图片样例

  Pix *image = pixRead("/usr/src/tesseract/testing/phototest.tif");tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();api->Init(NULL, "eng"); //初始化tesseractapi->SetImage(image); //获得图像Boxa* boxes = api->GetComponentImages(tesseract::RIL_TEXTLINE, true, NULL, NULL); //获得元素图像printf("Found %d textline image components.\n", boxes->n);for (int i = 0; i < boxes->n; i++) {BOX* box = boxaGetBox(boxes, i, L_CLONE);api->SetRectangle(box->x, box->y, box->w, box->h); //获得元素的位置char* ocrResult = api->GetUTF8Text();  //获得对应文字int conf = api->MeanTextConf();fprintf(stdout, "Box[%d]: x=%d, y=%d, w=%d, h=%d, confidence: %d, text: %s",i, box->x, box->y, box->w, box->h, conf, ocrResult);}

以上是获得元素图片的基本方法，下面分析它所用到的一些方法。

Boxa* GetComponentImages(const PageIteratorLevel level,const bool text_only,Pixa** pixa, int** blockids)

GetComponentImages方法有四个参数，第一个参数设置分割的等级，它总共有5个选项。

选项	描述	原文
RIL_BLOCK	按块分	Block of text/image/separator line
RIL_PARA	按段分	Paragraph within a block
RIL_TEXTLINE	按行分	Line within a paragraph
RIL_WORD	按单词分	Word within a textline
RIL_SYMBOL	按字母分	Symbol/character within a word

这些参数的好处是可以将图像，不同类别的文字区别开，然后再进行处理。

第二个参数text_only为真，则只返回文字区域坐标，不返回图像区域坐标。
第三个参数pixa用于返回分割出来的图像，Null表示不返回图像。
第四个参数blockids返回序列号

该方法的返回值是一个结构体

struct Box
{l_int32            x;l_int32            y;l_int32            w;l_int32            h;l_uint32           refcount;      /* reference count (1 if no clones)  */};
typedef struct Box    BOX;struct Boxa
{l_int32            n;             /* number of box in ptr array        */l_int32            nalloc;        /* number of box ptrs allocated      */l_uint32           refcount;      /* reference count (1 if no clones)  */struct Box       **box;           /* box ptr array                     */
};
typedef struct Boxa  BOXA;

boxaGetBox是获得矩形数组中的某个矩形，L_CLONE是软拷贝，L_COPY是硬拷贝
MeanTextConf用于返回置信度

3.结果迭代样例

Pix *image = pixRead("/usr/src/tesseract/testing/phototest.tif");tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();api->Init(NULL, "eng");  //初始化api->SetImage(image);  //读取图片api->Recognize(0);tesseract::ResultIterator* ri = api->GetIterator();tesseract::PageIteratorLevel level = tesseract::RIL_WORD;if (ri != 0) {do {const char* word = ri->GetUTF8Text(level);float conf = ri->Confidence(level);int x1, y1, x2, y2;ri->BoundingBox(level, &x1, &y1, &x2, &y2);printf("word: '%s';  \tconf: %.2f; BoundingBox: %d,%d,%d,%d;\n",word, conf, x1, y1, x2, y2);delete[] word;} while (ri->Next(level));}

4. osd样例

  const char* inputfile = "/usr/src/tesseract/testing/eurotext.tif";tesseract::Orientation orientation;tesseract::WritingDirection direction;tesseract::TextlineOrder order;float deskew_angle;PIX *image = pixRead(inputfile);tesseract::TessBaseAPI *api = new tesseract::TessBaseAPI();api->Init("/usr/src/tesseract/", "eng");api->SetPageSegMode(tesseract::PSM_AUTO_OSD);api->SetImage(image);api->Recognize(0);tesseract::PageIterator* it =  api->AnalyseLayout();it->Orientation(&orientation, &direction, &order, &deskew_angle);printf("Orientation: %d;\nWritingDirection: %d\nTextlineOrder: %d\n" \"Deskew angle: %.4f\n",orientation, direction, order, deskew_angle);

osd进行页面的方向检测和文字的方向检测，文字方向检测主要是看文字的阅读方向。
SetPageSegMode设置页面分割模式。

enum PageSegMode {PSM_OSD_ONLY,       ///< Orientation and script detection only.PSM_AUTO_OSD,       ///< Automatic page segmentation with orientation and///< script detection. (OSD)PSM_AUTO_ONLY,      ///< Automatic page segmentation, but no OSD, or OCR.PSM_AUTO,           ///< Fully automatic page segmentation, but no OSD.PSM_SINGLE_COLUMN,  ///< Assume a single column of text of variable sizes.PSM_SINGLE_BLOCK_VERT_TEXT,  ///< Assume a single uniform block of vertically///< aligned text.PSM_SINGLE_BLOCK,   ///< Assume a single uniform block of text. (Default.)PSM_SINGLE_LINE,    ///< Treat the image as a single text line.PSM_SINGLE_WORD,    ///< Treat the image as a single word.PSM_CIRCLE_WORD,    ///< Treat the image as a single word in a circle.PSM_SINGLE_CHAR,    ///< Treat the image as a single character.PSM_SPARSE_TEXT,    ///< Find as much text as possible in no particular order.PSM_SPARSE_TEXT_OSD,  ///< Sparse text with orientation and script det.PSM_RAW_LINE,       ///< Treat the image as a single text line, bypassing///< hacks that are Tesseract-specific.PSM_COUNT           ///< Number of enum entries.
};

参考文献:
https://github.com/tesseract-ocr/tesseract/wiki/APIExample

tesseract 样例相关推荐

YOLOv4 资源环境配置和测试样例效果
YOLOv4 资源环境配置和测试样例效果基本环境:cuda=10.0,cudnn>=7.0, opencv>=2.4 一.下载yolov4 git clone https://githu ...
2021年大数据常用语言Scala（三十二）：scala高级用法样例类
目录样例类定义样例类样例类方法样例对象样例类样例类是一种特殊类,它可以用来快速定义一个用于保存数据的类(类似于Java POJO类),而且它会自动生成apply方法,允许我们快速地创建样例 ...
在Ubuntu下构建Bullet以及执行Bullet的样例程序
在Ubuntu下构建Bullet以及执行Bullet的样例程序 1.找到Bullet的下载页,地址是:https://code.google.com/p/bullet/downloads/list 2 ...
JDBC连接MySQL数据库及演示样例
JDBC是Sun公司制定的一个能够用Java语言连接数据库的技术. 一.JDBC基础知识 JDBC(Java Data Base Connectivity,java数据库连接)是一种用 ...
Oracle简单脚本演示样例
Oracle简单脚本演示样例 1.添加表 --改动日期:2014.09.21 --改动人:易小群 --改动内容:新增採购支付情况表 DECLARE VC_STR VARCHAR2( ...
【ZooKeeper Notes 3】ZooKeeper Java API 使用样例
查看PDF版本转载请注明:@ni掌柜 nileader@gmail.com ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务框架,包含一组简单的原语集合.通过这些原语言的组合使用, ...
ACMNO.24 C语言-转置矩阵写一个函数，使给定的一个二维数组（３×３）转置，即行列互换。输入一个3x3的矩阵输出转置后的矩阵样例
题目描述写一个函数,使给定的一个二维数组(3×3)转置,即行列互换. 输入一个3x3的矩阵输出转置后的矩阵样例输入 1 2 3 4 5 6 7 8 9 样例输出 1 4 7 2 5 8 3 ...
ACMNO.21 C语言-逆序输出输入10个数字，然后逆序输出。输入十个整数输出逆序输出，空格分开样例输入 1 2 3 4 5 6 7 8 9 0
题目描述输入10个数字,然后逆序输出. 输入十个整数输出逆序输出,空格分开样例输入 1 2 3 4 5 6 7 8 9 0 样例输出 0 9 8 7 6 5 4 3 2 1 提示数组?堆栈 ...
ACMNO.19 C语言-对角求和求一个3×3矩阵对角线元素之和。输入矩阵输出主对角线副对角线元素和样例输入 1 2 3 1 1 1 3 2 1 样例输出 3 7
这个我做了改进,可以实现NXN的矩阵.求出对角线之和! 只需要修改定义的define z的值就好! 接下来,进入正题! 题目描述: 求一个3×3矩阵对角线元素之和. 输入矩阵输出主对角线副对角 ...

tesseract 样例

1.基础样例

2.获得元素图片样例

3.结果迭代样例

4. osd样例

tesseract 样例相关推荐

最新文章

热门文章