文字识别 SDK 11 给大家看一个手册
文通TH-OCR SDK 11,是北京文通科技有限公司研制开发的多语种亚洲语言文字识别软件开发包,提供强大的识别API开发接口,帮助用户将OCR文字识别技术无缝内嵌到用户业务系统中,为数字资源的建立提供了方便,快捷,稳定的技术手段。
TH-OCR SDK 支持简体中文、繁体中文、日文、韩文、纯英文的文字识别,具有识别率高、适应性强等突出的技术优势。
第一部分:许可协议
1.著作权声明
本产品软件著作权属于中华人民共和国北京文通信息技术有限公司(以下简称文通公司),本系统及使用说明书的著作权属于文通公司,受《中华人民共和国著作权法》、《计算机软件保护条例》以及国际版权公约和其他知识产权条约的保护。除以下授权之条款外,非经著作权人或其全权代理人之书面授权,任何与《协议书》不符的、以任何方式、任何文字所做局部或全部之复制、重制或转载、修改的行为均被法律明确禁止,违者将根据中华人民共和国有关法律承担民事及刑事责任。
2.授权
1) 您在使用期间作为合法用户应该持有《信誉卡》。此为获得售后服务、技术支持、升级服务以及进行法律追索必要的资格证明。
2) 您可在《使用许可协议》规定的范围内使用本系统。
3) “使用”指您利用本系统提供的功能对本系统的数据进行访问。
3.授权限制
1) 禁止利用本系统从事任何违反中华人民共和国现行法律、法规的活动。
2) 本系统作为一个整体,禁止您在《使用许可协议》许可范围以外使用。
禁止使用的范围包括但不限于:
(A)将本系统的部分或全部嵌入其他计算机软件系统;
(B)将本系统的任何内容用于BBS、INTERNET等多使用者的环境;
3) 禁止您将本系统的全部或部分用于销售、出租、转让、出借、散布、公开展示或从事其他损害著作权人权利的行为,不得将本系统的复制品在未得到著作权人或其代理人同意的前提下分发给任何第三方。
4) 禁止您对本系统进行任何更改、反编译(decompile)、软件还原工程(reverse-dengineer the software)、反汇编(disassemble)、或任何更改原始程序设计系统上的锁定与解除锁定。
5) 禁止非法盗拷或使用任何《使用许可协议》许可之外的存储媒介进行部分或整体内容的复制与贩售。
6) 禁止遮盖、移动或去除本系统著作权所有者的图形或文字说明。
7) 如果您未遵守《协议书》的条款,在不作任何通知的情况下,著作权人或其代理人有权终止授权。一旦发生此情况,您必须立即终止使用本系统并销毁所有副本。
4.有限担保
在本系统交付给您60天内,如发现软件载体有任何非人为的损坏,请在此期间内凭《信誉卡》与文通公司联系,可获得修理或更换。由于人为损坏、操作不当或使用错误所引起的故障,不承担任何责任。
5.对用户的赔偿
在法律所允许的范围内, 您因使用或不能使用本系统所发生的任何直接的或间接的损失(包括但不限于营业利润的损失、营业中断、商业信息的遗失或其它金钱上的损失),文通公司均不承担赔偿责任。
文通公司为本系统唯一的制作、发行、维护及进行法律追索的代理人。
未经本协议书明确授予的权利均予保留。
文通公司保留对《协议书》的解释权。《协议书》受中国法律保护和管辖,发生法律纠纷时选择北京地区的法院作为管辖法院。
第二部分:系统最小配置
操作系统: Windows 2000、Windows XP、Windows 2003操作系统 及以上版本;
CPU:586以上;
内存:256M以上。
杨晓伟
第三部分:系统文件概述
1.BIN目录
包括识别核心所需要的各种数据文件。
2.SDK目录
Th_ocr32_Dll.dll 该文件是本SDK直接调用的DLL, 供用户在程序中调用。
TH-OCR SDK 11 用户手册.PDF 即本自述文件。
Th_ocr32.h 该文件为用户用C或C++调用DLL时的include文件,主要为数据结构的定义。若用户在VB环境下调用,须转换成相应的VB格式。
Th_ocr32_Dll.lib VS2008格式的库文件,如果使用静态连接DLL,需要使用该库。
3.shared dll目录
包含VS2008下的MFC运行库
4.Driver目录
包含加密狗的驱动
第四部分:系统功能简介
本系统具有TH-OCR系统识别核心所有功能,包括:
l 支持TIFF,PCX,BMP,JPG格式图象的读取,支持Packbits和G4压缩的TIFF格式;
l 可以对图象由于扫描引起的倾斜进行自动校正;
l 可以对图象进行自动版面分析;
l 支持GB_2312码(大陆使用)、BIG_5码(台湾使用)、GBK、JIS、Shift-JIS(日文使用)、KSC(韩文)内码的输出;
l 能识别纯英文,简繁体中文、日文、韩文、中英文混排的文本图象。
第五部分系统调用方法
1.用于识别的函数
1)``TH_Start
2)``TH_StartExW
3)``TH_StartExA
4)``TH_SetOutOcrFile
5)``TH_LoadImageA
6)``TH_LoadImageW
7)``TH_SetImage
8)``TH_SetImage2
9)``TH_SetLanguage
10)``TH_Layout
11)``TH_SetRegion
12)``TH_SkewAutoRotateW
13)``TH_SkewAutoRotateA
14)``TH_Recognize
15)``TH_End
函数详细说明如下
1) TH_Start
〖声明〗 TH_ERROR WINAPI TH_Start(HANDLE hApplication);
〖功能〗系统配置和内存分配
〖参数〗 hApplication 指用户应用程序句柄,可以为空。
〖返回值〗错误代码,见TH_ERROR。
2) TH_StartExW
〖声明〗TH_ERROR WINAPI TH_Start(HANDLE hApplication, LPCWSTR lpszOcrDLLPath);
〖功能〗系统配置和内存分配
〖参数〗 hApplication 指用户应用程序句柄,可以为空。
lpszOcrDLLPath 对应动态库的绝对路径,包括.dll的后缀。
〖注意〗 在使用该接口时,要确保动态库与对应的依赖bin文件在同一目录下。而不用与所调用程序在同一目录下。
〖返回值〗错误代码,见TH_ERROR。
3) TH_StartExA
〖声明〗 TH_ERROR WINAPI TH_Start(HANDLE hApplication LPCWSTR lpszOcrDLLPath);
〖功能〗系统配置和内存分配
〖参数〗 hApplication 指用户应用程序句柄,可以为空。
lpszOcrDLLPath 对应动态库的绝对路径,包括.dll的后缀。
〖注意〗 在使用该接口时,要确保动态库与对应的依赖bin文件在同一目录下。而不用与所调用程序在同一目录下。
〖返回值〗错误代码,见TH_ERROR。
4) TH_SetOutOcrFile
〖声明〗 TH_ERROR WINAPI TH_ SetOutOcrFile (int nGeneration);
〖功能〗 简化识别过程。调用该接口可以简化识别及其识别后的处理,但其作用有限,可能产生不可预知后果。非特殊情况,不建议使用该接口。
〖参数〗 nGeneration 是否简化识别过程,默认为是。
〖返回值〗错误代码,见TH_ERROR。
5) TH_LoadImageA
〖声明〗TH_ERROR WINAPI TH_LoadImageA(LPCSTR lpszImageFile, DWORD dwImgProOption);
〖功能〗打开当前识别的图象。非Unicode函数
〖参数〗 lpszImageFile 图片完整路径。
dwImgProOption 图像处理方法,见TH_IMGPRO_OPTION;
〖返回值〗错误代码,见TH_ERROR。
6) TH_LoadImageW
〖声明〗TH_ERROR WINAPI TH_LoadImageW(LPCWSTR lpszImageFile, DWORD dwImgProOption)
〖功能〗打开当前识别的图象。Unicode函数
〖参数〗同TH_LoadImageA
〖返回值〗错误代码,见TH_ERROR。
7) TH_SetImage
〖声明〗TH_ERROR WINAPI TH_SetImage( int nWidth, int nHeight, int nBitCount, LPBYTE lpImage, DWORD dwImgProOption);
〖功能〗打开当前识别的图象。
〖参数〗 nWidth 图片宽度。
nHeight 图片高度。
nWidth 图片宽度。
nBitCount 图片位数。
lpImage 图片内容的一维数组形式。
dwImgProOption图像处理方法,见TH_IMGPRO_OPTION;
〖返回值〗错误代码,TH_ERROR。
8) TH_SetImage2
〖声明〗TH_ERROR WINAPI TH_SetImage2( int nWidth, int nHeight, int nBitCount, LPBYTE *lpLine, DWORD dwImgProOption);
〖功能〗打开当前识别的图象。
〖参数〗 nWidth 图片宽度。
nHeight 图片高度。
nBitCount 图片位数。
lpLine 图像数据数组指针
dwImgProOption图像处理方法,见TH_IMGPRO_OPTION;
〖返回值〗错误代码,TH_ERROR。
9) TH_SetLanguage
〖声明〗TH_ERROR WINAPI TH_SetLanguage(int nLanguage);
〖功能〗设置识别默认语言;
〖注意〗识别前,未调用TH_SetRegion,此函数设置的默认语言有效;
〖参数〗nLanguage 语言,可选项见TH_RECOG_LANG;
〖返回值〗无返回值
10) TH_Layout
〖声明〗TH_ERROR WINAPI TH_Layout( int nOption, int nMaxRegion, LPTHREGION pRegion, int *nRegionCount);
〖功能〗自动版面分析
〖参数〗 nOption 保留值,必须为0。
nMaxRegion 预设置的区域数组长度
pRegion 预设置的区域数组,结构定义见THREGION
nRegionCount 版面分析后,传出的实际分析的区域数组长度。
〖返回值〗错误代码,见TH_ERROR。
11) TH_SetRegion
〖声明〗TH_ERROR WINAPI TH_SetRegion(LPTHREGION pRegion, int nRegion);
〖功能〗设置识别的区域
〖参数〗 pRegion 识别区域数组指针,结构定义见THREGION。
nRegion 识别区域数组长度。
〖返回值〗错误代码,见TH_ERROR。
12) TH_SkewAutoRotateW
〖声明〗TH_ERROR WINAPI TH_SkewAutoRotateW(const wchar_t* lpstrIMGInpath,const wchar_t* lpstrIMGOutpath);
〖功能〗自动倾斜校正
〖参数〗lpstrIMGInpath 输入图像路径。
lpstrIMGOutpath 倾斜校正后保存的图像路径。
〖返回值〗错误代码,见TH_ERROR。
13) TH_SkewAutoRotateA
〖声明〗TH_ERROR WINAPI TH_SkewAutoRotateA(const char* lpstrIMGInpath,const char* lpstrIMGOutpath);
〖功能〗自动倾斜校正。非Unicode函数
〖参数〗同TH_SkewAutoRotateW。
〖返回值〗错误代码,见TH_ERROR。
14) TH_Recognize
〖声明〗TH_ERROR WINAPI TH_Recognize();
〖功能〗识别操作
〖注意〗调用此函数前,如果没有调用TH_SetRegion,则自动进行版面分析,再识别。
〖返回值〗错误代码,见TH_ERROR。
15) TH_End
〖声明〗TH_ERROR WINAPI TH_End();
〖功能〗主要释放由TH_Start()所分配的内存。识别完成后必须调用此函数。
〖参数〗无
〖返回值〗错误代码,见TH_ERROR。
2.高级调用接口
用于设置进度显示的回调函数及识别结果取得的函数:
16) TH_SetCallBackAddress
17) TH_OutPutCharInfo
18) TH_OutPutCharInfoByRegion
19) TH_ SaveOCRFileW
20) TH_ SaveOCRFileA
21) TH_ LoadOCRFileW
22) TH_ LoadOCRFileA
函数详细说明如下:
16) TH_SetCallBackAddress
〖声明〗TH_ERROR WINAPI TH_SetCallBackAddress(LONG pStart, LONG pFinish, LONG pSetStage, LONG pSetPerc);
〖功能〗 用户设置的回调函数
〖参数〗 四个参数分别为下边四个回调函数的地址:
BOOL CALLBACK ProgressStart();
BOOL CALLBACK ProgressFinish();
BOOL CALLBACK ProgressSetStage(WORD wStageNumber, LPSTR lpStageName);
wStageNumber= 0 lpStageName=读取图象
wStageNumber= 1 lpStageName=版面分析
wStageNumber= 2 lpStageName=倾斜校正
wStageNumber= 3 lpStageName=识别
wStageNumber= 4 lpStageName=处理
BOOL CALLBACK ProgressSetPerc(WORD wPercent);
总的识别进度 0-100
〖返回值〗错误代码,见TH_ERROR。
17) TH_OutPutCharInfo
〖声明〗TH_ERROR WINAPI TH_OutPutCharInfo(int nMaxChar, LPTHCHARINFO pCharInfo, int *nCharCount);
〖功能〗获得图像中所有识别结果的数据;
〖参数〗 nMaxChar 预设置输出的识别字体信息长度;
pCharInfo 预设置输出的识别字体信息长度指针,结构定义见 THCHARINFO;
nCharCount 此函数返回的实际输出的识别字体信息长度;
〖返回值〗错误代码,见TH_ERROR。
18) TH_OutPutCharInfoByRegion
〖声明〗TH_ERROR WINAPI TH_OutPutCharInfoByRegion(int nMaxChar, LPTHCHARINFO pCharInfo, int *nCharCount, int nRegionIdx);
〖功能〗获得指定区域的文字识别结果,这个函数只有在调用了TH_SetRegion函数后才有效;
〖参数〗 nMaxChar 预设置输出的识别字体信息长度;
pCharInfo 预设置输出的识别字体信息长度指针,结构定义见 THCHARINFO;
nCharCount 此函数返回的实际输出的识别字体信息长度
nRegionIdx 指定区域序号,与TH_SetRegion函数中的序号一致;
〖返回值〗错误代码,见TH_ERROR。
19) TH_SaveOCRFileW
〖声明〗TH_ERROR WINAPI TH_SaveOCRFileW(const wchar_t* lpstrOcrpath);
〖功能〗写本地OCR识别结果文件
〖参数〗 lpstrOcrpath OCR文件路径。
〖返回值〗错误代码,见TH_ERROR。
20) TH_ SaveOCRFileA
〖声明〗TH_ERROR WINAPI TH_SaveOCRFileA(const char* lpstrOcrpath);
〖功能〗写本地OCR识别结果文件
〖参数〗 同 TH_SaveOCRFileW
〖返回值〗错误代码,见TH_ERROR。
21) TH_LoadOCRFileW
〖声明〗TH_ERROR WINAPI TH_LoadOCRFileW(const wchar_t* lpstrOcrpath);
〖功能〗读写本地OCR识别结果文件
〖注意〗如果调用此接口读取本地OCR文件,需先调用(TH_LoadImage或者TH_SetImage),不然会返回错误码:1
〖参数〗 lpstrOcrpath OCR文件路径。
〖返回值〗错误代码,见TH_ERROR。
22) TH_ LoadOCRFileA
〖声明〗TH_ERROR WINAPI TH_LoadOCRFileA(const char* lpstrOcrpath);
〖功能〗读写本地OCR识别结果文件
〖注意〗如果调用此接口读取本地OCR文件,需先调用(TH_LoadImage或者TH_SetImage),不然会返回错误码:1
〖参数〗 同 TH_LoadOCRFileW
〖返回值〗错误代码,见TH_ERROR。
3.用于导出文档的函数
用于导出文档的函数共四个:
23) TH_OutputBeginA
24) TH_OutputBeginW
25) TH_OutPutFile
26) TH_OutputEnd
函数详细说明如下:
23) TH_OutputBeginA
〖声明〗TH_ERROR WINAPI TH_OutputBeginA(LPCSTR lpszOutputFile ,TH_OUTPUTTYPE nType, DWORD dwOption);
〖功能〗设置导出参数。
〖参数〗 nType 导出的文档类型,见TH_OUTPUTTYPE;
dwOption 导出文件时的选项,根据导出的文件类型不同而有不同的定义。导出TXT的选项见TH_OUTPUT_TXT_ENCODE;导出PDF时的选项见TH_OUTPUT_PDF_OPTION;导出RTF时的选项见TH_OUTPUT_RTF_OPTION;
lpszOutputFile 导出文件路径;
〖返回值〗错误代码,见TH_ERROR。
24) TH_OutputBeginW
〖声明〗TH_ERROR WINAPI TH_OutputBeginW(LPCWSTR lpszOutputFile ,TH_OUTPUTTYPE nType, DWORD dwOption);
〖功能〗设置导出参数,Unicode版本。
〖参数〗 nType 导出的文档类型,见TH_OUTPUTTYPE;
dwOption 导出文件时的选项,根据导出的文件类型不同而有不同的定义。导出TXT的选项见TH_OUTPUT_TXT_ENCODE;导出PDF时的选项见TH_OUTPUT_PDF_OPTION;导出RTF时的选项见TH_OUTPUT_RTF_OPTION;
lpszOutputFile 导出文件路径,要求Unicode字符串;
〖返回值〗错误代码,见TH_ERROR。
25) TH_OutPutFile
〖声明〗TH_ERROR WINAPI TH_OutPutFile();
〖功能〗将当前处理的图像导出至文件;
〖参数〗无;
〖返回值〗错误代码,见TH_ERROR。
26) TH_OutputEnd
〖声明〗TH_ERROR WINAPI TH_OutputEnd();
〖功能〗导出完毕;
〖参数〗无;
〖返回值〗错误代码,见TH_ERROR。
4.补充增加的函数
补充增加的函数:
27) TH_LayoutEx
28) TH_SetRegionEx
29) TH_OutputBeginEx
函数详细说明如下:
27) TH_LayoutEx
〖声明〗TH_ERROR WINAPI TH_LayoutEx( int nOption, int nMaxRegion,RECT*rcBound,BYTE* iAttribute, BYTE* iField, BYTE* nRecoglang, int *nRegionCount);
〖功能〗自动版面分析
〖参数〗 nOption 保留值,必须为0。
nMaxRegion 预设置的区域数组长度
rcBound预设置的区域数组,结构定义见THREGION
iAttribute预设置的区域数组,结构定义见THREGION
iField预设置的区域数组,结构定义见THREGION
nRecoglang预设置的区域数组,结构定义见THREGION
nRegionCount 版面分析后,传出的实际分析的区域数组长度。
〖返回值〗错误代码,见TH_ERROR。
28) TH_SetRegionEx
〖声明〗TH_ERROR WINAPI TH_SetRegionEx(RECT*rcBound,BYTE* iAttribute, BYTE* iField, BYTE* nRecoglang, int nRegion);
〖功能〗设置识别的区域
〖参数〗 rcBound识别区域数组指针,结构定义见THREGION
iAttribute识别区域数组指针,结构定义见THREGION
iField识别区域数组指针,结构定义见THREGION
nRecoglang识别区域数组指针,结构定义见THREGION
nRegion 识别区域数组长度。
〖返回值〗错误代码,见TH_ERROR。
29) TH_OutputBeginEx
〖声明〗TH_ERROR WINAPI TH_OutputBeginA(LPCSTR lpszOutputFile ,int nType, DWORD dwOption);
〖功能〗设置导出参数。
〖参数〗 nType 导出的文档类型;
dwOption 导出文件时的选项,根据导出的文件类型不同而有不同的
定义。导出TXT的选项见TH_OUTPUT_TXT_ENCODE;导出PDF时的选项见TH_OUTPUT_PDF_OPTION;导出RTF时的选项见TH_OUTPUT_RTF_OPTION;
lpszOutputFile 导出文件路径;
〖返回值〗错误代码,见TH_ERROR。
第六部分数据结构及宏定义
1.函数返回值TH_ERROR
typedef enum
{
TH_ERR_NONE,
TH_ERR_LOADIMAGE,
TH_ERR_UNSUPPORT, // unsupported feature, wating for next version
TH_ERR_OPENFILE, // open file error
TH_ERR_UNKNOWN, // the error is not define
TH_ERR_NODONGLE,
TH_ERR_USERABORT, // user abort when recognized
TH_ERR_READLIB, // read recognition library error
TH_ERR_LIBNOTEXIST, // recognition library is not exist
TH_ERR_TOOMANYREGION, // too many region result when layout analysis
TH_ERR_RECOGNIZEFAIL, // Recognize fail
TH_ERR_FILEALREADYEXIST, // Export file already exist
TH_ERR_IMAGETYPE_NONSUPPORT, // image type nonsupport
TH_ERR_IMAGE_SPLITFAIL, // image split fail
TH_ERR_IMAGE_NOEXIST, // image is no exist
TH_ERR_NOTBINARY, // not binary image
} TH_ERROR;
2.数据结构
1) THREGION 区域数据结构
识别区域数据结构。
typedef struct _thregion
{
RECT rcBound;
BYTE iAttribute; // RGNTYPE_xxx region type
BYTE iField;
TH_RECOG_LANG nRecog_lang;//TH_RECOG_LANG
}
THREGION, FAR * LPTHREGION;
rcBound:区域的rect值;
iAttribute:区域的类型,见THRGNTYPE;
iField:保留值,未定义。
nRecog_lang:区域的识别语言,见TH_RECOG_LANG。
2) THCHARINFO
识别结果结构THREGION
typedef struct
{
WORD wCode; // 字符编码,Unicode
WORD wCharAttrib; // 字符属性,
RECT rcBlock; // 字符边框,
WORD wCandidate[5]; // 侯选字
BYTE nConfidence[5]; // 置信度
}
THCHARINFO, * LPTHCHARINFO;
3.宏定义
1) TH_IMGPRO_OPTION
加载图像时图像处理的参数。
TH_IMGPRO_OPTION |
取值 |
说明 |
0 |
直接加载图像,不进行任何图像处理 |
|
TH_IMGPRO_DESKEW |
1 |
进行自动倾斜校正 |
TH_IMGPRO_AUTOREVERSE |
2 |
保留值,未实现 |
TH_IMGPRO_GRAY_METHOD |
0x0F00 |
保留值,未实现 |
TH_IMGPRO_BIN_METHOD |
0x6000 |
对装入的图像进行二值化处理,如装入的图像非二值图,建议使用此方法 |
2) TH_RECOG_LANG
识别语言选项。
TH_RECOG_LANG |
取值 |
说明 |
TH_RECOG_SIMPLIFIED |
0 |
简体中文 |
TH_RECOG_TRADITIONAL |
1 |
繁体中文 |
TH_RECOG_PUREENGLISH |
2 |
纯英文和数字 |
TH_RECOG_JAPANESE |
3 |
日文 |
TH_RECOG_HANDWRITTEN |
4 |
手写体 |
TH_RECOG_SIMPLIFIED_LEVEL_2 |
5 |
简体大字符集 |
TH_RECOG_TRADITIONAL_LEVEL_2 |
6 |
繁体大字符集 |
TH_RECOG_KOREAN |
7 |
韩文 |
3) THRGNTYPE
版面分析区域类型。
THRGNTYPE |
取值 |
说明 |
RGNTYPE_HORZTEXT |
0 |
水平文本 |
RGNTYPE_VERTTEXT |
1 |
垂直文本 |
RGNTYPE_FORM |
2 |
表格 |
RGNTYPE_GRAPH |
3 |
图片 |
4) TH_OUTPUTTYPE
导出文档类型。
TH_OUTPUTTYPE |
取值 |
说明 |
TH_OUTPUT_TXT |
0 |
导出txt文档 |
TH_OUTPUT_PDF |
1 |
导出pdf文档 |
TH_OUTPUT_RTF |
2 |
导出rtf文档 |
TH_OUTPUT_XLS |
3 |
导出xls文档 |
5) TH_OUTPUT_TXT_ENCODE
导出文本文件选项。
TH_OUTPUT_TXT_ENCODE |
取值 |
说明 |
TH_OUTPUT_TXT_UNICODE |
0 |
导出的TXT文档为unicode格式 |
TH_OUTPUT_TXT_GB2312 |
1 |
保留值,未实现 |
TH_OUTPUT_TXT_BIG5 |
2 |
同上 |
TH_OUTPUT_TXT_SJIS |
3 |
同上 |
TH_OUTPUT_TXT_KCS |
4 |
同上 |
TH_OUTPUT_TXT_UTF8 |
5 |
同上 |
TH_OUTPUT_TXT_ISO1252 |
6 |
同上 |
详情可直接联系哦。。杨晓伟
6) TH_OUTPUT_PDF_OPTION
导出PDF文件选项。
TH_OUTPUT_PDF_OPTION |
取值 |
说明 |
TH_OUTPUT_PDF_SEARCHABLE |
0 |
双层PDF |
TH_OUTPUT_PDF_IMAGE |
1 |
图像PDF |
TH_OUTPUT_PDF_TXT |
2 |
文字PDF |
7) TH_OUTPUT_RTF_OPTION
导出RTF文件选项。
TH_OUTPUT_RTF_OPTION |
取值 |
说明 |
TH_OUTPUT_RTF_TEXT |
0 |
简单文本 |
TH_OUTPUT_RTF_PLAIN |
1 |
输出字号 |
TH_OUTPUT_RTF_LAYOUT |
2 |
精确版面还原 |
TH_OUTPUT_RTF_TYPE |
3 |
类型mask |
TH_OUTPUT_RTF_AUTOWRAP |
4 |
去除硬回车 |
TH_OUTPUT_RTF_IMAGE |
8 |
输出图像 |
TH_OUTPUT_RTF_TABLE |
16 |
输出表格 |
示第七部分例说明
工程名称 |
工程描述 |
vc++ using ocx |
使用vs2008 工程调用OCX |
vc++using win32 dll |
使用vs2008 工程调用DLL |
Vc# using ocx |
使用vs2008 工程调用OCX |
Vc# using win32 dll |
使用vs2008 工程调用DLL |
VB.NET using win32 dll |
使用vs2008 工程调用DLL |
VB.NET using ocx |
使用vs2008 工程调用OCX |
Delphi using win 32 dll |
使用Delphi2010工程调用DLL |
Delphi using ocx |
使用Delphi2010工程调用OCX |
JavaScript using ocx |
JavaScript 使用ocx |
文字识别 SDK 11 给大家看一个手册相关推荐
- 单张、批量识别图片中文字(写入txt文件、窗口视图创建、打包.exe文件)(百度文字识别SDK+Python的GUI之tklinker+打包pyinstaller)
昨天我姐问我有没有软件可以批量识别图片上的文字,她在帮客户做资料整理,但是用的方法只能一张一张上传识别,不仅效率低还浪费时间. 我就找了找批量识别的软件,下载下来觉得:嗯?不错,界面也挺好,小东西做 ...
- java代码编写的文本特征提取_Test1 java语言写的特征提取源代码,有搞文字识别的可以下载一看,简单易学 Develop 274万源代码下载- www.pudn.com...
文件名称: Test1下载 收藏√ [ 5 4 3 2 1 ] 开发工具: Java 文件大小: 35 KB 上传时间: 2015-03-02 下载次数: 46 提 供 者: 常杰 详细说 ...
- TH-OCR文字识别SDK 12.X介绍
TH-OCR文字识别SDK 文通科技TH-OCR文字识别SDK,支持识别中文简繁体.藏文.维吾尔文.日文.韩文.中英文字混排等十余门语种,提供标准API接口,供软件开发人员.系统集成商.数据加工商(B ...
- 百度云AI文字识别SDK在node中的使用
本文将介绍如何在koa项目中使用百度云AI文字识别SDK 文章目录 前言 使用步骤 前言 本文通过使用百度云AI文字识别SDK来实现身份证识别和手写签名识别功能来描述OCR SDK的使用方式 使用步骤 ...
- Android笔记(二十):写一个图片文字识别SDK给自己用
背景 市面上文字识别大多需要开通会员才能使用,所以决定自己封装一个sdk出来,供后面开发扫描类app提供便捷工具 效果 SDK API 初始化 需进行初始化才能使用sdk EasyOcrSDK.get ...
- 私有化部署文字识别SDK
表格表单是一种高度精炼,集中的信息表达手段,纸质表格被广泛的应用于数据采集,将纸质表格数据转换成电子数据是信息化必然趋势.传统的人工数据录入方式效率低下.差错率高.成本昂贵,北京文通科技结合其在OCR ...
- Android 百度文字识别(详细步骤+源码)
运行效果图 识别到的内容: {"words_result":[{"words":"突然间有想看书的冲动"},{"words&quo ...
- 调用百度ai接口实现图片文字识别详解
调用百度ai接口实现图片文字识别详解 首先先介绍一下这篇博文是干嘛的,为了不浪费大家时间.公司最近和短视频公司合作,需要监控app的截图上的文字是否符合规范,也就是确保其没有违规的文字.到网上找了一些 ...
- 携程滑块,点选文字识别
文章目录 code_datawhale05_xiecheng.py reslut code_datawhale06_bzhan_login.py result END code_datawhale05 ...
最新文章
- 小程序判断用户在线状态
- pytorch one-hot转数组
- 编译器扩展SEH(2)
- 用 Go 解析复杂 JSON 的思路
- step-by-step: 夕小瑶版神经网络调参指南(上)
- 【ES11(2020)】String 扩展 String.prototype.matchAll()
- postman测试登录后的接口_中文版Postman测试需要登陆才能访问的接口(基于Cookie)...
- 学python还有机会吗_此时此刻,拥有一套全方面学习Python的机会是怎样一种体验?...
- 荷兰铁路在采纳敏捷和精益中的做法
- 功夫小子实践开发-英雄实体类的基本分析和实现
- 浅谈Http协议、TCP协议
- AI Studio 数据集
- 使用 PhyML 构建进化树
- 0w1_CTF_Writeup
- 有哪些值得推荐的,关于脑科学认知研究的经典书籍 ?
- 像素生存显示服务器不可用,生存游戏3无法连接服务器是什么原因
- c#MVC文件(图片,word,excel,zip等)批量上传
- 简单理解 TP、FN、FT 及 TN和准确率、精确率、召回率 的含义
- CVPR2020 | 即插即用!将双边超分辨率用于语义分割网络,提升图像分辨率的有效策略...
- 2017下半年掘金日报优质文章合集:Android篇,android开发工程师