1.语言库地址:https://github.com/tesseract-ocr/tessdata

mac安装:brew install tesseract

2.语言库列表

库名    语言
afr    Afrikaans(南非荷兰语)
amh    Amharic(阿姆哈拉语)
ara    Arabic(阿拉伯语)
asm    Assamese(阿萨姆)
aze    Azerbaijani(阿塞拜疆)
aze_cyrl    Azerbaijani - Cyrilic(阿塞拜疆-Cyrilic)
bel    Belarusian(白俄罗斯)
ben    Bengali(孟加拉)
bod    Tibetan(西藏)
bos    Bosnian(波斯尼亚)
bul    Bulgarian(保加利亚语)
cat    Catalan; Valencian(加泰罗尼亚语; 巴伦西亚)
ceb    Cebuano(宿务)
ces    Czech(捷克)
chi_sim    Chinese - Simplified(中国-简体)
chi_tra    Chinese - Traditional(中国-繁体)
chr    Cherokee(切诺基)
cym    Welsh(威尔士)
dan    Danish(丹麦)
dan_frak    Danish - Fraktur(丹麦-Fraktur)
deu    German(德国)
deu_frak    German - Fraktur(德国-Fraktur)
dzo    Dzongkha(不丹文)
ell    Greek, Modern (1453-)(希腊,现代(1453-))
eng    English(英语)
enm    English, Middle (1100-1500)(英语,中东(1100-1500))
epo    Esperanto(世界语)
equ    Math / equation detection module(数学/方程式检测模块)
est    Estonian(爱沙尼亚)
eus    Basque(巴斯克)
fas    Persian(波斯)
fin    Finnish(芬兰)
fra    French(法语)
frk    Frankish(法兰克)
frm    French, Middle (ca.1400-1600)(法国,中东(ca.1400-1600))
gle    Irish(爱尔兰)
glg    Galician(加利西亚)
grc    Greek, Ancient (to 1453)(希腊语,古(到1453年))
guj    Gujarati(古吉拉特语)
hat    Haitian; Haitian Creole(海天; 海地克里奥尔语)
heb    Hebrew(希伯来语)
hin    Hindi(印地文)
hrv    Croatian(克罗地亚)
hun    Hungarian(匈牙利)
iku    Inuktitut(因纽特语)
ind    Indonesian(印尼)
isl    Icelandic(冰岛)
ita    Italian(意大利语)
ita_old    Italian - Old(意大利语-旧)
jav    Javanese(爪哇)
jpn    Japanese(日本)
kan    Kannada(卡纳达语)
kat    Georgian(格鲁吉亚)
kat_old    Georgian - Old(格鲁吉亚-旧)
kaz    Kazakh(哈萨克斯坦)
khm    Central Khmer(中央高棉)
kir    Kirghiz; Kyrgyz(柯尔克孜; 吉尔吉斯)
kor    Korean(韩国)
kur    Kurdish(库尔德人)
lao    Lao(老挝)
lat    Latin(拉丁)
lav    Latvian(拉脱维亚)
lit    Lithuanian(立陶宛)
mal    Malayalam(马拉雅拉姆语)
mar    Marathi(马拉)
mkd    Macedonian(马其顿)
mlt    Maltese(马耳他)
msa    Malay(马来文)
mya    Burmese(缅甸)
nep    Nepali(尼泊尔)
nld    Dutch; Flemish(荷兰; 佛兰芒语)
nor    Norwegian(挪威)
ori    Oriya(奥里亚语)
osd    Orientation and script detection module(定位及脚本检测模块)
pan    Panjabi; Punjabi(旁遮普语; 旁遮普语)
pol    Polish(波兰)
por    Portuguese(葡萄牙语)
pus    Pushto; Pashto(普什图语; 普什图语)
ron    Romanian; Moldavian; Moldovan(罗马尼亚; 摩尔多瓦; 摩尔多瓦)
rus    Russian(俄罗斯)
san    Sanskrit(梵文)
sin    Sinhala; Sinhalese(僧伽罗语; 僧伽罗语)
slk    Slovak(斯洛伐克)
slk_frak    Slovak - Fraktur(斯洛伐克- Fraktur)
slv    Slovenian(斯洛文尼亚)
spa    Spanish; Castilian(西班牙语; 卡斯蒂利亚)
spa_old    Spanish; Castilian - Old(西班牙语; 卡斯蒂利亚-老)
sqi    Albanian(阿尔巴尼亚)
srp    Serbian(塞尔维亚)
srp_latn    Serbian - Latin(塞尔维亚语-拉丁语)
swa    Swahili(斯瓦希里语)
swe    Swedish(瑞典)
syr    Syriac(叙利亚)
tam    Tamil(泰米尔)
tel    Telugu(泰卢固语)
tgk    Tajik(塔吉克斯坦)
tgl    Tagalog(菲律宾语)
tha    Thai(泰国)
tir    Tigrinya(提格雷语)
tur    Turkish(土耳其)
uig    Uighur; Uyghur(维吾尔族; 维吾尔)
ukr    Ukrainian(乌克兰)
urd    Urdu(乌尔都语)
uzb    Uzbek(乌兹别克斯坦)
uzb_cyrl    Uzbek - Cyrilic(乌兹别克斯坦- Cyrilic)
vie    Vietnamese(越南语)
yid    Yiddish(意第绪语)
 
--------------------- 
作者:何超杰 
来源:CSDN 
原文:https://blog.csdn.net/hechaojie_com/article/details/81477534 
版权声明:本文为博主原创文章,转载请附上博文链接!

tesseract语言库相关推荐

  1. ubuntu下使用Tesseract-ocr(编译、安装、使用、训练新的语言库)

    本文前半部分是来自http://www.qisanfen.com/?p=185的一篇文章,主要讲了安装.训练的大致流程,注意如果需要训练语言库需要把所需要的库安装完整 后半部分大致是官方wiki的翻译 ...

  2. Tesseract3.02训练生成新的识别语言库的详细步骤

    说明:本文参考了很多前辈的资料,主要是:tesseract-OCR3.0语言库训练步骤,再结合自己的实践操作,个人感觉官网的教程是最权威的,耐着性子看完,收获很大,比网上到处看别人理解的更好,毕竟每个 ...

  3. antlr 语言 库_关于ANTLR的通用库的需求:使用反射来构建元模型

    antlr 语言 库 我是一名语言工程师:我使用多种工具来定义和处理语言. 在其他工具中,我使用ANTLR:它简单,灵活,可以围绕它进行构建. 但是我发现自己围绕ANTLR为不同的项目重建了类似的工具 ...

  4. pytorch微调bert_小版BERT也能出奇迹:最火的预训练语言库探索小巧之路

    选自Medium 作者:Victor Sanh 机器之心编译 参与:魔王 过去一段时间,大模型层出不穷.在大家纷纷感叹「大力出奇迹」的时候,作为调用预训练语言模型最流行的库,HuggingFace 尝 ...

  5. axis2 默认端口_基于 AXIS2/C 的 C 语言库实现对提供 REST API 的系统进行数据访问...

    基于 AXIS2/C 的 C 语言库实现对提供 REST API 的系统进行数据访问 宋 东平 和 赵 健 2013 年 3 月 07 日发布 AXIS2/C 简介和 REST 及 REST API ...

  6. go读取email正文_Go语言库系列之email

    导读 大家好我是平也,今天跟大家介绍一款用来发送邮件的Go语言库email,目前星星1.3k,非常好用. 极速上手 准备工作 初始化项目 go get github.com/jordan-wright ...

  7. MySQL进阶11--DDL数据库定义语言--库创建/修改/删除--表的创建/修改/删除/复制

    /*进阶 11 DDL 数据库定义语言库和表的管理一:库的管理:创建/修改/删除二:表的管理:创建/修改/删除创建: CREATE DATABASE [IF NOT EXISTS] 库名;修改: al ...

  8. 研究开源项目发现的一个人性化的Go语言库

    点击上方蓝色"飞雪无情"关注我,设个星标,第一时间看文章 前段时间Info约稿,在文章中我提到了一个可以提升自己能力的办法:就是研究开源项目,这也是我一直实践的. 夜深人静的时候, ...

  9. vue 后台翻译_vue国际化 自动百度翻译,优先本地语言库

    本文链接: git地址: 本次说明用vue-cli 3 来做示范. 安装: npm install jj_language --save 在main.js import language from ' ...

最新文章

  1. spark1.1.0学习路线
  2. 树莓派共享文件至电脑(samba)
  3. BMP格式知识之二:16位,24位,32位的BMP图片算法是如何运算的
  4. std::string用法总结
  5. kali 更新源_KALI Linux更新源减少手动安装依赖文件
  6. grub4dos和winsetupfromusb1.4
  7. 【Python数据结构】——并查集的实现(查找、合并、集合、实例)
  8. 如何进行服务器选购[转]
  9. 【算法】QuickSort
  10. 【今日CS 视觉论文速览】Mon, 14 Jan 2019
  11. 在windows下安装配置Ulipad
  12. 坚守普惠 AI,看华为云如何让 AI 落地!
  13. python中xlrd写操作_Python读写操作Excel模块_xlrd_xlwt_xlutils
  14. Linux 命令(19)—— tar 命令
  15. 牛客练习赛20:D. 最短路2
  16. Java配置Path
  17. 机械手基础知识(2)之机械手的正运动学和逆运动学问题
  18. 在 react 中添加enter键出搜索
  19. 抽象基类与接口,共性与个性的选择!
  20. 复选框 全选 以及 获取所有选中的值

热门文章

  1. 几个常用的ASP木马
  2. 【动态规划】prob
  3. Mac在线视频下载工具:PullTube
  4. 心靜如水的時候聽音樂
  5. mysql 使用rads_bi-rads 分级是什么意思
  6. 详解 502 Bad Gateway nginx/xxx
  7. 流利阅读12.21 Surveying China’s livestreaming economy
  8. 使用Javascript制作声音按钮
  9. Ext Js 关于GridPanel---EditorGridPanel
  10. yum安装软件时,出现“No package XXX available“的解决办法