文章出自:http://www.cnblogs.com/brooks-dotnet/archive/2010/10/05/1844203.html

光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。OCR技术非常专业,一般多是印刷、打印行业的从业人员使用,可以快速的将纸质资料转换为电子资料。关于中文OCR,目前国内水平较高的有清华文通、汉王、尚书,其产品各有千秋,价格不菲。国外OCR发展较早,像一些大公司,如IBM、微软、HP等,即使没有推出单独的OCR产品,但是他们的研发团队早已掌握核心技术,将OCR功能植入了自身的软件系统。对于我们程序员来说,一般用不到那么高级的,主要在开发中能够集成基本的OCR功能就可以了。这两天我查找了很多免费OCR软件、类库,特地整理一下,今天首先来谈谈Tesseract,下一次将讨论下Onenote 2010中的OCR API实现。可以在这里查看OCR技术的发展简史。

1、Tesseract概述

Tesseract的OCR引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封。

数年以后,HP意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生--2005年,Tesseract由美国内华达州信息技术研究所获得,并求诸于Google对Tesseract进行改进、消除Bug、优化工作。

Tesseract目前已作为开源项目发布在Google Project,其项目主页在这里查看,其最新版本3.0已经支持中文OCR,并提供了一个命令行工具。本次我们来测试一下Tesseract 3.0,由于命令行对最终用户不太友好,我用WPF简单封装了一下,就可以方便的进行中文OCR了。

1.1、首先到Tesseract项目主页下载命令行工具、源代码、中文语言包:

1.2、命令行工具解压缩后如下(不含1.jpg、1.txt):

1.3、为了进行中文OCR,将简体中文语言包复制到【tessdata】目录下:

1.4、在DOS下切换到Tesseract的命令行目录,查看一下tesseract.exe的命令格式:

Imagename为待OCR的图片,outputbase为OCR后的输出文件,默认是文本文件(.txt),lang为使用的语言包,configfile为配置文件。

1.5、下面来测试一下,准备一张jpg格式的图片,这里我是放到了和Tesseract同一个目录中:

输入:tesseract.exe 1.jpg 1 -l chi_sim,然后回车,几秒钟就OCR完成了:

这里注意命令的格式:imagename要加上扩展名.jpg,输出文件和语言包不需要加扩展名。

OCR结果:

可以看到结果不是很理想,中文识别还说的过去,但是英文、数字大都乱码。不过作为老牌的OCR引擎,能做到这种程度已经相当不错了,期待Google的后续升级吧,支持一下。

光学识别(OCR)之 Tesseract相关推荐

  1. 开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用

    开源免费图片文字识别 OCR 工具 tesseract v4.1.0 的 Docker 镜像制作与使用 一 背景 在日常的一些工作中,偶尔也需要我们把图片转换为文字.目前大部分办公软件还无法实现类似的 ...

  2. 光学识别OCR软件Readiris Pro 17 for Mac

    readiris pro for mac是Mac平台上最为强大,精准的一款光学识别OCR软件软件.readiris pro mac版能够快速精准的将您的PDF.图像和纸质文档转换为能够编辑的文字.Re ...

  3. 使用Tesseract+OpenCV+Python进行光学字符识别 (OCR)

    介绍 我们人类几乎每时每刻都在阅读文本.如果我们的机器或系统也能像我们一样阅读文本,那不是很好吗?但更大的问题是"我们如何让我们的机器阅读"?这就是光学字符识别 (OCR) 出现的 ...

  4. 银行卡号识别python_银行卡号识别 基于 OpenCV 光学字符识别(OCR)

    银行卡号识别 基于 OpenCV 光学字符识别(OCR) 今天的博客文章是我们最近关于光学字符识别(OCR)和计算机视觉的系列的延续. 在之前的博客文章中,我们学习了如何安装Tesseract二进制文 ...

  5. 光学文字识别(OCR)

    一.什么是光学文字识别? 简单来说,就是将图片上的文字给识别出来,称为光学文字识别(Optical Character Recognition),简写为OCR.目前市面上这种库并不多,因为做这个需要很 ...

  6. Windows安装用于OCR的Tesseract及使用命令行参数进行OCR

    Windows安装用于OCR的Tesseract及使用命令行参数进行OCR 1. 效果图 2. Tesseract 安装及验证 参考 这篇博客将介绍如何安装和使用光学字符识别(OCR Optical ...

  7. [转]浅谈OCR之Tesseract

    转载请注明出处:http://www.cnblogs.com/brooks-dotnet/archive/2010/10/05/1844203.html 浅谈OCR之Tesseract 光学字符识别( ...

  8. 浅谈OCR之Tesseract

    光学字符识别(OCR,Optical Character Recognition)是指对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程.OCR技术非常专业,一般多是印刷.打印行 ...

  9. 文本识别OCR浅析:特征篇

    OCR技术浅探:特征提取(1) 研究背景 关于光学字符识别(Optical Character Recognition, 下面都简称OCR),是指将图像上的文字转化为计算机可编辑的文字内容,众多的研究 ...

最新文章

  1. android 常见异常解决
  2. rhino5.0安装教程
  3. wxWidgets:wxAnyValueType类用法
  4. Linux环境下实现简单进度条
  5. RISC-V教材勘误
  6. python爬虫怎么挣钱-个人利用Python爬虫技术怎么挣钱
  7. 全球人工智能人才培养与发展趋势
  8. Android官方源码资料博客
  9. 中标普华下LibFetion1.3,i386,rpm包
  10. 如何移动visio2010连接线上的文本
  11. STM32PCB原理图
  12. 四核64位处理器,MIMX8MQ5DVAJZAB 满足智能设备应用
  13. 使用功能点估算模型评估软件测试的工作量
  14. 针对面试官提出的WPF逻辑树和视觉树
  15. 文件服务器异地容灾,三种异地容灾方案(完整版).pdf
  16. 图元变形lisp源码_收集和整理的lisp源码 收集整理出来的lisp源代码 - 下载 - 搜珍网...
  17. 去除眼袋(画笔涂抹法)
  18. 再讲卷积的本质及物理意义,解释的真幽默!
  19. android中slider控件,range-slider-view
  20. .flo光流文件转换为png图片

热门文章

  1. 【数据压缩】H.264文件解析和码流分析
  2. JavaScript的OO思想(一)
  3. 谷歌发布最新官方年报,回首谷歌大脑2017年的9大事件
  4. 学生信息管理系统(php+mysql)
  5. springboot+mybatis+Oauth2 +vue 框架实现登录认证
  6. MediaCoder CUDA H.264 编码器测试报告
  7. kali域名无法暂时解析 无法网络
  8. 计算机应用2级考试,计算机应用水平2级考试大纲.doc
  9. 小米/红米手机数据恢复:从小米手机恢复已删除的数据
  10. 关于mac的wintogo制作(不需要win电脑不需要鼠标)