OCR使用的常见问题及解决

OCR是英文Optical Character Recognitiond的缩写,意思为光学字符识别,是扫描仪处理文稿的最重要软件。下面将向大家介绍的是在使用OCR软件时遇到的问题及解决方法,希望对大家有所启发和帮助。

一、软件的兼容性

我们在购买扫描仪的时候,一般都会随机获赠一款OCR识别软件。下面就讲解两款主流OCR软件的兼容性问题。

1.紫光OCR

清华紫光OCR V7.5 32位专业版是紫光系列扫描仪随机附赠的OCR软件,它具有支持的图像格式多,识别率高,支持表格识别等特点,是一款不错的OCR软件。但它只支持紫光系列的扫描仪,如果在其它品牌的扫描仪上使用,它会显示出错信息,并拒绝工作。

2.尚书OCR

尚书5.0这款OCR识别软件,具有识别率高,界面简单友好的特点,特别适合于初学者。它适用于MicroTEK,N-TEK,ScanPAQ,ScanPORT系列扫描仪,该软件只识别自己扫描的图像,很不方便。

解决方法:其实解决此类问题也很简单,我们可以使用其它图像处理软件来进行扫描,只要扫描得到的图像格式能够被OCR软件所支持、识别就可以了。这里介绍一款专为OCR软件设计的图像增强软件——扫描小精灵,它能有效地提高输入图像质量,它提供的全自动扫描方式、自动存盘功能,特别适合于需要大量处理文稿的用户。根据实验,扫描小精灵的TIF图像输出格式全面兼容紫光OCR V7.5 32位专业版、汉王OCR 5.0、尚书5.0、北信OCR(WPS2000手写系统中携带的)等。此软件大家可以到httP:∥jwsg.yeah.net下载,大小不到140KB。

二、用OCR识别软件处理传真文件

随着计算机通讯技术的发展,利用计算机收发传真已经不是什么新鲜事了,有的人甚至通过一定的方法把传真机和计算机连接起来作为扫描仪使用。虽然几乎所有的传真软件都支持将收到的传真件存为TIF图像文件,但这种TIF图像文件是不能直接被OCR软件所识别的。

解决方法:根据我们的实验,2值(BITMAP、黑白)、IBM PC格式、没有LZW压缩的TIF图像格式能够被大多数的OCR软件所识别,可用的OCR软件有紫光OCR V7.5 32位专业版、汉王OCR 5.0、北信OCR等。所以只要将得到的传真文件转换成以上格式就行了。比如PhotoImpact5.0 (扫描仪随机附赠的),利用其文件菜单下的批量转换功能可以很方便的将批量文件转换为IBM PC格式,没有LZW压缩的TIF图像。其它图像处理软件如PhotoShop也可以。

对于尚书5.0我们还需用到尚书5号OCR软件TIF文件转换器,下载地址是http:∥dihou.126.com,大小不到70KB。此软件能将2值(BITMAP、黑白)、IBM PC格式、没有LZW压缩的TIF图像转换为尚书5.0能识别的格式。使用很简单,按“添加文件”按钮将文件加入待处理的文件列表,按“开始”按钮开始处理,完成后的文件自动加前缀DH-。

三、表格识别和编辑

1.表格的识别

紫光OCR和尚书OCR都提供了表格识别功能,尚书OCR做得比较好,能够对表格进行自动识别,但我们在用紫光OCR识别表格时,往往只能识别出表头而无表格。这是因为紫光OCR不能对表格自动进行划分,我们需要进行手动版面分析,单独定义出表格属性。紫光OCR的识别属性分为“横排正文”、“竖排正文”及“表格”,只要将表头单独框起来定义为“横排正文”,再单独将表格框起来定义为“表格”就可以正确识别了。

2.表格的编辑

如果我们用WORD等编辑软件将识别后的表格文件直接打开时,表格可能会一团糟,这是因为表格线是被作为字符处理的。解决这个问题最简单的方法是使用WPS 2000,它可以将字符型的表格线直接转换成可编辑的表格。如果我们需要在WORD里进行编辑,只需在WPS 2000里将文件另存为RTF格式就可以了。注意:请不要使用复制粘贴,因为WORD是将WPS 2000的表格作为图片来处理。

四、段落重排

经常看到一些朋友把识别后的文本复制粘贴到WORD中,利用WORD强大的查找替换功能来去掉多余的硬回车。其实我们完全不需要这样麻烦,尚书OCR、汉王OCR和紫光OCR都提供了段内去硬回车的功能。尚书、汉王使用比较简单,只要在识别后的文本存盘时,选回车设置为软回车就行了。对于紫光OCR则需要在识别完成后,选择文件菜单下的导出命令,将存为类型选为TXT,段内回车字符选为无。注意:一定不要直接存盘,否则不能自动去掉文章的硬回车。

五、文字校正

文字校正可能是OCR识别中最麻烦和繁琐的工作了,在这里,向大家推荐Readbook作为文字校正的辅助工具。我们用到的主要功能是:

自动平滑滚屏;可以对文件进行局部编辑;具有“智能分段”功能,可以将每行都是硬回车换行的文章,去掉回车重新排列,并且不破坏原有的段落;启动时可自动装入上次正在阅读的文章。

Readbook的最新版本为1.42,下载地址为:http:∥readbook.126.com。

(山东 王翔蔚)

计算机未安装OCR应用程序,OCR使用的常见问题及解决(转载)相关推荐

  1. 极速pdf文件打印时此计算机未连接到网络,极速PDF阅读器常见问题及解决方法

    原标题:极速PDF阅读器常见问题及解决方法 极速PDF阅读器是日常办公常用的一款PDF阅读软件,有些人在使用过程中难免遇到一些问题不知道如何解决.下面汇总了几个常见问题并附解决方案,希望能够帮助到你. ...

  2. linux安装 中文乱码怎么解决方法,Linux安装GBK/GB2312程序显示乱码的五种解决方法...

    不少用户在Linux系统中安装GBK或GB2312的时候遇到了乱码问题,这主要是系统默认语言是uft8所导致,对于该问题可用五种方法进行解决,接下来是小编为大家收集的Linux安装GBK/GB2312 ...

  3. 提示计算机未安装flash,大师应对安装了flash,但浏览器提示没安装,如何解决...

    电脑现已成为我们工作.生活和娱乐必不可少的工具了,在使用电脑的过程中,可能会遇到安装了flash,但浏览器提示没安装,如何解决的问题,如果我们遇到了安装了flash,但浏览器提示没安装,如何解决的情况 ...

  4. android 快捷方式 未安装该应用程序,android,解决手动创建的桌面快捷方式无法跳转到制定的activity的问题,提示未安装应用程序...

    android,解决手动创建的桌面快捷突变无法跳转到制定的activity的问题 第一步也是最关键的一步: mainfest.xml中: android:name=".activity.No ...

  5. 提示计算机未安装flash,win10系统提示未安装Flash的解决方法

    很多小伙伴都遇到过win10系统提示未安装Flash的困惑吧,一些朋友看过网上零散的win10系统提示未安装Flash的处理方法,并没有完完全全明白win10系统提示未安装Flash是如何解决的,今天 ...

  6. 什么是android应用程序未安装,显示“应用程序未安装”是怎么回事?程序未安装的解决图文步骤...

    安卓手机安装应用的时候,有时候会莫名其妙无法安装--明明存储空间够的啊摔!经过搜索和尝试,本人找到一种可行的方法,下面分享给大家.目前看来,这是部分系统内的bug,下面,小编跟大家介绍安卓系统应用程序 ...

  7. android盒子应用程序未安装,Android应用程序未安装怎么办 APK应用未安装解决办法...

    有许多安卓手机用户在安装手机APP应用时,Apk安装提醒"应用程序未安装"的情形,到底是怎么回事呢?下面通过这篇文章给人人先容一下应该怎么解决. 第一种:最普遍的解决方案 储存模式 ...

  8. 连接远程计算机输入网络密码错误,电脑远程无法连接常见问题及解决大全

    电脑远程无法连接常见问题及解决大全 1 由于在数据加密中存在错误,此会话将结束.请尝试再次连接到远程计算机. 原因: 数据加密为在网络连接上进行数据传输提供了安全性.数据加密错误可能出于安全原因结束会 ...

  9. 计算机未安装OCR应用程序,电脑应用指南 篇四:天若OCR使用指南(扫描图片转文字)...

    电脑应用指南 篇四:天若OCR使用指南(扫描图片转文字) 2020-04-08 10:44:34 7点赞 82收藏 15评论 到了一个新的单位,每天需要面对的场景就是老板突然拿出一份文件对我说,你把这 ...

  10. 计算机未安装打印机,Win7使用打印机突然提示“尚未安装打印机”怎么回事

    我们都知道打印机设备在办公中经常会用到,在使用过程中也碰到各种奇怪的问题.这不有位用户说Win7使用打印机突然提示"尚未安装打印机",明明之前都可以正常打印的,为什么今天会突然弹出 ...

最新文章

  1. 为什么做小程序的时候要做定制开发小程序?
  2. 函数计算+云市场实现手机号归属地和图片爬虫系统设计...
  3. error: unknown host service 的详细解决办法
  4. 基于Yolov4的人群检测,人群距离估计、基于SORT的多目标跟踪及逆透视映射一体的系统Yolov4_DeepSocial
  5. 【Python】调用百度云API人脸检测 Face Detect
  6. ASP.net远程调试笔记
  7. [How TO]-ubuntu下安装selenium
  8. 我的cookie读写
  9. Total = 80是这样计算出来的
  10. linux redhat 下让redis以服务方式运行
  11. 编辑器扩展_开发者必备,可扩展编辑器tui.editor和TOAST UI组件家族
  12. redis集群实现(六) 容灾与宕机恢复
  13. Python reversed()函数
  14. 米家扫地机器人怎么加水_最省心的扫地机器人,米家扫地机器人1C:视觉动态导航实力强劲...
  15. html 5拜年贺卡,HTML5+CSS3实现春节贺卡
  16. VMware运维工程师常用工具介绍
  17. vue 活动倒计时组件
  18. Scratch编程与美术:制作美丽的烟花!
  19. Flutter 十六进制颜色转换
  20. 祝贺!中国战队EDG夺冠

热门文章

  1. html修改img图片颜色,html中img图片设置透明度的方法
  2. 在线免费OCR文字识别工具,强烈推荐,这是目前用过最良心的
  3. poi实现多个excel合并成一个excel
  4. html css做椭圆,简单实例:用css3画椭圆
  5. mysql数据库工资管理系统_企业工资管理系统--数据库课程设计.doc
  6. Top9竞赛总结-NLP语义相似度 第三届拍拍贷“魔镜杯”大赛
  7. 经典FAT文件系统格式详解
  8. FatFs(通用FAT文件系统模块)下载与介绍
  9. 庄懂技术美术入门课笔记_L13_特效类shader(AlphaBlendAlphaCutoutAdditice)
  10. SD卡驱动(详细介绍,不明白的人可以仔细看看了.有流程图)