教你手动编辑图像,提高ABBYY FineReader PDF 15识别准确性
ABBYY FineReader PDF 15是一款智能程度相当高的OCR文字识别软件,不仅能识别PDF文档,而且还能识别难度更高的图像文件。
说到图像文件,虽然使用扫描仪可以让我们获取到精确度更高的图像,但并不是每个家庭都配备有扫描仪,因此,通过拍照的方式获取文件图像是我们更常用的方法。
让人惊喜的是,ABBYY FineReader PDF 15提供了实用的手动编辑图像功能,可供使用者更好地调整图像的状态,以提高软件的识别准确度。
一、使用OCR编辑器功能
首先,如需使用ABBYY FineReader PDF 15 手动编辑图像功能,需单击“在OCR编辑器中打开”选项,并打开指定的图像。
图1:在OCR编辑器中打开
二、编辑页面图像
待软件完成图像的载入后,如图2所示,单击ABBYY FineReader PDF 15的编辑菜单,并选择其中的“编辑页面图像”功能。
图2:编辑页面图像
接着,软件就会自动打开图像编辑器。如图3所示,在编辑器的右侧可找到多项调整图像的功能,如歪斜校正、修剪等。
针对本例需处理的图像,我们将会使用到预处理以及校正梯形失真两项功能。
图3:图像编辑器
1、建议的预处理
首先看到的是“建议的预处理”功能,如图4所示,选择该功能后,ABBYY FineReader PDF 15就会根据图像的特点进行自动的修正。该功能可以修正明显的图像拍摄缺陷,建议在调整图片前先使用该功能进行“预处理”。
图4:建议的预处理
2、校正梯形失真
接着,如图5所示,可以看到示例中的图像存在着明显的梯形失真。这种拍摄缺陷比较常见,当相机与拍摄的文本未能保持垂直状态时,就会出现这种梯形失真。
我们可以通过自动或手动的方式修正梯形失真。如需使用手动方式调整,需在网格类型中选取“用户自定义网格”
图5:用户自定义网格
然后,再拖动框的每个角与目标识别的文本行对齐。如图6所示,由于我们目标识别的是表格中的文本,因此,需要将方框的四个角与表格的四个角对齐。完成方框的调整后,就可以单击“修正”按钮。
图6:拖动框对齐网格
如图7所示,可以看到,图像的梯形失真已调整完毕,效果相当不错。
完成了图像的编辑调整后,就可以单击“退出图像编辑器”,返回软件的OCR编辑器中。
图7:完成修正
三、重新识别图像
返回到OCR编辑器后,在页面面板中右击目标图像,选择快捷菜单中的“识别页面”选项,即可以调整后的图像为基础,开启文本的识别。
图8:识别页面功能
如图9所示,可以看到,图像被识别为表格文件,准确度还是相当高的。
图9:识别结果
四、小结
综上所述,通过使用ABBYY FineReader PDF 15的手动编辑图像功能,即使无法使用扫描仪,我们也能通过使用手动编辑图像功能,修正一些拍摄缺陷,如梯形失真、歪斜校正等,提高软件文本识别的准确度。
教你手动编辑图像,提高ABBYY FineReader PDF 15识别准确性相关推荐
- ABBYY FineReader PDF 15有哪些增强PDF安全性的方法?
PDF文档具有不可编辑的特点,如果不借助第三方PDF管理软件,是无法直接编辑PDF文档的.因此,PDF文档具有良好的安全性,可防止他人更改文档中的内容. 除了不可编辑的特点外,专业的PDF文档管理软件 ...
- 巧妙使用ABBYY FineReader PDF 15页面管理功能调整页面布局
页面管理功能是ABBYY FineReader PDF 15 的一项PDF文档管理功能,允许使用者为当前PDF文档添加新页面.调整格式.创建新PDF文档等,以实现快捷的页面布局功能. 作为一个独立的面 ...
- 如何使用ABBYY FineReader PDF 15对比功能,数据纠错不用愁
在处理数据的过程中,如果同一份数据出现多个版本的话,那对于数据处理者来说,将是一个很大的麻烦.要在众多的数据中,查找到不同数据文件的异同点,需要耗费很多的精力. 通过使用文字识别软件ABBYY Fin ...
- ABBYY FineReader PDF 16安装教程使用指南及ABBYY16系统配置要求
近年来,随着盲人数字阅读的普及推广,PDF格式的电子书越来越受到大家的关注和喜爱,但受读屏软件功能的限制,扫描版的PDF电子书是无法直接阅读的,这就需要将其转换为可阅读的文档格式,可对于大多数视障读者 ...
- 如何提高ABBYY FineReader的识别正确率
在OCR文字识别软件当中,ABBYY FineReader 是比较好用的程序之一,但再好的识别软件也不能保证100%的识别正确率,用户都喜欢软件的正确率高一些,以减轻识别后修正的负担,很多用户也都提过 ...
- ABBYY FineReader OCR图文识别软件如何快速将纸质文档转为电子档教程
先给大家普及下一个小知识:MFP(Multi-Functional Peripheral),即多功能数码复合一体机,集合了打印.复印.扫描.传真等多种功能. 在这个科技高度发达的年代,相信每家公司都有 ...
- ABBYY FineReader PDF中文版图片转文字识别工具
ABBYY FineReader PDF是一款文本处理软件,其强大的OCR文字识别功能可以轻松准确地识别PDF文档和图片,并且对抓取出的文字.图像.表格和超链接进行编辑,支持将PDF和图片直接转换为p ...
- ABBYY FineReader PDF程序安装及注意事项
一.安装步骤 完整安装步骤请到"微信公众号:纸飞资,回复[PDF]查看下载地址"查看 1.右击压缩包,选择[解压到FineReader PDF 15] 2.打开解压后的文件夹 3. ...
- ABBYY FineReader(OCR文字识别软件)14官方中文版下载
ABBYY FineReader是一种OCR图片文字识别软件.它提供快速.准确.方便的方式来将扫描文件.PDF格式.数字或移动电话图像转换成可编辑的格式.99.8%识别准确率OCR技术即刻能够识别文本 ...
最新文章
- 2021年大数据Flink(二十五):Flink 状态管理
- [LeetCode]Maximal Rectangle
- 脉冲20KV高压发生器电弧打火
- HDU 5384 Danganronpa (2015年多校比赛第8场)
- 【译】A look at MobileIron’s zero sign-on and passwordless authentication plans
- 饲料企业精细化生产管理方案
- java解析json_JAVA解析JSON数据
- LeetCode 1562. 查找大小为 M 的最新分组
- matlab knn,MATLAB K近邻算法 — knnsearch() 函数 | 学步园
- FBI曾要求加密服务商Lavabit监视斯诺登邮件
- python快速编程入门课本中的名片管理器_python优雅操作-实现名片管理系统
- openstack【Kilo】汇总:包括20英文文档、各个组件新增功能及Kilo版部署
- Spring Security 02
- PHP算法学习(5) 位运算
- 小程序 WeUI导入时导入失败,出现Component is not found in path 的错误
- Minecraft 1.12.2模组开发(十九) 自定义3D物品模型
- PAT 乙级练习 1068 万绿丛中一点红 - 超级详细的思路讲解
- python中积分怎么表示_python中的数值积分与符号积分
- 怎么在html中加入特效文字,如何使用HTML5+css3实现粒子效果文字动画特效(附完整代码)...
- excel插入散点图按时刻设置横坐标刻度值
热门文章
- JTAG 标准IEEE STD 1149.1-2013学习笔记(三)Test data registers
- asp.net1036-物流管理信息系统#毕业设计
- 本题要求对任意给定的一位正整数N,输出从1*1到N*N的部分口诀表。
- LeetCode—55.跳跃游戏(Jump Game)——分析及代码(C++)
- 中国大学mooc 实用Python程序设计练习题
- Mac下的串口调试工具(2018更新)
- java环境的搭建及环境变量的配置
- 知名的兴趣社群平台小打卡是如何获得5000万用户的?【黑盒研究内参第11期】...
- 湘大计算机学校聚会,计算机学院计算机专业96级2班校友举行入校20周年返校聚会...
- H3C 二层链路聚合