文档图片校正 计算机软件,一种复杂版面扭曲文档图像快速校正方法.PDF
第33卷第6期 计算机应用与软件 Vol33No.6
2016年6月 ComputerApplicationsandSoftware Jun.2016
一种复杂版面扭曲文档图像快速校正方法
曾凡锋 段漾波
(北方工业大学计算机学院 北京 100144)
摘 要 在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲
校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文
本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像
有较好的校正效果,校正后识别率大幅度提高。
关键词 复杂版面 扭曲文档 形态学组件 窗口扫描校正
中图分类号 TP391 文献标识码 A DOI:10.3969/j.issn.1000386x.2016.06.042
AFASTCORRECTIONMETHODFORWARPEDDOCUMENTIMAGES
INCOMPLEXLAYOUT
ZengFanfeng DuanYangbo
(CollegeofComputer,NorthChinaUniversityofTechnology,Beijing100144,China)
Abstract TherecognitionrateofOCR(opticalcharacterrecognition)onwarpeddocumentimagesincomplexlayoutisrelativelylow.To
solvethisproblem,weproposedamorphologybasedwarpcorrectionmethodwithrowsoftextpositioning.First,accordingthemorphological
characteristicsitlocatestherowsoftextincomplexlayouttodistinguishthetextareasfromotherareas.Afterthatitusestherowsoftext
informationtoextractthetextlines,andthenusesthetextlinesasthebenchmark,employsthewindowscanningmethodtocorrecttherows
oftext,andfinallyreconstructstheimage.Experimentalresultsdemonstratedthatthismethodachievedmanifestcorrectioneffect.Forwarped
documentimagesincomplexlayoutitgainedacceptablecorrectionresults,therecognitionrateimprovedsignificantlyafterthecorrection.
Keywords Complexlayout Warpeddocument Morphologiccomponent Windowsscanningcorrection
正,但其校正粒度较为粗糙,效果欠佳。
0 引 言 通过以上分析总结,各种校正方法各有特点,但应用到复杂
版面文档图像时都不易获得理想的校正效果,其原因在于复杂
在图像的采集过程中,由于受到纸质文档自身几何形状和 版面中的非文字元素影响了各种校正方法中的处理步骤。因此
拍摄角度的影响,采集到的图像可能发生扭曲,而文档图像的扭
文档图片校正 计算机软件,一种复杂版面扭曲文档图像快速校正方法.PDF相关推荐
- matlab不规则碎片拼接,一种不规则破碎单面图像快速拼接方法
一种不规则破碎单面图像快速拼接方法 [专利摘要]本发明的一种不规则破碎单面图像快速拼接方法,是首先将不规则破碎的单面图像碎片扫描成数字图像,然后获取每个图像碎片边缘的逆时针像素灰度值序列,通过计算各个 ...
- ts20芯片c语言例程,种基于C语言的DSP程序通用固化方法.PDF
种基于C语言的DSP程序通用固化方法.PDF 第38卷 第3期(总第 149期) 火控雷达技术 Vo1.38No.3(Serse148) 2009年9月 FireControlRadarTechnol ...
- python docx 合并文档 图片_使用python抓取大量简历文档内数据(word:docx;pdf;图片等)输出表格文件...
1. 文章背景描述: 近期公司有员工离职了,技术岗位的. 让HR招人,招聘进度也太慢了,实在等不及,就撸起袖子自己上.(之前从来没招聘过) 自己在某招聘网站注册后,花了若干人民币,短时间收到大量求职者 ...
- 鱼眼校正c语言算法,一种鱼眼图像逆向经纬映射的快速校正算法
1. 引言 鱼眼镜头因其焦距短,视场大,拍摄图像信息量大等优点,在安防监控.360度汽车成像仪等领域中得到广泛应用.但鱼眼镜头在获得大视场的同时,会产生严重的图像畸变问题 [1] [2] .通过鱼眼镜 ...
- 鱼眼图像畸变校正matlab,鱼眼镜头畸变校正算法的设计
王赛男 刘涛 左震宇 摘 要:鱼眼镜头的拍摄角度大,成像角度宽,但是在进行图像采集和成像的过程中存在大量畸变,直接使用采集而来的图像很难满足实际需求,因此需要对图像进行后续处理.本文根据摄像机参数 ...
- C# 复制幻灯片(包括格式、背景、图片等)到同/另一个PPT文档
原文:C# 复制幻灯片(包括格式.背景.图片等)到同/另一个PPT文档 C# 复制幻灯片(包括格式.背景.图片等)到同/另一个PPT文档 复制幻灯片是使用PowerPoint过程中的一个比较常见的操作 ...
- 文档扫描识别——基于M-LSD线段检测的拍照文档校正
前言 1.拍照文档扫描识别是办公类App里面最常用到的的一类应用,市面上有很多相关的App,及主要技术点有几个要用到图像处理,有边缘检测校正,文档滤镜,和OCR. 2.关于边缘文档连续检测,有用传统算 ...
- GUI实战|Python做一个文档图片提取软件
大家好,本文将进一步讲解如何用Python提取PDF与Word中图片,并结合之前讲解过的GUI框架PysimpleGUI,做一个多文件图片提取软件,效果如下: 本文主要将分为以下部分讲解: PDF.W ...
- python docx 合并文档 图片_Python+pymupdf处理PDF文档案例6则
推荐图书:<Python程序设计(第3版)>,(ISBN:978-7-302-55083-9),清华大学出版社,2020年6月第1次印刷,7月第2次印刷 京东购买链接:https://it ...
最新文章
- elementui的el-tree第一次加载无法展开和选中的问题
- Java虚拟机详解02----JVM内存结构
- java如何接受字符_java中string怎么获取指定位置的字符
- pip代理解决pip下载失败问题
- 利用openssl来计算sha256哈希值
- 继承的编写小结汇总。
- 网络连接的netstat命令
- 清华姚班毕业生开发新特效编程语言,99行代码实现《冰雪奇缘》,网友:大神厉害了!创世的快乐...
- 与计算机相关的统计表格,统计信息化 Excel与SPSS应用pdf
- idea 设置文件忽略git版本控制
- QT Creator 5.1.2中英文切换
- 进击的巨人和枪王黑泽两部漫画的观后感
- ie浏览器代理设置方法 怎么给IE浏览器设置代理?
- java中特殊字符的输出方式_java 特殊符号输出绝对基础?
- 从碧桂园和兴海物联看物业信息化、数字化和智能化
- Golang后端开发学习之路
- 第四十二次总结:json模块与pickle模块
- 苹果二手机价格行情2022.2.22
- CUMT第一轮双月赛Web题解
- 计算机图形学基础之一点两点三点透视图
热门文章
- 开源日志查看软件Log2Window介绍
- dsl java_Java DSL理解
- 很少有人会知道的97个秘密
- JWT详解、JJWT使用、token 令牌
- Java遍历Set集合方法(*)
- 小米游戏本win10系统安装office2013提示1935错误
- numpy中*,np.multiply和np.dot辨析
- 培训是企业的最大福利
- java合并单元格的快捷键_浅谈java单元格合并的实现(转载)
- lumia flash android,Lumia830吃上牛扎糖!WP手机刷安卓7.1详细教程