第33卷第6期    计算机应用与软件 Vol33No.6

2016年6月   ComputerApplicationsandSoftware Jun.2016

一种复杂版面扭曲文档图像快速校正方法

曾凡锋 段漾波

(北方工业大学计算机学院 北京 100144)

摘 要  在对复杂版面扭曲文档图像进行OCR识别时,识别率较低。针对这类文档图像提出一种基于形态学文本行定位的扭曲

校正方法。首先根据形态学特征在复杂版面中定位文本行,区分处理文字区域和非文字区域,利用文本行信息提取文本线;再以文

本线为基准利用窗口扫描法进行文字行校正,最终重构图像。实验结果表明,该方法校正效果明显,对于复杂版面的扭曲文档图像

有较好的校正效果,校正后识别率大幅度提高。

关键词  复杂版面 扭曲文档 形态学组件 窗口扫描校正

中图分类号 TP391    文献标识码 A    DOI:10.3969/j.issn.1000386x.2016.06.042

AFASTCORRECTIONMETHODFORWARPEDDOCUMENTIMAGES

INCOMPLEXLAYOUT

ZengFanfeng DuanYangbo

(CollegeofComputer,NorthChinaUniversityofTechnology,Beijing100144,China)

Abstract  TherecognitionrateofOCR(opticalcharacterrecognition)onwarpeddocumentimagesincomplexlayoutisrelativelylow.To

solvethisproblem,weproposedamorphologybasedwarpcorrectionmethodwithrowsoftextpositioning.First,accordingthemorphological

characteristicsitlocatestherowsoftextincomplexlayouttodistinguishthetextareasfromotherareas.Afterthatitusestherowsoftext

informationtoextractthetextlines,andthenusesthetextlinesasthebenchmark,employsthewindowscanningmethodtocorrecttherows

oftext,andfinallyreconstructstheimage.Experimentalresultsdemonstratedthatthismethodachievedmanifestcorrectioneffect.Forwarped

documentimagesincomplexlayoutitgainedacceptablecorrectionresults,therecognitionrateimprovedsignificantlyafterthecorrection.

Keywords  Complexlayout Warpeddocument Morphologiccomponent Windowsscanningcorrection

正,但其校正粒度较为粗糙,效果欠佳。

0 引 言 通过以上分析总结,各种校正方法各有特点,但应用到复杂

版面文档图像时都不易获得理想的校正效果,其原因在于复杂

在图像的采集过程中,由于受到纸质文档自身几何形状和 版面中的非文字元素影响了各种校正方法中的处理步骤。因此

拍摄角度的影响,采集到的图像可能发生扭曲,而文档图像的扭

文档图片校正 计算机软件,一种复杂版面扭曲文档图像快速校正方法.PDF相关推荐

  1. matlab不规则碎片拼接,一种不规则破碎单面图像快速拼接方法

    一种不规则破碎单面图像快速拼接方法 [专利摘要]本发明的一种不规则破碎单面图像快速拼接方法,是首先将不规则破碎的单面图像碎片扫描成数字图像,然后获取每个图像碎片边缘的逆时针像素灰度值序列,通过计算各个 ...

  2. ts20芯片c语言例程,种基于C语言的DSP程序通用固化方法.PDF

    种基于C语言的DSP程序通用固化方法.PDF 第38卷 第3期(总第 149期) 火控雷达技术 Vo1.38No.3(Serse148) 2009年9月 FireControlRadarTechnol ...

  3. python docx 合并文档 图片_使用python抓取大量简历文档内数据(word:docx;pdf;图片等)输出表格文件...

    1. 文章背景描述: 近期公司有员工离职了,技术岗位的. 让HR招人,招聘进度也太慢了,实在等不及,就撸起袖子自己上.(之前从来没招聘过) 自己在某招聘网站注册后,花了若干人民币,短时间收到大量求职者 ...

  4. 鱼眼校正c语言算法,一种鱼眼图像逆向经纬映射的快速校正算法

    1. 引言 鱼眼镜头因其焦距短,视场大,拍摄图像信息量大等优点,在安防监控.360度汽车成像仪等领域中得到广泛应用.但鱼眼镜头在获得大视场的同时,会产生严重的图像畸变问题 [1] [2] .通过鱼眼镜 ...

  5. 鱼眼图像畸变校正matlab,鱼眼镜头畸变校正算法的设计

    王赛男 刘涛 左震宇 摘   要:鱼眼镜头的拍摄角度大,成像角度宽,但是在进行图像采集和成像的过程中存在大量畸变,直接使用采集而来的图像很难满足实际需求,因此需要对图像进行后续处理.本文根据摄像机参数 ...

  6. C# 复制幻灯片(包括格式、背景、图片等)到同/另一个PPT文档

    原文:C# 复制幻灯片(包括格式.背景.图片等)到同/另一个PPT文档 C# 复制幻灯片(包括格式.背景.图片等)到同/另一个PPT文档 复制幻灯片是使用PowerPoint过程中的一个比较常见的操作 ...

  7. 文档扫描识别——基于M-LSD线段检测的拍照文档校正

    前言 1.拍照文档扫描识别是办公类App里面最常用到的的一类应用,市面上有很多相关的App,及主要技术点有几个要用到图像处理,有边缘检测校正,文档滤镜,和OCR. 2.关于边缘文档连续检测,有用传统算 ...

  8. GUI实战|Python做一个文档图片提取软件

    大家好,本文将进一步讲解如何用Python提取PDF与Word中图片,并结合之前讲解过的GUI框架PysimpleGUI,做一个多文件图片提取软件,效果如下: 本文主要将分为以下部分讲解: PDF.W ...

  9. python docx 合并文档 图片_Python+pymupdf处理PDF文档案例6则

    推荐图书:<Python程序设计(第3版)>,(ISBN:978-7-302-55083-9),清华大学出版社,2020年6月第1次印刷,7月第2次印刷 京东购买链接:https://it ...

最新文章

  1. elementui的el-tree第一次加载无法展开和选中的问题
  2. Java虚拟机详解02----JVM内存结构
  3. java如何接受字符_java中string怎么获取指定位置的字符
  4. pip代理解决pip下载失败问题
  5. 利用openssl来计算sha256哈希值
  6. 继承的编写小结汇总。
  7. 网络连接的netstat命令
  8. 清华姚班毕业生开发新特效编程语言,99行代码实现《冰雪奇缘》,网友:大神厉害了!创世的快乐...
  9. 与计算机相关的统计表格,统计信息化 Excel与SPSS应用pdf
  10. idea 设置文件忽略git版本控制
  11. QT Creator 5.1.2中英文切换
  12. 进击的巨人和枪王黑泽两部漫画的观后感
  13. ie浏览器代理设置方法 怎么给IE浏览器设置代理?
  14. java中特殊字符的输出方式_java 特殊符号输出绝对基础?
  15. 从碧桂园和兴海物联看物业信息化、数字化和智能化
  16. Golang后端开发学习之路
  17. 第四十二次总结:json模块与pickle模块
  18. 苹果二手机价格行情2022.2.22
  19. CUMT第一轮双月赛Web题解
  20. 计算机图形学基础之一点两点三点透视图

热门文章

  1. 开源日志查看软件Log2Window介绍
  2. dsl java_Java DSL理解
  3. 很少有人会知道的97个秘密
  4. JWT详解、JJWT使用、token 令牌
  5. Java遍历Set集合方法(*)
  6. 小米游戏本win10系统安装office2013提示1935错误
  7. numpy中*,np.multiply和np.dot辨析
  8. 培训是企业的最大福利
  9. java合并单元格的快捷键_浅谈java单元格合并的实现(转载)
  10. lumia flash android,Lumia830吃上牛扎糖!WP手机刷安卓7.1详细教程