OCR学习之一：OCR简介

1.什么是OCR？

OCR （Optical Character Recognition，光学字符识别）是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程；即，对文本资料进行扫描，然后对图像文件进行分析处理，获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率，是OCR最重要的课题，ICR（Intelligent Character Recognition）的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有：拒识率、误识率、识别速度、用户界面的友好性，产品的稳定性，易用性及可行性等。

2.OCR典型应用有哪些？

全文识别：创建可检索文档

当文档以图像，传真或者扫描文档形式存在时，是不容易进行搜索的。OCR可将文本图像转换成实际可搜索的文本。Google Desktop 和Windows Desktop Search可为这些带有OCR识别的PDF文件和XPS文件编索引，使你通过常规的文本搜索找到所需文件。

区域识别：表格填报

在日常工作和生活中，保单，纳税申报，发票和支票等都会涉及到表单。如何使表单处理轻松而快速呢？绝大多数表单处理解决方案都是通过OCR来收集打印数据，ICR 来收集手写数据，OMR来检测所填数据。结构化的表单处理通常采用分区OCR和ICR。

3.OCR识别率取决于哪些因素？

1.扫描分辨率：不求最“高”，只求最“佳”。根据经验，五号印刷体采用250～300dpi比较合适；字号比较大(四号以上)，用150～200dpi就足够了；

2.对比度：为了达到最佳的识别效果，对输入稿件在扫描时的要求是清晰，使扫描文件黑白分明，有利于软件的识别；

3.偏斜程度：现在的OCR大都采用字模识别的方式，因此图像如果有一定程度的倾斜，就会严重影响识别效果，一方面需要尽量摆正扫描文件，另一方面还需要使用软件进行偏斜校正；

4.图片模式：一般对彩色模式识别很差，黑白模式（Line/art）的图片识别较好；

5.字体：印刷体识别率高，手写体识别率很低，需要人工校正；

4.OCR开源项目

1.OCRE, OCR Easy, http://lem.eui.upm.es/ocre.html

2.Clara OCR, http://directory.fsf.org/claraocr.html

3.Ocrad, based on a feature extraction, http://directory.fsf.org/ocrad.html

4.GOCR, http://sourceforge.net/projects/jocr

5.OCRchie: Modular Optical Character Recognition Software, http://http.cs.berkeley.edu/~fateman/kathey/ocrchie.html

6.Tesseract, http://code.google.com/p/tesseract-ocr/

OCR学习之一：OCR简介相关推荐

基于深度学习的OCR技术简介
1.概述本文简要介绍基于深度学习的OCR技术,主要分为整体框架流程介绍,文字检测CTPN,文字识别CRNN+CTC,基于windows平台的项目实战,以及遇到的一些问题和解决方案,最后展示一下胜利的 ...
【AI in 美团】深度学习在OCR中的应用
背景计算机视觉是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的对目标进行检测.识别.理解.跟踪.判别决策的功能.以美团业务为例,在商家上单.团单展示.消费评价等多个环节都会涉及计算机视觉的应用 ...
【AI in 美团】深度学习在OCR中的应用
2019独角兽企业重金招聘Python工程师标准>>> 背景计算机视觉是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的对目标进行检测.识别.理解.跟踪.判别决策的功能.以美团 ...
【OCR入门】一、基于深度学习的OCR技术导论和PaddleOCR
目录一.OCR简介 1.1.OCR是什么? 1.2.OCR的使用场景 1.3.OCR的技术难点二.OCR前言技术 2.1.文本检测 2.2.文本识别 2.3.文档的结构化识别 2.4.其他OCR相 ...
【深度学习】OCR文本识别
OCR文字识别定义 OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程: ...
(1)OCR学习-相关知识
1.什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别.它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够 ...
基于深度学习的OCR
为了提升用户体验,O2O产品对OCR技术的需求已渗透到上单.支付.配送和用户评价等环节.OCR在美团业务中主要起着两方面作用.一方面是辅助录入,比如在移动支付环节通过对银行卡卡号的拍照识别,以实现自动 ...
OCR学习流程(整理中)
文章目录 OCR学习 1. 图片预处理 2. 图像分割 3. 文本检测 4. 文本识别 OCR学习 OCR(光学字符识别),即将图片输入,然后识别图中的文字. 1. 图片预处理图片的预处理主要有:灰 ...
中国首份OCR白皮书出炉，基于深度学习的OCR已成主流-1
扫一扫就能识别文字,这是近年来出现在很多应用中的新功能.比如,输入银行卡号时,直接用手机摄像头扫一扫,软件就能提取银行卡信息.这里用到的技术正是光学字符识别技术(Optical Character R ...
身份证正反面识别，身份证扫描识别，二代身份证 OCR 识别，OCR 极速识别身份证所有信息正反面均可。离线无需联网,极速秒扫。
IdCardOCR 项目地址:XieZhiFa/IdCardOCR 简介:身份证正反面识别,身份证扫描识别,二代身份证 OCR 识别,OCR 极速识别身份证所有信息正反面均可.离线无需联网,极速秒扫. ...

OCR学习之一：OCR简介

OCR学习之一：OCR简介相关推荐

最新文章

热门文章