1.什么是OCR?

OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。

2.OCR典型应用有哪些?

全文识别:创建可检索文档

当文档以图像,传真或者扫描文档形式存在时,是不容易进行搜索的。OCR可将文本图像转换成实际可搜索的文本。Google Desktop 和Windows Desktop Search可为这些带有OCR识别的PDF文件和XPS文件编索引,使你通过常规的文本搜索找到所需文件。

区域识别:表格填报

在日常工作和生活中,保单,纳税申报,发票和支票等都会涉及到表单。如何使表单处理轻松而快速呢?绝大多数表单处理解决方案都是通过OCR来收集打印数据,ICR 来收集手写数据,OMR来检测所填数据。结构化的表单处理通常采用分区OCR和ICR。

3.OCR识别率取决于哪些因素?

1.扫描分辨率:不求最“高”,只求最“佳”。根据经验,五号印刷体采用250~300dpi比较合适;字号比较大(四号以上),用150~200dpi就足够了;

2.对比度:为了达到最佳的识别效果,对输入稿件在扫描时的要求是清晰,使扫描文件黑白分明,有利于软件的识别;

3.偏斜程度:现在的OCR大都采用字模识别的方式,因此图像如果有一定程度的倾斜,就会严重影响识别效果,一方面需要尽量摆正扫描文件,另一方面还需要使用软件进行偏斜校正;

4.图片模式:一般对彩色模式识别很差,黑白模式(Line/art)的图片识别较好;

5.字体:印刷体识别率高,手写体识别率很低,需要人工校正;

4.OCR开源项目

1.OCRE, OCR Easy, http://lem.eui.upm.es/ocre.html

2.Clara OCR, http://directory.fsf.org/claraocr.html

3.Ocrad, based on a feature extraction, http://directory.fsf.org/ocrad.html

4.GOCR, http://sourceforge.net/projects/jocr

5.OCRchie: Modular Optical Character Recognition Software, http://http.cs.berkeley.edu/~fateman/kathey/ocrchie.html

6.Tesseract, http://code.google.com/p/tesseract-ocr/

OCR学习之一:OCR简介相关推荐

  1. 基于深度学习的OCR技术简介

    1.概述 本文简要介绍基于深度学习的OCR技术,主要分为整体框架流程介绍,文字检测CTPN,文字识别CRNN+CTC,基于windows平台的项目实战,以及遇到的一些问题和解决方案,最后展示一下胜利的 ...

  2. 【AI in 美团】深度学习在OCR中的应用

    背景 计算机视觉是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的对目标进行检测.识别.理解.跟踪.判别决策的功能.以美团业务为例,在商家上单.团单展示.消费评价等多个环节都会涉及计算机视觉的应用 ...

  3. 【AI in 美团】 深度学习在OCR中的应用

    2019独角兽企业重金招聘Python工程师标准>>> 背景 计算机视觉是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的对目标进行检测.识别.理解.跟踪.判别决策的功能.以美团 ...

  4. 【OCR入门】一、基于深度学习的OCR技术导论和PaddleOCR

    目录 一.OCR简介 1.1.OCR是什么? 1.2.OCR的使用场景 1.3.OCR的技术难点 二.OCR前言技术 2.1.文本检测 2.2.文本识别 2.3.文档的结构化识别 2.4.其他OCR相 ...

  5. 【深度学习】OCR文本识别

    OCR文字识别定义 OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程: ...

  6. (1)OCR学习-相关知识

    1.什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别.它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够 ...

  7. 基于深度学习的OCR

    为了提升用户体验,O2O产品对OCR技术的需求已渗透到上单.支付.配送和用户评价等环节.OCR在美团业务中主要起着两方面作用.一方面是辅助录入,比如在移动支付环节通过对银行卡卡号的拍照识别,以实现自动 ...

  8. OCR学习流程(整理中)

    文章目录 OCR学习 1. 图片预处理 2. 图像分割 3. 文本检测 4. 文本识别 OCR学习 OCR(光学字符识别),即将图片输入,然后识别图中的文字. 1. 图片预处理 图片的预处理主要有:灰 ...

  9. 中国首份OCR白皮书出炉,基于深度学习的OCR已成主流-1

    扫一扫就能识别文字,这是近年来出现在很多应用中的新功能.比如,输入银行卡号时,直接用手机摄像头扫一扫,软件就能提取银行卡信息.这里用到的技术正是光学字符识别技术(Optical Character R ...

  10. 身份证正反面识别,身份证扫描识别,二代身份证 OCR 识别,OCR 极速识别身份证所有信息正反面均可。离线无需联网,极速秒扫。

    IdCardOCR 项目地址:XieZhiFa/IdCardOCR 简介:身份证正反面识别,身份证扫描识别,二代身份证 OCR 识别,OCR 极速识别身份证所有信息正反面均可.离线无需联网,极速秒扫. ...

最新文章

  1. 每日一皮:程序员距离人生目标只有一个沟
  2. Beyond Compare4长期使用方法
  3. vue指令:v-cloak渲染指令(v-cloak 指令是解决屏幕闪动的好方法)
  4. location 拦截所有_让它帮你干掉所有流氓软件,还你一个清静系统
  5. android qq红包,Android实现QQ抢红包插件
  6. 我自横刀向天笑,我命由我不由天
  7. linux系统环境下压缩与解压缩
  8. socket编程学习笔记:关于TCP Test Tool的安装和使用
  9. 设计模式(二):Facade和Adapter模式
  10. 【JAVA程序设计】(C00003)基于springboot+mybatis的在线购物商城系统
  11. 淘宝客如何赚钱?为什么很多人做淘宝客赚不到钱?
  12. 锁定计算机后qq能远程吗,如何通过QQ进行远程控制(利用QQ远程协助在不同网络下远程控制电脑)...
  13. React基础(貳)———组件
  14. 企业如何选择电信、双线、多线/三线、BGP线路?他们的区别是什么?
  15. Linux shell脚本中分号的作用
  16. 湖北省创新型中小企业培育申报流程方法及申报时间要求指南
  17. DNSPod十问Matt Overman:二维码真的代替域名了吗?
  18. 暗通道先验算法matlab
  19. 基于ETest_D的火控系统电源组件自动测试仪国产化设计
  20. 正则表达式之基本概念

热门文章

  1. 【易语言助手插件】IDE 鼠标手势1.2 原汁原味移植浏览器手势
  2. 初次爬虫:读取PDF转成图片,再提取图片里的文字信息
  3. 严重性 代码 说明 项目 文件 行 禁止显示状态 警告 CS8032 无法从...创建分析器...的实例: 未能加载文件或程序集...或它的某一个依赖项。系统找不到指定的文件
  4. Adobe illustrator 输入数学平方公式
  5. <3>【深度学习 × PyTorch】必会 线性代数 (含详细分析):点积 | 矩阵-向量积 | Hadamard积 | 矩阵乘法 | 范数/矩阵范数
  6. java拼音分词_使用Pinyin4j进行拼音分词的方法
  7. 腾讯Android面试:Handler中有Loop死循环,为什么没有阻塞主线程,原理是什么
  8. 小帅一点资讯小程序源码
  9. KPM算法思想及实现
  10. label 字体添加中划线和下划线