OCR学习之一:OCR简介
1.什么是OCR?
OCR (Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程;即,对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。如何除错或利用辅助信息提高识别正确率,是OCR最重要的课题,ICR(Intelligent Character Recognition)的名词也因此而产生。衡量一个OCR系统性能好坏的主要指标有:拒识率、误识率、识别速度、用户界面的友好性,产品的稳定性,易用性及可行性等。
2.OCR典型应用有哪些?
全文识别:创建可检索文档
当文档以图像,传真或者扫描文档形式存在时,是不容易进行搜索的。OCR可将文本图像转换成实际可搜索的文本。Google Desktop 和Windows Desktop Search可为这些带有OCR识别的PDF文件和XPS文件编索引,使你通过常规的文本搜索找到所需文件。
区域识别:表格填报
在日常工作和生活中,保单,纳税申报,发票和支票等都会涉及到表单。如何使表单处理轻松而快速呢?绝大多数表单处理解决方案都是通过OCR来收集打印数据,ICR 来收集手写数据,OMR来检测所填数据。结构化的表单处理通常采用分区OCR和ICR。
3.OCR识别率取决于哪些因素?
1.扫描分辨率:不求最“高”,只求最“佳”。根据经验,五号印刷体采用250~300dpi比较合适;字号比较大(四号以上),用150~200dpi就足够了;
2.对比度:为了达到最佳的识别效果,对输入稿件在扫描时的要求是清晰,使扫描文件黑白分明,有利于软件的识别;
3.偏斜程度:现在的OCR大都采用字模识别的方式,因此图像如果有一定程度的倾斜,就会严重影响识别效果,一方面需要尽量摆正扫描文件,另一方面还需要使用软件进行偏斜校正;
4.图片模式:一般对彩色模式识别很差,黑白模式(Line/art)的图片识别较好;
5.字体:印刷体识别率高,手写体识别率很低,需要人工校正;
4.OCR开源项目
1.OCRE, OCR Easy, http://lem.eui.upm.es/ocre.html
2.Clara OCR, http://directory.fsf.org/claraocr.html
3.Ocrad, based on a feature extraction, http://directory.fsf.org/ocrad.html
4.GOCR, http://sourceforge.net/projects/jocr
5.OCRchie: Modular Optical Character Recognition Software, http://http.cs.berkeley.edu/~fateman/kathey/ocrchie.html
6.Tesseract, http://code.google.com/p/tesseract-ocr/
OCR学习之一:OCR简介相关推荐
- 基于深度学习的OCR技术简介
1.概述 本文简要介绍基于深度学习的OCR技术,主要分为整体框架流程介绍,文字检测CTPN,文字识别CRNN+CTC,基于windows平台的项目实战,以及遇到的一些问题和解决方案,最后展示一下胜利的 ...
- 【AI in 美团】深度学习在OCR中的应用
背景 计算机视觉是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的对目标进行检测.识别.理解.跟踪.判别决策的功能.以美团业务为例,在商家上单.团单展示.消费评价等多个环节都会涉及计算机视觉的应用 ...
- 【AI in 美团】 深度学习在OCR中的应用
2019独角兽企业重金招聘Python工程师标准>>> 背景 计算机视觉是利用摄像机和电脑代替人眼,使得计算机拥有类似于人类的对目标进行检测.识别.理解.跟踪.判别决策的功能.以美团 ...
- 【OCR入门】一、基于深度学习的OCR技术导论和PaddleOCR
目录 一.OCR简介 1.1.OCR是什么? 1.2.OCR的使用场景 1.3.OCR的技术难点 二.OCR前言技术 2.1.文本检测 2.2.文本识别 2.3.文档的结构化识别 2.4.其他OCR相 ...
- 【深度学习】OCR文本识别
OCR文字识别定义 OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程: ...
- (1)OCR学习-相关知识
1.什么是OCR? OCR英文全称是Optical Character Recognition,中文叫做光学字符识别.它是利用光学技术和计算机技术把印在或写在纸上的文字读取出来,并转换成一种计算机能够 ...
- 基于深度学习的OCR
为了提升用户体验,O2O产品对OCR技术的需求已渗透到上单.支付.配送和用户评价等环节.OCR在美团业务中主要起着两方面作用.一方面是辅助录入,比如在移动支付环节通过对银行卡卡号的拍照识别,以实现自动 ...
- OCR学习流程(整理中)
文章目录 OCR学习 1. 图片预处理 2. 图像分割 3. 文本检测 4. 文本识别 OCR学习 OCR(光学字符识别),即将图片输入,然后识别图中的文字. 1. 图片预处理 图片的预处理主要有:灰 ...
- 中国首份OCR白皮书出炉,基于深度学习的OCR已成主流-1
扫一扫就能识别文字,这是近年来出现在很多应用中的新功能.比如,输入银行卡号时,直接用手机摄像头扫一扫,软件就能提取银行卡信息.这里用到的技术正是光学字符识别技术(Optical Character R ...
- 身份证正反面识别,身份证扫描识别,二代身份证 OCR 识别,OCR 极速识别身份证所有信息正反面均可。离线无需联网,极速秒扫。
IdCardOCR 项目地址:XieZhiFa/IdCardOCR 简介:身份证正反面识别,身份证扫描识别,二代身份证 OCR 识别,OCR 极速识别身份证所有信息正反面均可.离线无需联网,极速秒扫. ...
最新文章
- 每日一皮:程序员距离人生目标只有一个沟
- Beyond Compare4长期使用方法
- vue指令:v-cloak渲染指令(v-cloak 指令是解决屏幕闪动的好方法)
- location 拦截所有_让它帮你干掉所有流氓软件,还你一个清静系统
- android qq红包,Android实现QQ抢红包插件
- 我自横刀向天笑,我命由我不由天
- linux系统环境下压缩与解压缩
- socket编程学习笔记:关于TCP Test Tool的安装和使用
- 设计模式(二):Facade和Adapter模式
- 【JAVA程序设计】(C00003)基于springboot+mybatis的在线购物商城系统
- 淘宝客如何赚钱?为什么很多人做淘宝客赚不到钱?
- 锁定计算机后qq能远程吗,如何通过QQ进行远程控制(利用QQ远程协助在不同网络下远程控制电脑)...
- React基础(貳)———组件
- 企业如何选择电信、双线、多线/三线、BGP线路?他们的区别是什么?
- Linux shell脚本中分号的作用
- 湖北省创新型中小企业培育申报流程方法及申报时间要求指南
- DNSPod十问Matt Overman:二维码真的代替域名了吗?
- 暗通道先验算法matlab
- 基于ETest_D的火控系统电源组件自动测试仪国产化设计
- 正则表达式之基本概念
热门文章
- 【易语言助手插件】IDE 鼠标手势1.2 原汁原味移植浏览器手势
- 初次爬虫:读取PDF转成图片,再提取图片里的文字信息
- 严重性 代码 说明 项目 文件 行 禁止显示状态 警告 CS8032 无法从...创建分析器...的实例: 未能加载文件或程序集...或它的某一个依赖项。系统找不到指定的文件
- Adobe illustrator 输入数学平方公式
- <3>【深度学习 × PyTorch】必会 线性代数 (含详细分析):点积 | 矩阵-向量积 | Hadamard积 | 矩阵乘法 | 范数/矩阵范数
- java拼音分词_使用Pinyin4j进行拼音分词的方法
- 腾讯Android面试:Handler中有Loop死循环,为什么没有阻塞主线程,原理是什么
- 小帅一点资讯小程序源码
- KPM算法思想及实现
- label 字体添加中划线和下划线