《2006_ICPR_Low Resolution Character Recognition by Image Quality Evaluation》阅读笔记
论文主要思想
这是一篇关于低质量字符图像识别的文章,这里的“低质量”指的是字符图像的分辨率低。
作者在文中指出,传统的(指的是2006年之前)低质量字符图像识别方法主要分为两类:第一类方法采用一些图像增强手段以及一些“先进的”二值化方法,来从低质量字符图像中提取出二值化图像,然后从二值化图像中提取出用来进行识别分类的特征,最后基于这些特征建立字符分类器;第二种方法则直接从低质量字符图像中提取分类特征,包括结构特征以及频率特征。作者认为,在利用第一种方法获取二值化字符图像时,一些字符的笔画要么会断开,要么会与其他笔画连在一起,从而导致信息的丢失,对识别带来不利的影响;第二种方法中的结构特征不适合用于识别低质量字符图像,而频率特征,如利用Gabor滤波器提取出的特征,在识别低分辨率字符图像时,会取得不错的效果。因此,作者利用Gabor滤波器直接从低分辨率的字符图像中提取用来分类的特征,从而实现对地分辨率字符图像的识别。
此外,作者认为,对于低质量字符图像,如果使用和它降质类型相同的字符图像库来训练分类器,那么可以取得很不错的识别结果。因此作者建立了一个用于评价字符图像分辨率等级的分类器,使用的评价特征为图像的灰度直方图,这里的分辨率等级包括:好、中等以及差着三种,然后用该分类器将训练样本化分成三类,最后用这三类样本分布建立一个字符分类器。那么对于一幅测试图像,首先利用分辨率等级分类器评级其对应的分辨率等级,然后将其输入到对应的字符分类器中,得到最终的识别结果,整个框架如下图所示(这里直接使用文中的原图):
《2006_ICPR_Low Resolution Character Recognition by Image Quality Evaluation》阅读笔记相关推荐
- trainer setup_Detectron2源码阅读笔记-(一)Configamp;Trainer
一.代码结构概览 1.核心部分 configs:储存各种网络的yaml配置文件 datasets:存放数据集的地方 detectron2:运行代码的核心组件 tools:提供了运行代码的入口以及一切可 ...
- VoxelNet阅读笔记
作者:Tom Hardy Date:2020-02-11 来源:VoxelNet阅读笔记
- Transformers包tokenizer.encode()方法源码阅读笔记
Transformers包tokenizer.encode()方法源码阅读笔记_天才小呵呵的博客-CSDN博客_tokenizer.encode
- 源码阅读笔记 BiLSTM+CRF做NER任务 流程图
源码阅读笔记 BiLSTM+CRF做NER任务(二) 源码地址:https://github.com/ZhixiuYe/NER-pytorch 本篇正式进入源码的阅读,按照流程顺序,一一解剖. 一.流 ...
- Mina源码阅读笔记(一)-整体解读
2019独角兽企业重金招聘Python工程师标准>>> 今天的这一节,将从整体上对mina的源代码进行把握,网上已经有好多关于mina源码的阅读笔记,但好多都是列举了一下每个接口或者 ...
- “CoreCLR is now Open Source”阅读笔记
英文原文:CoreCLR is now Open Source 阅读笔记如下: CoreCLR是.NET Core的执行引擎,功能包括GC(Garbage Collection), JIT(将CIL代 ...
- QCon 2015 阅读笔记 - 团队建设
QCon 2015阅读笔记 QCon 2015 阅读笔记 - 移动开发最佳实践 QCon 2015 阅读笔记 - 团队建设 中西对话:团队管理的五项理论和实战 - 谢欣.董飞(今日头条,LinkedI ...
- 05《软件需求模式》阅读笔记
剩下的两个阅读笔记写第二部分.各类需求模式,共八个领域和它的需求模式,这一次写前四个. 基础需求模式,它是所有种类的系统都可能需要的一些东西.系统间接口需求模式使用系统间接口需求模式定义被定义的系统和 ...
- [置顶] Linux协议栈代码阅读笔记(一)
Linux协议栈代码阅读笔记(一) (基于linux-2.6.21.7) (一)用户态通过诸如下面的C库函数访问协议栈服务 int socket(int domain, int type, int p ...
- 大型网站技术架构:核心原理与案例分析阅读笔记二
大型网站技术架构:核心原理与案例分析阅读笔记二 网站架构设计时可能会存在误区,其实不必一味追随大公司的解决方案,也不必为了技术而技术,要根据本公司的实际情况,制定适合本公司发展的网站架构设计,否则会变 ...
最新文章
- 数组之间的计算matlab,MATLAB软件数组的运算
- 回归框架下的人脸对齐和三维重建
- 前端月趋势榜:5 月最热门的 20 个前端开源项目 - 2105
- css定位positon
- Sparklens:Spark应用程序优化工具
- C#设计模式(学习笔记[01])
- System.getProperty的用法
- python中质数的表达方式_python求质数的3种方法
- GCPC 2018 – Problem D: Down the Pyramid
- Project: Individual Project - Word frequency program
- 串口IEC103协议
- 使用hashcat破解Windows账户密码
- 获取小程序页面跳转链接
- 删除win10 qaa输入法
- c++多线程学习11 packaged_task与async
- Tomcat运行框乱码问题解决
- MySQL数据库重启报错“the server quit without updating PID file”处理方法
- can‘t convert np.ndarray of type numpy.object_
- unity音效管理器
- Linux服务器配合Frp实现内网穿透使用windows远程桌面
热门文章
- 天气预报之三(Android版)
- android一些学习网站
- jQuery实现简单实用的H5(手机端)下拉分页加载(所谓的懒加载!!!)
- matlab音乐键盘模拟,科学网—[原][Matlab][04] Midi音乐键盘 - 王楠的博文
- 满二叉树 / 真二叉树 / 完全二叉树 ~
- 《谁动了我的奶酪?》
- 浅谈对IT架构师的理解
- response.setHeader各种用法
- IDEA集成Lombok插件
- 易语言进程通信c语言,易语言进程通信模块和例程源码