十八、应用实例：图片文字识别OCR

18.1 问题描述和流程图

18.2 滑动窗口

本节问题：

如何在图片中检测到文字？

人像识别：
矩形框；

正负样本，分类，监督学习；

1、选中图片左上角矩形框；
2、传入分类器，检测y0 or y1，返回；
3、矩形框右移（事先设定的步长），重复判断；
4、移到最右边后下移，重复；
5、移到末尾后，第二遍，增大窗口，重复；

OCR识别：

正负样本训练；

一小块一小块的检测；
放大算子：把白色区域扩大；
忽略奇怪的矩形（比如瘦高的，交叉的）；

字符切割；训练分类器；

OCR流水线文字识别：

18.3 获取大量数据和人工数据

本节问题：

如何获得大量数据？

人工合成数据的两种方式：

从零生成；
已有小部分训练集，通过某种方式扩展；

灰度图像；
利用字体库；
将字母换个字体形式然后贴到别的背景中；
这基本从零开始生产；

第二种方法：一个样本扩展成多个样本

失真合成数据，保证失真是合理的；

首先要确保分类器偏差较低，才大量合成人工数据；
最好画个学习曲线，便于观察分析；

18.4 上限分析：下一步工作

在设计完一个机器学习系统后，我们需要对整体以及各个模块进行分析；

比如这里的OCR文本识别：

~~~~~~ 刚刚设计出系统，72%的准确率，我们开始采用控制变量法对各个模块逐个分析；
~~~~~~ 首先文本检测模块，对每个文本区域都设立正确的文本检测结果（仿真出100%正确检测图片中的文本信息），此时第一个模块正确率将达到100%，这时候我们再测试整体的正确率，为89%；

以同样的方式处理第二个模块：

准确率提高到90%；
继续处理第三个模块：

这样我们就能知道各个模块的提升空间有多大，针对性地改善；
这里明显第一个模块：文本检测模块最有潜力改善，所以我们应花费更多的精力在第1、3两个模块；

例如这个人脸识别：

不要花费大量时间去做一些没有意义的事情；
把时间都用在最有价值的事情上；
上限分析的必要性；

吴恩达《机器学习》第十八章：图片文字识别OCR相关推荐

吴恩达机器学习（十六）机器学习流水线、上限分析
目录 0. 前言 1. 流水线 2. 上限分析(Ceiling analysis) 学习完吴恩达老师机器学习课程的照片OCR,简单的做个笔记.文中部分描述属于个人消化后的理解,仅供参考. 如果这篇文章 ...
吴恩达机器学习（十四）推荐系统（基于梯度下降的协同过滤算法）
目录 0. 前言 1. 基于内容的推荐算法(Content-based recommendations) 2. 计算电影特征 3. 基于梯度下降的协同过滤算法(Collaborative filter ...
吴恩达机器学习（十二）主成分分析（降维、PCA）
目录 0. 前言 1. 主成分分析(PCA) 2. 主成分分析PCA的流程 3. 低维空间维度的选择 4. 主成分分析使用方式学习完吴恩达老师机器学习课程的降维,简单的做个笔记.文中部分描述属于个人 ...
吴恩达机器学习（十）支持向量机（SVM）
目录 0. 前言 1. 代价函数(Cost Function) 2. 假设函数(Hypothesis) 3. 范数表示 4. 高斯核函数(Gaussian Kernel) 5. SVM实现多分类 6. ...
吴恩达机器学习（十二）—— 机器学习系统的设计
吴恩达机器学习系列内容的学习目录→\rightarrow→吴恩达机器学习系列内容汇总. 1. 优先处理的工作:垃圾邮件分类例子 2. 误差分析 3. 偏斜类的误差度量 4. 查准率和查全率之间的权衡 ...
吴恩达机器学习（十五）—— 应用实例：图片文字识别
应用实例:图片文字识别 1. 问题描述和流水线 2. 滑动窗口 3. 获取大量数据:人工数据合成 4. 上限分析:流水线的哪个模块最有改进价值学习图片文字识别的应用实例要做的事情: 展示一个复杂 ...
吴恩达机器学习（十五）大规模机器学习（Batch、Stochastic、Mini-batch gradient descent、MapReduce）
目录 0. 前言 1. Stochastic Gradient Descent 2. Mini-batch Gradient Descent 3. MapReduce 4. 在线学习(online l ...
西瓜书+实战+吴恩达机器学习（十四）无监督学习之聚类（k-means, LVQ, 高斯混合聚类, DBSCAN, AGNES）
文章目录 0. 前言 1. 性能度量 1.1. 外部指标 1.2. 内部指标 2. 距离计算 3. k-means算法 4. 学习向量量化 5. 高斯混合聚类 6. 密度聚类 DBSCAN 7. 层次 ...
西瓜书+实战+吴恩达机器学习（十九）特征选择（过滤式选择、包裹式选择）
文章目录 0. 前言 1. 过滤式选择 2. 包裹式选择如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言特征选择是一个很重要的数据预处理过程: 选择出重要的特征 ...
西瓜书+实战+吴恩达机器学习（十八）降维（主成分分析 PCA）
文章目录 0. 前言 1. 主成分分析PCA 如果这篇文章对你有一点小小的帮助,请给个关注,点个赞喔,我会非常开心的~ 0. 前言维数灾难:在高维情形下出现的数据样本稀疏.距离计算困难等问题. 缓解 ...

吴恩达《机器学习》第十八章：图片文字识别OCR

文章目录