OCR识别文字流程:

1、识别出文字区域(通过滑动窗口算法,遍历整个图片,有监督的标记训练样本特征进行判断,找到目标图片进行矩形化摘取出来)

2、对文字区域矩形分割,拆分成不同的字符(在矩形中做一维滑动窗口移动,判断字符间间距,对字符进行划分)

3、字符分类(对划分好的字符根据监督算法,对字符进行预测)

4、识别出来文字(最终识别出整个字符)

整个流程由多个任务的构成

流程图如下:

举例如下:

通过学习曲线判断分类算法属于低偏差的算法类型,如果不是通过特征向量修正或者增加神经网络隐藏层的方式进行修正。地偏差算法可以通过增加训练样本集的方式提高算法结果

扩大样本训练集的方式

1、把已有的结果经过一定的扭曲获得新的样本(使用已有的数据包,添加不同的背景信息获得标记样本);

2、自己标记或者收集样本信息

3、通过众包的方式,找到廉价的方式标记样本

上限分析

在整个开发算法过程中做上限分析可以让我们明白那些环节应该花费更多的精力优化,才能提升效果

系统整体性能是通过手动分类的结果,直接公布算法的标准答案

每个环节分别提升的效率是通过手工完成之后算法提升的效果,改善该环节之后算法预测的准确率

每个环节的提升的上限均知道之后,就可以明白那些环节提升之后能够更大程度提高系统的优化性能

举例如下:

本课程的总结:

机器学习(第十一周)--图片OCR算法相关推荐

  1. 逻辑回归二分类算法python_机器学习第七周--二分类算法逻辑回归

    一.Logistic分类算法 逻辑回归(Logistic Regression, LR)是传统机器学习中的一种分类模型,由于算法的简单和高效,解释性好以及容易扩展等优点,被广泛应用于点击率预估(CTR ...

  2. 机器学习(十一)谱聚类算法

    谱聚类算法 原文地址:http://blog.csdn.net/hjimce/article/details/45749757 作者:hjimce 一.算法概述 谱聚类算法建立在谱图理论基础上,与传统 ...

  3. 机器学习(十一):FP-Tree算法

    原文来自:博客园(华夏35度)http://www.cnblogs.com/zhangchaoyang 作者:Orisun 个人觉得这篇文章写的挺好的,前面大半部分都很好理解,到了最后根据FP-tre ...

  4. 深度学习笔记第三门课 结构化机器学习项目 第二周 机器学习(ML)策略(2)...

    本文是吴恩达老师的深度学习课程[1]笔记部分. 作者:黄海广[2] 主要编写人员:黄海广.林兴木(第四所有底稿,第五课第一二周,第三周前三节).祝彦森:(第三课所有底稿).贺志尧(第五课第三周底稿). ...

  5. 吴恩达机器学习笔记第一周

    第一周 吴恩达机器学习笔记第一周 一. 引言(Introduction) 1.1 欢迎 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学习 二.单变量线性回归(Linear Regress ...

  6. 机器学习笔记 (第一周)

    机器学习笔记 (第一周) 目录 机器学习笔记 (第一周) 引言(Introduction) 1.1 什么是机器学习,机器学习能做些什么事情 1.2 机器学习是什么? 1.3 监督学习 1.4 无监督学 ...

  7. 赵栋/东文才 《面向对象程序设计(java)》第十一周学习总结

    201771010137 赵栋<面向对象程序设计(java)>第十一周学习总结 一:理论部分. 1.数据结构:分为a.线性数据结构,如线性表.栈.队列.串.数组和文件. b.非线性数据结构 ...

  8. 左耳听风 第二十一周

    左耳听风 第二十一周 每周完成一个ARTS: 每周至少做一个 leetcode 的算法题.阅读并点评至少一篇英文技术文章.学习至少一个技术技巧.分享一篇有观点和思考的技术文章.(也就是 Algorit ...

  9. 【中英】【吴恩达课后测验】Course 3 -结构化机器学习项目 - 第二周测验

    [中英][吴恩达课后测验]Course 3 -结构化机器学习项目 - 第二周测验 - 自动驾驶(案例研究) 上一篇:[课程3 - 第一周测验]※※※※※ [回到目录]※※※※※下一篇:[课程4 -第一 ...

最新文章

  1. js 拉勾网效果_Node.js 中实践基于 Redis 的分布式锁实现
  2. reentrantLock 和 synchronized 哪个性能高?
  3. java输出二进制数_Java打印整数的二进制表示(代码与解析)
  4. InfluxDB Cli中查询结果中time格式显示设置
  5. 速成! | 遗传算法详解及其MATLAB实现
  6. 软件如何实现屏幕共享?
  7. (Web前端)后台管理系统框架收集
  8. Starbound正式版的Mod制作(二)nbsp;…
  9. 《计算机网络自顶向下》笔记
  10. 问题 C: 百头百脚
  11. 关于在win8下面安装虚拟机出现的一些问题
  12. pads layout查看管脚连接
  13. 会员营销中,沉寂会员的三种运营策略
  14. 10、netty结合websocket完成消息的单发和群发
  15. laya air 碰撞事件 和 重力设置
  16. 图片返回base64数据渲染为图片的处理
  17. 算法设计与分析实验课(2)
  18. 交互式shell和非交互式shell、登录shell和非登录shell
  19. 如何解决在excel工作表中鼠标的右键不能使用的问题
  20. xycms留言板 php 1.5,XYCMS留言板PHP版源码下载 v1.7

热门文章

  1. 数据结构:单链表的基本操作
  2. viewport视口的概念
  3. Monit:开源服务器监控工具
  4. ipad界面设计规范,新手设计iPad的必备宝典
  5. android 替代 笔记本,性能最强的安卓平板,可以替代电脑使用
  6. 最短路-弗洛伊德算法狄克斯特拉算法
  7. 短信ui--会话编辑界面(五)彩信附件
  8. EnterPrise Architect(EA)使用教程(六)部署图
  9. java写三角形圆矩形_纯CSS画的基本图形(矩形、圆形、三角形、多边形、爱心、八卦等)...
  10. [转]循序渐进实现仿QQ界面(一):园角矩形与双缓冲贴图窗口