上限分析(Ceiling analysis)

光学字符识别并不是一个单一的过程,而是由若干过程构成的流水线。我们知道,字符识别作为该流水线的出口,其将是衡量光学字符识别准确率的依据。工程浩瀚,我们不可能在流水线的每一步都花费巨额的精力来作出改善,因此,我们需要一种手段来知道去改善哪一步是最值得的,**上限分析(Ceiling analysis)**就是手段之一。

所谓上限分析,就是我们假定某个组件及其前面组件的精度都达到了 100%,即该组件完美地完成了任务,达到了上限,那么此时整个系统的精度能提升多少 。例如,假定整个系统的精度是 72%,我们令文本检测的精度是 100%(比如人工利用 PS 来定位图片中的文本框),此时,整个系统的精度能提升到 89%。即,如果我们付出足够多的精力来优化文本检测,那么理想情况下,能将系统的精度提升 17%:

完成上限分析后,我们得到上面的表格,可以看出,最值得花费精力的步骤是文本检测,最不值得花费精力的是字符分割,即便我们完成了 100% 的分割,最多也就对系统提升 1%。

11.4 上限分析-机器学习笔记-斯坦福吴恩达教授相关推荐

  1. 11.2 滑动窗口-机器学习笔记-斯坦福吴恩达教授

    滑动窗口(Sliding window) 文本检测中的滑动窗口 滑动窗口是检测图像中目标对象的最常用手段,在文本检测阶段,我们首先定义正.负样本,正样本图像描述了含有文本的图像,负样本描述了不含文本的 ...

  2. 3.11 程序示例--逻辑运算-机器学习笔记-斯坦福吴恩达教授

    程序示例–逻辑运算 我们使用感知器神经网络来描述逻辑AND运算: 代码: # coding: utf-8 # neural_network/test_logic_and.py "" ...

  3. 4.4 机器学习系统设计--垃圾邮件分类-机器学习笔记-斯坦福吴恩达教授

    机器学习系统设计–垃圾邮件分类 假定我们现有一封邮件,其内容如下: From: cheapsales@buystufffromme.com To: ang@cs.stanford.edu Subjec ...

  4. 11.3 人工合成数据-机器学习笔记-斯坦福吴恩达教授

    人工合成数据 在字符识别阶段,为了更好的完成分类识别任务,我们就需要给系统提供尽可能多的训练图像,如果我们手头上拥有的图像不多,就需要人工合成更多的数据.例如,我们可以收集不同的字体,并为每种字体的每 ...

  5. 11.1 问题描述及流程-机器学习笔记-斯坦福吴恩达教授

    问题描述及流程 假定我们有下面一张图片,光学字符识别要解决的问题就是识别图片中的所有字符: 光学字符识别的工作流程为: 文本检测:获得包含了文本的文本框. 字符分割:从文本框中分割出各个字符 字符分类 ...

  6. 5.11 程序示例--垃圾邮件检测-机器学习笔记-斯坦福吴恩达教授

    程序示例–垃圾邮件检测 邮件内容的预处理 下面展示了一封常见的 email,邮件内容包含了一个 URL (http://www.rackspace.com/),一个邮箱地址(groupname-uns ...

  7. 5.5 SVM补充-机器学习笔记-斯坦福吴恩达教授

    SVM补充 决策边界 Coursera 上 ML 的课程对 SVM 介绍有限,参看了周志华教授的<机器学习>一书后,补充了当中对于 SVM 的介绍. 首先,我们考虑用更传统的权值定义式来描 ...

  8. 3.12 程序示例--多分类问题-机器学习笔记-斯坦福吴恩达教授

    多分类问题 我们手上包含有手写字符的数据集,该数据集来自斯坦福机器学习的课后作业,每个字符图片大小为 20×20 ,总的样本规模为 5000×400 , 我们的神经网络设计如下,包含 1 个隐含层,隐 ...

  9. 10.2 梯度下降-机器学习笔记-斯坦福吴恩达教授

    梯度下降 批量梯度下降法(Batch gradient descent) 拥有了大数据,就意味着,我们的算法模型中得面临一个很大的 m 值.回顾到我们的批量梯度下降法: 重复直到收敛:重复直到收敛:重 ...

最新文章

  1. 每日一皮:我当程序员的时候也是...
  2. cocos2d-x温故(三)!
  3. Apache Spark探秘:三种分布式部署方式比较
  4. USB设备多个配置描述符的获取过程
  5. 模式(一)javascript设计模式
  6. Linux导出函数控制,linux 下仅导出指定函数的方法
  7. pagerank数据集_从小白视角理解数据挖掘十大算法
  8. POSIX定时器Timer
  9. catia知识工程_【开团】CATIA超全直播课程&实例讲解!
  10. 安卓应用_接入 微信支付 无法调起支付界面的坑
  11. ngingx安装错误 ./configure: error: the HTTP rewrite module requires the PCRE library.
  12. vue学习之监听浏览器宽度
  13. Au:突发性噪音降噪方法
  14. 谷歌人机图像识别接口
  15. GSM、PLMN区、msc区、位置区、基站区、小区、TAC、CI 名词解析
  16. vps mysql_vps mysql自动关闭
  17. My Fifty-eighth - Page - 全排列 - By Nicolas
  18. 多智能体强化学习入门
  19. 使用谷歌Chrome浏览器将网页保存为html格式
  20. PHP画a梦,分享html打造动画哆啦A梦的示例代码

热门文章

  1. 利用keepalived和haproxy配置mysql的高可用负载均衡
  2. .Net 获取日期所属于一年中的第几周
  3. 盘点:崛起中的九大HTML5开发工具
  4. 06:甲流疫情死亡率
  5. android 入门-引用库项目
  6. Linux CP文件夹略过目录的解决
  7. 一起来用Websocket(一)开篇 Websocket!Socket在HTML5复活
  8. matlab读取txt
  9. Linux查看系统信息命令实例
  10. VC++ 定时器基本使用