评估OCR算法识别率的指标通常有这几种:

one

  • 全对准确率: 每张图片版面上有多个文本时候,每个文本都对的张数占总的张数的比例;
  • 标签全对准确率:每张图片版面上有多个文本时候,文本对的个数占总的文本个数的比例;
  • 平均编辑距离:平均编辑距离越小说明识别率越高。平均编辑距离主要衡量整行或整篇文章的指标,可以同时反应识别错,漏识别和多识别的情况;
  • 字符识别准确率,即识别对的字符数占总识别出来字符数的比例,可以反应识别错和多识别的情况,但无法反应漏识别的情况;
  • 字符识别召回率,即识别对的字符数占实际字符数的比例,可以反应识别错和漏识别的情况,但是没办法反应多识别的情况,可以配套字符识别准确率一起使用;
  • 文本行定位为的准确率和召回率,同字符识别的准确率和召回率。主要反应文本行定位的指标,是ocr算法的重要指标;

two

  • 第一种是字符准确率,单字识别率,就是按单字算,一百个字里错5个字,识别率95%。
  • 第二种是字段准确率,整行识别率,一个字段算一个整体,假如100个字分为20个字段,里面错了5个字,分布在4个字段里,那么识别率是16/20=80%。
  • 第三种是整张准确率。通常在票据证件里面有这种计算方式,假设一张票据上有20字,4个字段,5张票上100个字,20字段,错了5个字,分布在4个字段里,分布在3张票据上。那么识别率只有2/5=40%。而且票据字段越多,容易出错的概率越高,整张识别率这个要求就越严苛。实测过程中也会有一些特别约定,说整张识别里错一两个字可以忽略的,这种再另说。

同样是100字错5个,用字符、字段、整张准确率来测算的结果是完全不同的,所以对比不同OCR算法时候一定要看清描述的是单字识别率、整行识别率还是整张识别率。一样的识别率99%,整张识别率可比单字识别率的含金量要大得多。

参考

  • OCR算法识别率怎么评估?

OCR算法识别性能评估相关推荐

  1. OCR算法识别率怎么评估?

    关于OCR算法:http://ocr.space/ ocr api接口的种类:OCR名片识别API接口.OCR文档识别API接口.OCR车牌识别API接口.OCR证件识别API接口 一.测试方法: 人 ...

  2. 机器学习(17)无监督学习 -- K-means算法与性能评估

    目录 一.K-means 1.概念 2.过程 3.API(K-means) 二.K-means性能评估 1.轮廓系数 2.API(轮廓系数) 一.K-means 1.概念 无监督学习:没有目标值(没有 ...

  3. 深入学习使用ocr算法识别图片中文字的方法

    公司有个需求,简单点说需要从一张图片中识别出中文,通过python来实现,当然其他程序也行,只要能实现,而小编主要学习python,所以就提了python.一个小白在网上遨游了一天,终于找到一丝丝思绪 ...

  4. 机器学习中算法的性能评估

    机器学习和推荐系统中的评测指标-(1)准确率(Accuracy):(2)错误率(Error rate)(3)精确率.精度(Precision):(4)召回率(Recall):(5)灵敏度/敏感性(se ...

  5. 【论文解读】经典CNN对2D3D掌纹及掌静脉识别的性能评估

    掌纹识别(palmprint recognition)及掌静脉识别(palm vein recognition)作为两种新兴的生物特征识别技术已经引起广泛关注.最近几年,深度学习已经成为人工智能领域最 ...

  6. OCR文字识别笔记总结

    OCR的全称是Optical Character Recognition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别,交通路牌的识别,车牌的自动识别等等.本 ...

  7. 机器学习算法的效果评估和优化方法

    当我们运用训练好了的模型来预测未知数据的时候发现有较大的误差,我们下一步可以做什么? 1.获得更多的训练实例--通常是有效的,但代价较大,下面的方法也可能有效,可考虑先采用下面的几种方法. 2.尝试减 ...

  8. OCR文字识别—基于CTC/Attention/ACE的三大解码算法

    本文全面梳理一下OCR文字识别三种解码算法,先介绍一下什么是OCR文字识别,然后介绍一下常用的特征提取方法CRNN,最后介绍3种常用的解码算法CTC/Attention/ACE. 什么是OCR文字识别 ...

  9. 车牌字符识别OCR算法评估

    最近学习了<Mastering Opencv with Pratical Computer Vision Projects>中第五章:基于SVM和神经网络的车牌识别系统.原文最后提到:当训 ...

  10. 【深度学习】OCR文字识别—基于CTC/Attention/ACE的三大解码算法

    本文全面梳理一下OCR文字识别三种解码算法,先介绍一下什么是OCR文字识别,然后介绍一下常用的特征提取方法CRNN,最后介绍3种常用的解码算法CTC/Attention/ACE. 什么是OCR文字识别 ...

最新文章

  1. eclipse连接mysql8报错_Eclipse连接MySQL8.0.13 win10 64位
  2. gdo图形引擎中的旋转角
  3. 转发离线安装 Android Studio 更新
  4. 应用(指定)进程创建的时候创建Application
  5. ORACLE经常使用系统查询
  6. 使用JSLint提高JS代码质量
  7. 编程语言对比 引用数据类型-列表
  8. MongoDBTool - 测试版【GUI美化完毕】 源代码发布 --MongoDB爱好者,Winform爱好者 请进...
  9. Hive实现oracle的Minus函数
  10. 中国移动彩信业务资料集合
  11. 详解高级前端面试常问的EventLoop
  12. 触感啥意思_苹果手机系统触感反馈是什么意思
  13. 用diiv实现多个方块居中嵌套--padding
  14. 流媒体 - 02 常用命令(gst+ffmpeg+v4l2)
  15. replay attacker
  16. 一个小玩意 PHP实现微信红包金额拆分试玩
  17. 【转】在WPF显示动态GIF图片
  18. 21届毕业生大四实习的生活
  19. 感受 OpenDNS
  20. 原型的概念以及为什么使用原型

热门文章

  1. python写入指定文件夹_python 获取指定文件夹下所有文件名称并写入列表的实例...
  2. 【java基础】同比和环比
  3. 如何培养一个人:从育儿谈起
  4. 三国志战略版:求贤之我要换啥
  5. line划线计算机图像学,计算机图形学DDA画线法+中点画线法+Bresenham画线法(示例代码)...
  6. 数学中最神奇的常数-无理数e的由来
  7. html5 3d资源,视觉盛宴 HTML5 3D动画应用赏析
  8. [游戏杂谈]浅谈单机游戏制作人到底应该具备什么样的能力
  9. 无法向会话状态服务器发出会话状态请求请。确保 ASP.NET State Service (ASP.NET 状态服务)已启动
  10. html做群聊通讯方法,一例完整的websocket实现群聊demo