关于OCR算法:http://ocr.space/

ocr api接口的种类:OCR名片识别API接口、OCR文档识别API接口、OCR车牌识别API接口、OCR证件识别API接口

一、测试方法:

人工检验(效率低、需要提升)

二、算法指标:

1、文字识别准确率

字符准确率:单字识别率,就是按单字算,一百个字里错5个字,识别率95%。

  • 字符识别准确率,即识别对的字符数占总识别出来字符数的比例,可以反应识别错和多识别的情况,但无法反应漏识别的情况
  • 字符识别召回率,即识别对的字符数占实际字符数的比例,可以反应识别错和漏识别的情况,但是没办法反应多识别的情况,可以配套字符识别准确率一起使用。

整行准确率:一个字段算一个整体,假如100个字分为20个字段,里面错了5个字,分布在4个字段里,那么识别率是16/20=80%。

  • 平均编辑距离:平均编辑距离越小说明识别率越高。平均编辑距离主要衡量整行或整篇文章的指标,可以同时反应识别错,漏识别和多识别的情况
  • 文本行定位为的准确率和召回率,同字符识别的准确率和召回率。主要反应文本行定位的指标,是ocr算法的重要指标

三、图片准备

图片覆盖范围:

不同字体(单字体、混合字体、不同语言的字体)

不同语言(单语言、混合语言、混合特殊字符、公式等)

横排文字、竖排文字

不同图片格式

复杂排版、图文混排、插图中的文字、不同清晰度

OCR算法识别率怎么评估?相关推荐

  1. 深入学习使用ocr算法识别图片中文字的方法

    公司有个需求,简单点说需要从一张图片中识别出中文,通过python来实现,当然其他程序也行,只要能实现,而小编主要学习python,所以就提了python.一个小白在网上遨游了一天,终于找到一丝丝思绪 ...

  2. 文字识别 python离线_开源易用的中文离线OCR,识别率媲美大厂

    TrWebOCR-开源的离线OCR 介绍 TrWebOCR,基于开源项目 Tr 构建. 在其基础上提供了http调用的接口,便于你在其他的项目中调用. 并且提供了易于使用的web页面,便于调试或日常使 ...

  3. 【深度学习】OCR文本识别

    OCR文字识别定义 OCR(optical character recognition)文字识别是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,然后用字符识别方法将形状翻译成计算机文字的过程: ...

  4. 汉字进行计算机识别的原理,计算机OCR文字识别技术的原理和未来发展趋势

    杨俊叶++王训伟 摘要:文章首先对OCR技术的发展背景进行了介绍,指出了OCR文字识别系统在扫描仪.文字编辑等领域的应用及优势.通过对OCR技术工作原理的介绍,重点论述了OCR文字识别系统主要的图像处 ...

  5. ocr人脸识别是什么原理,ocr的工作原理是什么

    ocr是什么意思 . OCR是英文opticalcharacterrecognition的缩写,意思是:文字识别OCR(opticalcharacterrecognition)文字识别是指电子设备(例 ...

  6. OCR财务报表识别方案应用

    OCR财务报表识别(光学字符识别)技术,是通过图像处理技术手段,将图像(影像)上的文字.表格.图像转化为电子版的数据,通过计算机程序,快速实现数据信息的采集.财务报表中,存在大量的数据需要手工录入,使 ...

  7. 国税总局发票查验平台验证码识别方案,识别率达98%

    全国增值税发票查验平台验证码 2020.04.30 已经同步更新,测试网址不变 手动置顶:验证码识别测试页面(可视化操作) 识别率97.5%,图片接口支持手动测试,以图片形式返回结果:文本接口需要联系 ...

  8. OCR文字识别笔记总结

    OCR的全称是Optical Character Recognition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别,交通路牌的识别,车牌的自动识别等等.本 ...

  9. OCR财务报表识别方案

    OCR财务报表识别(光学字符识别)技术,是通过图像处理技术手段,将图像(影像)上的文字.表格.图像转化为电子版的数据,通过计算机程序,快速实现数据信息的采集.财务报表中,存在大量的数据需要手工录入,使 ...

最新文章

  1. 剑指offer:面试题07. 重建二叉树
  2. 攻击面管理预防网络攻击原理?
  3. cap3拼接sanger序列:在线+本地分析方法实战
  4. 从eclipse中下载到手机的android程序总是旧的版本
  5. CSP认证201412-1 门禁系统[C++题解]:哈希表
  6. Hacking Team Flash 0day漏洞学习笔记
  7. github的角色和人员结构
  8. NumPy 百题大冲关,冲鸭!
  9. Codeforces Global Round 12 D. Rating Compression 思维 + 贪心
  10. Spring Boot&Angular 5&Spring Data&Rest示例(CRUD)
  11. php正则表达式匹配逗号,数字和逗号PHP正则表达式只
  12. kf真空接头标准尺寸_大连高速旋转接头商家,什么是旋转接头_上海汉洲国际贸易...
  13. 整理 45 道 CSS 基础面试题(附答案)
  14. parallels网络初始化失败_出神入化:特斯拉AI主管、李飞飞高徒Karpathy的33个神经网络炼丹技巧...
  15. Jenkins的Windows Slave分布式构建和部署
  16. python爬虫英文翻译_python爬虫学习---爬取微软必应翻译(中英互译)
  17. 远视图+五环(css练习)
  18. 超声波传感器(CHx01) 学习笔记 Ⅴ- 参数配置
  19. Java Dad08
  20. 我陪你慢慢成长——苏子语录2015下半…

热门文章

  1. 网络协议分析工具Ethereal的使用
  2. SQL Server六步改善安全规划全攻略
  3. 【转】用nohup命令让Linux下程序永远在后台执行
  4. Weex学习资料整合
  5. JQuery学习使用笔记 -- JQuery插件开发
  6. JButton 做图片框
  7. oracle instr函数 收藏
  8. 【第二组】项目冲刺(Beta版本)第一次每日例会 2017/7/18
  9. 《Android游戏编程入门经典》——1.7节小结
  10. 复杂分组统计---表在文件中