ocr文字识别数据集

目前正在做ocr文字识别相关的项目,做了一些调研,今天做个周结,首先是几个开源框架对比吧!

EasyOCR、Chineseocr、Chineseocr_lite

我主要看的是GitHub中的一些项目,这三个OCR识别工具是Github里包含中文OCR功能的。第一、EasyOCR是全语种的(包括70+门外语识别),不单单针对中文,所以它的官方文档自然也都是英文了。对于英文不好的小伙伴来说很不友好。因此这里主要还是基于Chineseocr_和Chineseocr_lite。

1 EasyOCR

这个我没用就简单了解一下:

2chineseocr

github上训练好的模型做测试,项目里有提供训练数据的百度网盘下载,有资源的同学可以自己跑跑看。
通过搜集来的几个不同OCR测试数据集(github上有很多现成的,包括生成数据集、现实数据集等)随机选1000张图片来测试。


对比结果:


EasyOCR的测试速度较慢,lite的独特之处则在于它很轻快,不管是模型大小还是推理时需要的内存。因此可以把lite定义为一个轻量级中文OCR,支持竖排文字识别、NCNN推理,识别模型型仅17M(Psenet (8.5M) + crnn (6.3M) + anglenet (1.5M))可以看到,200张图片测试稳定在1-1.5G左右的内存。

3 Chineseocr_lite

Chineseocr_lite不支持pip,因此对于不熟悉github的同学,时间成本相对会高点,因为还要git clone和熟悉仓库的用法。其他的成本则主要集中在开发上。
对于有训练和开发需求的用户来说,采用开源版本的OCR框架,成本主要是环境搭建上,因为需要自己安装pytorch,web,GPU版本还需要安装正确版本的CUDA+cuDNN,这部分比较容易出BUG。众所周知debug很耗时间。


开源免费、不需要注册和认证流程、可扩展性强、识别率相对高;缺点则是对开发能力有一定要求,需要熟悉搭建环境和开发。这一点见仁见智吧。

PaddleOCR

这个还在学习,先看官方文档,首先要表扬一点,其他几个OCR工具都是默认用户知道OCR是什么以及具体的定义和应用,但是作为技术文档,应该有规范化、学术化的编写要求,连《同济线代》上来都会讲一下什么是行列式,前面几个ocr的文档等于直接教你怎么高斯消元,虽然学过线代的都能看懂,但观感上有点跳。建议其他厂商都学一下廖雪峰的文档结构,尽量把是什么先讲了,再说怎么做。相较之下,PaddleOCR的文档倒让我想起我以前看过的机器学习类教材,从OCR的定义、场景、数据集加载、模型loading、预测、部署到实例demo,完完全全按照正常用户的pipeline流程来写,非常简明扼要,没有一句多余的话。比商用OCR的事无巨细模板式教程和开源OCR的不明就里跳跃式文档教程好很多。此外我的主观感受是文本的排版和图片的选择都比较符合我的审美,不会有阅读障碍。






confidence卡0.99的情况下,可以看到PaddleOCR三个指标都赢的很明显。不过图片的类型、分布会影响指标,加上测试集文字单一、数据量小,因此只能说明在这个小数据集里PaddleOCR的效果最好,不具有广泛的参考意义。此外,就应用场景的泛化性能来看,语种识别上PaddleOCR目前包括中英文、英文、法语、德语、韩语、日语,要多于Chineseocr_lite,但明显少于EasyOCR,不过就常见的外语和特殊字符识别来说已经完全够用了。对于普通场景来说,比如身份证识别、票据识别,其实大多数算法的准确率都不错,但特殊场景更考验模型的泛化性能。相较而言PaddleOCR至少在检测能力上比其他几个开源工具要好,但识别能力仍有待提升。当然,这是数据和算法层面的瓶颈,学术界暂时也没有特别好的解决方法。既然之前用过chineseocr_lite,顺便也说说PaddleOCR的模型大小和推理性能。这块PaddleOCR的兄弟产品模型压缩套件PaddleSlim提供了强大的技术支持,为PaddleOCR超轻量化模型的提供依赖支撑。
整体的压缩流程就是集成模型剪枝、量化(包括量化训练和离线量化)、蒸馏和神经网络搜索等业界常用且领先的模型压缩功能。从超轻量模型8.1M直接压缩到3.5M,模型大小降低了56.79%,其中检测模型速度提升21%,而且整体模型精度还有一定提升。

未完,待续。。。。。。

OCR文字识别方法对比相关推荐

  1. OCR文字识别谁最好?4款拍照扫描应用横向对比

    虽然现在学习办公比较多用到电子文档内容,但有时难免需要用到实物,比如合同.书籍等等一些纸质的资料,目前人类还无法完全从纸质的世界脱身出来.所以也就诞生了连接纸质与电子文档之间的工具--OCR文字识别应 ...

  2. 有哪些提高OCR文字识别软件识别正确率的方法

    在OCR文字识别软件当中,ABBYY FineReader 是比较好用的程序之一,但再好的识别软件也不能保证100%的识别正确率,用户都喜欢软件的正确率高一些,以减轻识别后修正的负担,很多用户也都提过 ...

  3. 汉字进行计算机识别的原理,计算机OCR文字识别技术的原理和未来发展趋势

    杨俊叶++王训伟 摘要:文章首先对OCR技术的发展背景进行了介绍,指出了OCR文字识别系统在扫描仪.文字编辑等领域的应用及优势.通过对OCR技术工作原理的介绍,重点论述了OCR文字识别系统主要的图像处 ...

  4. OCR文字识别—基于CTC/Attention/ACE的三大解码算法

    本文全面梳理一下OCR文字识别三种解码算法,先介绍一下什么是OCR文字识别,然后介绍一下常用的特征提取方法CRNN,最后介绍3种常用的解码算法CTC/Attention/ACE. 什么是OCR文字识别 ...

  5. java ocr文字识别软件_Java文字识别软件-调用百度ocr实现文字识别

    java_baidu_ocr Java调用百度OCR文字识别API实现图片文字识别软件 这是一款小巧方便,强大的文字识别软件,由Java编写,配上了窗口界面 调用了百度ocr文字识别API 识别精度高 ...

  6. OCR文字识别笔记总结

    OCR的全称是Optical Character Recognition,光学字符识别技术.目前应用于各个领域方向,甚至这些应用就在我们的身边,比如身份证的识别,交通路牌的识别,车牌的自动识别等等.本 ...

  7. Java调用百度OCR文字识别API实现图片文字识别软件

    java_baidu_ocr Java调用百度OCR文字识别API实现图片文字识别软件 这是一款小巧方便,强大的文字识别软件,由Java编写,配上了窗口界面 调用了百度ocr文字识别API 识别精度高 ...

  8. 如何使用ocr文字识别软件

    由于现在的文件格式种类很多,软件开发人员也在不断的针对各类文件格式开发相应的软件.目前,像一些扫描格式图片和文件及pdf文件非常的普及,摘取上面的资料可能就要用到ocr识别工具了.那么,ocr文字识别 ...

  9. 人工智能OCR文字识别研究

    1 研究背景 人工智能是研究开发能够模拟.延伸和扩展人类智能的理论.方法.技术及应用系统的一门新的技术科学,研究目的是促使智能机器会听(语音识别.机器翻译等).会看(图像识别.文字识别等).会说(语音 ...

  10. 【深度学习】OCR文字识别—基于CTC/Attention/ACE的三大解码算法

    本文全面梳理一下OCR文字识别三种解码算法,先介绍一下什么是OCR文字识别,然后介绍一下常用的特征提取方法CRNN,最后介绍3种常用的解码算法CTC/Attention/ACE. 什么是OCR文字识别 ...

最新文章

  1. 【重发】终于提交了项目第一个版本到git@osc了。兴奋ing
  2. MYSQL性能管理及架构设计(一)
  3. 分析递归函数的时间复杂度
  4. 64位ubuntu 12.04下如何解决中文乱码的问题
  5. 动画-animation
  6. python用import xlwt出现红字_如何用python处理excel
  7. WindowsMobile应该如何发展?(未完待续)
  8. 电商产品页多种出彩表现设计手法!
  9. The example program of C on point
  10. 写python的笔记本_python笔记本:更改写入的fi
  11. 平面设计计算机基本配置,2017平面设计使用的电脑配置
  12. 铁路铁鞋UWB定位系统
  13. phrases practice_新视野大学英语第三版第二册Book 2 Unit 4 College sweethearts教案
  14. 天使轮、A轮、B轮、C轮、D轮融资 究竟是什么?
  15. 无人超市的核心不在于代替人,而是一款赚钱的互联网产品,是互联网伸向现实世界的
  16. 易基因|一文看懂:ChIP实验和qPCR定量分析怎么做
  17. 漫画分销系统服务器配置,漫画分销平台怎么选择?月流水30万的老手来说两句!...
  18. 以过来人经验---分享从学生--工程师之--怎么写好一份从事技术工作的简历及面试技巧(以嵌入式为例)(中)
  19. 安装 GVM 11 的 OS选择说明
  20. 三星回击苹果:将推指纹识别智能手机

热门文章

  1. 苹果手机如何分享wifi密码_WiFi密码破解器 v5.1.3手机版
  2. flink 时间语义、水位线(Watermark)、生成水位线、水位线的传递
  3. 你的短信接口真的安全吗?
  4. easyexcel怎么设置表头宽度_EasyExcel的不确定表头(根据数据生成表头)的excel导出和二级表头以及设置表头的宽度自适应...
  5. 计算机重装系统怎么链接打印机,如何连接打印机,详细教您电脑如何与打印机连接...
  6. 网件 无线打印机服务器,NETGEAR Genie让普通打印机实现Air print功能
  7. SolidWorks2020小金球
  8. mysql身份证号性别_mysql中身份证号判断男女人数
  9. LimeSDR外壳安装及基本测试
  10. 记录一下落地网关soul(shenyu)过程中的一些实践