Calamari是一种新的开源OCR识别软件,它使用了最先进的Tensorflow实现的深度神经网络(DNN)。 提供了预训练模型和多模型投票技术。由卷积神经网络(CNNS)和长短时记忆(LSTM)层构成的可定制网络架构通过Graves等人的连接时间分类(CTC)算法进行训练。而GPU的使用大大减少了训练和预测的计算时间。我们使用两个不同的数据集来比较Calamari与OCRopy,OCRopus3和Tesseract 4的性能.Calamari在用现代英语写的UW3数据集上达到0.11%的字符错误率(CER),在用德语写的DTA19数据集上达到0.18% 错误率,其性能远远优于以上现有开源软件的结果。
使用了目前OCR最先进的的技术,CNN+LSTM+CTC+voting。
calamari OCR引擎,使用Python3编写,基于OCRopy和Kraken构建,它的设计使你既可以方便的使用命令行运行,也可以把它模块化嵌入到其他python脚本中。

在UW3和DTA19上的识别结果错误率,与OCRopy、Tesseract4、OCropus3相比较:

与其他软件相比的识别速度,有GPU加持当然很快:

值得注意的事,该库主要是用来识别印刷体古籍文字,在自然场景图像上的识别并没有实验说明。

文中识别所用的数据库图片示例:


ps.单词“calamari”的意思是鱿鱼。

欢迎访问我爱计算机视觉(www.52cv.net),获取更多计算机视觉与机器学习技术干货。

开源OCR文字识别软件Calamari相关推荐

  1. calamari怎么使用mysql_开源OCR文字识别软件Calamari

    Calamari是一种新的开源OCR识别软件,它使用了最先进的Tensorflow实现的深度神经网络(DNN). 提供了预训练模型和多模型投票技术.由卷积神经网络(CNNS)和长短时记忆(LSTM)层 ...

  2. 完全免费的OCR文字识别软件

    今天我要分享给大家的是两款完全免费的OCR文字识别软件,而且这两款软件都是本地版无需联网就能使用,而且没有使用次数的限制. 软件准备好了: 链接: 百度网盘 请输入提取码 提取码: 6666 01软件 ...

  3. OCR文字识别软件的快速任务功能如何用

    2019独角兽企业重金招聘Python工程师标准>>> 在使用ABBYY FineReader Pro for Mac OCR文字识别软件处理文档时,经常会执行一系列相同的步骤,如扫 ...

  4. 对OCR文字识别软件进行自动分析和识别设置的教程

    2019独角兽企业重金招聘Python工程师标准>>> ABBYY FineReader 12这款OCR文字识别软件具有着强大的自主功能,在默认情况下,会自动分析并识别 FineRe ...

  5. 建标库标准怎么导出pdf_保存和导出PDF文档,这款OCR文字识别软件能做到

    ABBYY FineReader 作为一款强大的OCR文字识别软件,如果能运用到大家的办公中,将能帮助大家将各种格式的PDF文档保存为新的PDF文档.PDF/A格式文档,以及Microsoft Wor ...

  6. 手机必备OCR文字识别软件:福昕扫描王使用攻略

    如果要把一本书上的文字复制下来,需要对着书一个一个字打,但是如果通过OCR文字识别软件, 我们就可以通过拍照快速的将这些文字从书本上复制出来. 如果要制作扫描件,不需要到处找扫描仪,直接手机拍照通过扫 ...

  7. OCR识别缺点_常用的OCR文字识别软件有哪些_软件动态论坛

    随着大家办公需求的增加,办公软件如雨后春笋般纷纷面世,旨在提高大家的工作效率,OCR文字识别软件便是不可缺少的办公软件之一.那么,有哪些专业又好用的OCR文字识别软件呢?小编来为大家推荐几款,以供参考 ...

  8. ocr文字识别软件:Readiris Corporate 17 Mac中文版

    ocr文字识别软件哪个好?与大家分享Readiris Corporate 17 for Mac,功能非常之强大,支持将扫描件.图片.PDF识别为文字,readiris 17 for mac版提供了中文 ...

  9. 迅捷OCR文字识别软件的功能介绍

    办公软件的出现,确实为我们的工作带来了很多的便利,那么今天小编就来为大家分享一款办公神器,迅捷OCR文字识别软件. OCR技术是现在很盛行的一种应用技术,在很多软件中都有所应用,而迅捷OCR文字识别软 ...

最新文章

  1. v-show 与 v-if 的区别
  2. python +keras实现图像分类(入门级例子讲解)
  3. Eureka的高可用
  4. 操作方法:Spring Boot和Thymeleaf与Maven
  5. 前端学习(688):断点调试
  6. 下载matlab安装包太慢_Matlab2017a软件安装包以及安装教程
  7. 希望这些建议对你有帮助
  8. 操作系统之内存管理:3、基本分页存储管理
  9. 理解Linux下的SELinux(MAC)
  10. springboot整合redis,推荐整合和使用案例(2021版)
  11. iOS 浅谈:深.浅拷贝与copy.strong
  12. git拉取远程分支到本地分支或者创建本地新分支
  13. 【java毕业设计】基于javaEE+原生Servlet+MySql的酒店管理系统设计与实现(毕业论文+程序源码)——酒店管理系统
  14. pdfobject.js和pdf.js的详解
  15. c#将byte转为int_C# int转byte[],byte[]转int
  16. 【转】J2SDK1.5+TOMCAT5.5 最详细有效安装及配置
  17. 使用metasploit制作钓鱼网站——browser autopwn攻击
  18. VS编程,WPF中响应键盘事件、检测键盘键是否按下的一种方法
  19. python3 aes cbc模式解密_python3 AES 加解密
  20. ESP32 使用 RTC_GPIO 唤醒 Deep-Sleep 模式

热门文章

  1. vux以插件方式调用
  2. c++闭区间内的素数
  3. JAVA 实现图片原比例无损压缩
  4. 手机变php,poscms手机网站切换
  5. hive 安装mysql报错_hive的元数据存储在mysql后,报错的解决方法
  6. VMware16 安装Mac 10.14系统/苹果系统
  7. 用真实业务场景告诉你,高并发下如何设计数据库架构?
  8. 为什么弃用lofter
  9. python中年大叔学编程_中年大叔学编程-我用Python保存金山词霸每日一句
  10. 使用OpenCV和Python进行人脸识别