近日,百度飞桨正式开源了业界最小的超轻量8.6M中英文识别OCR模型套件PaddleOCR,在模型大小、精度和预测速度上,甚至超过了之前一度登上GitHub热榜的chineseocr_lite(5.1k stars),简单场景下OCR效果更是能媲美收费软件。

除了性能优越之外,百度PaddleOCR还是第一个完整支持从训练到部署完整流程的OCR模型套件,而且部署方式多样,覆盖手机端(含IOS、Android Demo)、嵌入式端,大规模数据离线预测,在线服务化预测等。通过多种预测工具组件的支持,百度PaddleOCR能够满足多样化的工业级应用场景。同时其支持自定义训练,用户可以使用自己的数据集Fine-tune以达到更好的效果,大大提高了程序员们训练部署OCR模型和项目落地的效率,最大程度上满足了企业的不同需求。

随着百度PaddleOCR的开源,其在促进OCR行业发展的同时,也正在赋能企业,推动产业智能化发展。

近年来,随着技术的发展,文字识别(OCR)已经被广泛的运用至各个场景之中,包括自然场景中文字识别、车牌识别、票据识别等等,是机器服务人类的重要场景之一。

然而目前OCR发展面临着诸多难题,一方面,由于自然环境复杂多样,机器识别面临着尺度、光照不足、拍摄模糊等问题,加大了识别的难度。另外一方面,OCR应用常对接海量数据,要求数据能够得到实时处理。除此之外,由于OCR应用常常部署在移动端或嵌入式硬件,但端侧的存储空间和计算能力有限,因此对OCR模型的大小和预测速度有很高的要求。

而此次百度开源的8.6M超轻量中文OCR模型,包含1个检测模型(4.1M)与1个识别模型(4.5M),是目前业界开源的最小OCR模型。相比于市面上其它的OCR模型,PaddleOCR取得了显著的进展,这使得其能够更为便捷的部署在移动端、嵌入式端等多个场景,更加方便用户使用。

除此之外,百度PaddleOCR也能够快速准确地识别各个场景中的文字,无惧尺度、光照等难题。同时,其还支持中英文识别以及倾斜、竖排等多种方向文字识别,为用户呈现出最佳结果。

来看看下面这些:

由上图可见,这款 OCR 模型的图像文本识别精准度效果破佳,基本可做到从嘈杂环境中快速提取核心信息。

看到这里,你可能会其技术层面的实现感到好奇。别担心,我们准备了一些问答小卡片,为你揭晓其中的技术原理:

除以上精选问题,百度还汇聚了 OCR 开发者常问问题 100 问,都是真实实践的 OCR 精品 “药方”,现在访问 PaddleOCR 项目地址就可以统统收入囊中了!(点击 “阅读原文” 即可访问)

https://github.com/PaddlePaddle/PaddleOCR/blob/develop/doc/doc_ch/FAQ.md

如果你 OCR 技术感兴趣,可以扫码下方二维码,加入百度的 OCR 技术群,他们将于 9 月 26 日开设最新技术课程,邀请开发者一起深入探索这项技术未来的应用方向及市场前景:

在遇到 PaddleOCR GitHub 项目的应用问题时,也可以移步到 ISSUE 提问,有丰富经验的飞桨资深工程师帮你解决。

PaddleOCR 项目地址

https://github.com/PaddlePaddle/PaddleOCR

飞桨官网地址

https://www.paddlepaddle.org.cn/

飞桨开源框架项目地址

GitHub:

https://github.com/PaddlePaddle/Paddle

最后

看完点个赞,分享一下吧,让更多的朋友能够看到。如果你喜欢前端开发博客的分享,就给公号标个星吧,这样就不会错过我的文章了。

好文和朋友一起看~

Github热榜:中英文识别OCR模型,百度开源媲美收费软件!相关推荐

  1. 男神青涩时纤毫毕现!腾讯AI模型GFPGAN火上GitHub热榜第一,Demo在线可玩

    包浆老图立刻清晰到头发丝是一种怎样的体验? 看这明亮的眼眸.清晰的发丝,原本模糊的人像立刻添了几分灵动: (这就是用AI修复的高圆圆童年照) 时间更久远的历史名人照片也能搞定. 鲁迅先生年轻时意气风发 ...

  2. 女神青涩时纤毫毕现!腾讯AI模型GFPGAN火上GitHub热榜第一,Demo在线可玩

    明敏 发自 凹非寺 量子位 报道 | 公众号 QbitAI 包浆老图立刻清晰到头发丝是一种怎样的体验? 看这明亮的眼眸.清晰的发丝,原本模糊的人像立刻添了几分灵动: (这就是用AI修复的高圆圆童年照) ...

  3. 女神青涩时纤毫毕现,腾讯 AI 模型 GFPGAN 火上 GitHub 热榜第一,Demo 在线可玩

    来源:量子位 作者:明敏 包浆老图立刻清晰到头发丝是一种怎样的体验?看这明亮的眼眸.清晰的发丝,原本模糊的人像立刻添了几分灵动(这就是用 AI 修复的高圆圆童年照). 甚至时间更久远的历史名人照片也能 ...

  4. 谷歌ALBERT模型V2+中文版来了:之前刷新NLP各大基准,现在GitHub热榜第二

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 作者:十三.发自.凹非寺 转自:量子位(QbitAI),未经允许不得二次转载 比BER ...

  5. 这张「二维码」火到了GitHub热榜第一:扫一扫,打破系统边界,文件秒传

    十三 发自 凹非寺 量子位 报道 | 公众号 QbitAI 这张「二维码」,今天火到了GitHub热榜第一. 为什么这么火? 只要扫描这张二维码,通过Wi-Fi,文件就可以在电脑和手机之间互传--文件 ...

  6. Apollo 5.0,GitHub热榜第四

    雷刚 发自 凹非寺  量子位 报道 | 公众号 QbitAI Apollo 5.0有多火? 看GitHub最新热榜就行了,在全球最大的开发者社区,目前迭代新版本的Apollo,已经冲至第4. 目前总获 ...

  7. 滴滴开源AI项目登上GitHub热榜,人机对话模型可从论文到产品部署无缝衔接

    乾明 发自 凹非寺  量子位 报道 | 公众号 QbitAI 没想到,滴滴开源的自然语言理解(人机对话)模型训练平台,就这样登上了GitHub热榜. 这一项目名为DELTA,是一个深度学习模型训练框架 ...

  8. GitHub 热榜:中国博士开发可交互全球疫情地图,登上柳叶刀!

    点击上方"视学算法",选择"星标"公众号 重磅干货,第一时间送达 转自量子位,作者郭一璞 一个多月前,当你被困在家里无法出门的时候,可能每天早上第一件事就是看看 ...

  9. GitHub热榜,零基础学C++教程

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 贾浩楠 发自 凹非寺 量子位 报道 | 公众号 QbitAI 零基 ...

最新文章

  1. 死锁产生条件-请求和保持条件
  2. 多进程对 MySQL update的影响
  3. FCKeditor 在ASP.Net 中的使用说明
  4. Android自定义XML属性以及遇到的命名空间的问题
  5. FreeRTOS系列第1篇---为什么选择FreeRTOS?
  6. Python 全局变量
  7. RegExp类型exec()方法的返回值说明
  8. matlab 判断元素索引_MATLAB图像处理:08:在交通视频中检测汽车
  9. 【微信小程序】——wxss引用外部CSS文件及iconfont
  10. 解题报告 poj 1087
  11. php导出 excel
  12. html如何改变日期样式,html如何修改日期样式
  13. 修改firefox的ssh插件的xpi包,hook自已功能
  14. python热身教程_[转载]技术教程-MayaPython教程二之Python
  15. cmos逻辑门传输延迟时间_MOS管设计知识:传输管TG的原理及组合逻辑延时分析
  16. Excel数据导出到txt文档
  17. Android 推流--分辨率、帧率和码率三者之间的关系
  18. OA协同办公系统对企业有什么作用?
  19. 怎么购买苹果教育优惠产品?苹果在线商店购买教育优惠产品的具体流程
  20. 谨慎使用多线程中的fork

热门文章

  1. Could not find acceptable representation(已解决)
  2. Gazebo機器人仿真學習探索筆記(一)安裝與使用
  3. 图像特征提取(VGG和Resnet特征提取卷积过程详解)
  4. c语言putchar与getchar,C语言中的getchar和putchar详解
  5. 用HTML+CSS做一个漂亮简单的个人网页——动漫网页【火影忍者】1个页面
  6. 【广州市青年科技工作者协会主办 | 青年论坛 | 往届均已见刊检索 | 稳定EI 】
  7. 堆和优先级队列3:不泡妹子都要会的LeetCode7道题之一
  8. 【BZOJ4919】【Lydsy1706月赛】大根堆(启发式合并,DSU on tree)
  9. Unity用于储存数据的几种方式
  10. MXDP 力量的崛起