整理 | AI科技大本营

光学字符识别(OCR)技术已经得到了广泛应用。比如发票上用来识别关键字样,搜题App用来识别书本上的试题。

近期,这个叫做chineseocr_lite的OCR项目开源了,这是一个超轻量级中文ocr,支持竖排文字识别,支持 ncnn 推理,psenet (8.5M) + crnn (6.3M) + anglenet (1.5M) 总模型仅17M。

目前,这个开源项目已在GitHub上标星2400+。

这个项目基于chineseocr与psenet实现中文自然场景文字检测及识别,环境是linux/macos。

以下为可实现的功能:

  • 提供轻量的 backone 检测模型 psenet(8.5M),crnn_lstm_lite (9.5M) 和行文本方向分类网络(1.5M)

  • 任意方向文字检测,识别时判断行文本方向

  • crnn\crnn_lite lstm\dense识别(ocr-dense和ocr-lstm是搬运chineseocr 的)

  • 支持竖排文本识别

  • ncnn实现psenet(未实现核扩展)

  • ncnn实现crnn_dense(改变了全连接为conv1x1)

  • ncnn实现shuuflenev2角度分类网络

  • ncnn实现ocr整个流程

最近,项目作者对更新了可实现的功能。

  • nihui大佬实现的crnn_lstm推理

  • 升级crnn_lite_lstm_dw.pth模型crnn_lite_lstm_dw_v2.pth , 精度更高

  • 提供竖排文字样例以及字体库(旋转90度的字体)

字体样式

生成的竖排文本样例

识别效果展示:

ncnn检测识别展示(x86 cpu 单进程)

项目地址:https://github.com/ouyanghuiyu/chineseocr_lite

【end】

原力计划

《原力计划【第二季】- 学习力挑战》正式开始!即日起至 3月21日,千万流量支持原创作者!更有专属【勋章】等你来挑战

推荐阅读

  • 想成为一个数据科学家却不知道从何下手?这份路线图带你打开数据科学大门!

  • MySQL 狠甩 Oracle 稳居 Top1,私有云最受重用,大数据人才匮乏!| 中国大数据应用年度报告

  • 不用掉一根头发!用 Flutter + Dart 快速构建一款绝美移动 App

  • 一文了解 Spring Boot 服务监控,健康检查,线程信息,JVM堆信息,指标收集,运行情况监控!

  • 和黑客斗争的 6 天!

  • 用 3 个“鸽子”,告诉你闪电网络是怎样改变加密消息传递方式的!

  • 你点的每个“在看”,我都认真当成了AI

超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M相关推荐

  1. 超轻量级中文ocr,OcrLiteOnnx文字识别

    原项目地址:https://github.com/benjaminwan/OcrLiteOnnx 本文是基于原项目编译好后的OcrLiteOnnx文字识别系统,可以实现提取图片中的文字及文字中心点坐标 ...

  2. Github标星3K+,超轻量级中文OCR,支持竖排文字识别、ncnn推理,总模型仅17M

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 光学字符识别(OCR)技术已经得到了广泛应用.比如发票上用来识别关键字样,搜题Ap ...

  3. 搭建基于飞桨的OCR工具库,总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别、竖排文本识别、长文本识别的PaddleOCR

    介绍 基于飞桨的OCR工具库,包含总模型仅8.6M的超轻量级中文OCR,单模型支持中英文数字组合识别.竖排文本识别.长文本识别.同时支持多种文本检测.文本识别的训练算法. 相关链接 PaddleOCR ...

  4. css表格文字超数量就竖排_绝了,超轻量级中文 OCR,你值得拥有

    大家好,我是章鱼猫.今天给大家分享的开源项目是一个今后大数据时代以及图像识别时代非常常用的一个技术. 随着人工智能的发展,图像识别越来越常用,所以,今天推荐的开源项目就是:OCR 相关的. 这个开源项 ...

  5. GitHub 热榜:文字识别神器,超轻量级中文 OCR!

    点击上方蓝色"程序猿DD",选择"设为星标" 回复"资源"获取独家整理的学习资料! 整理 | AI 科技大本营 光学字符识别(OCR)技术已 ...

  6. GitHub开源:17M超轻量级中文OCR模型、支持NCNN推理

    目录 1.项目简介 2.项目配置 3.问题解决 1.项目简介 近期GitHub上一位大神开源了一个叫做chineseocr_lite的OCR的项目,这是一个超轻量级中文OCR,支持竖排文字识别.NCN ...

  7. 周获 4700 Star 全球疫情数据可视化系统,超轻量级中文 OCR……GitHub 一周热点速览...

    作者 | HelloGitHub-小鱼干 来源 | HelloGitHub 摘要:连着两周成绩平平的 GitHub Trending 榜,终于和三月的天气一样进入全面变暖的模式,无论是本周刚开源搭乘 ...

  8. 牛逼,超轻量级中文 OCR,你值得拥有

    [公众号回复 "1024",免费领取程序员赚钱实操经验] 大家好,我是章鱼猫.今天给大家分享的开源项目是一个今后大数据时代以及图像识别时代非常常用的一个技术. 随着人工智能的发展, ...

  9. 超轻量级中文 OCR,你值得拥有!

    小伙伴们,大家好,今天给大家分享的开源项目是一个超轻量级中文 OCR. 随着人工智能的发展,图像识别越来越常用,生活中应用场景比如:发票,火车票,验证码识别,搜题 App 用来识别书本上的试题等等更多 ...

最新文章

  1. 虚拟电脑键盘app_说到弹吉他,这几个APP你一定用得上
  2. 双系统grub启动linux,双系统ubuntu与Centos的grub启动(解决VFS报错)
  3. 转载: Vim 练级攻略
  4. BOM事件对象even
  5. 口令加密算法 - Java加密与安全
  6. ArcGISServer10安装与地图发布
  7. zookeeper 应用开发
  8. Linux虚拟化KVM-Qemu分析(七)之timer虚拟化
  9. python莫比乌斯内接矩形_莫比乌斯反演例题集 ^_^(示例代码)
  10. 余弦函数导数推导过程_反三角函数的导数的推导过程
  11. jquery 图像滑块_jQuery缩略图图像滑块– CSS,JavaScript
  12. mybatis3的中文官方文档
  13. CSS3 文字边框 -webkit-text-stroke
  14. Incorrect argument type to variable ‘max_allowed_packet‘解决方法
  15. 算法题--字符串排列组合、n皇后、字符出现次数(C++)
  16. 【第二届PHP全球开发者大会】惠新宸(鸟哥):PHP7性能之源
  17. HoloLens2通过Wifi部署应用到HoloLens2设备上
  18. Qiyuan-接小球游戏3.0
  19. vim下载安装 配置方法(图)
  20. 01-Intellij IDEA搭建SSM(SpringMVC+Spring+Mybatis+Maven)框架(下)

热门文章

  1. Linux下显示硬盘空间的两个命令
  2. Complex Instance Placement
  3. 动态表单构建器——建造者模式
  4. 来玩Play框架07 静态文件
  5. Linux系统基础-管理之用户、权限管理
  6. poj3468 A Simple Problem with Integers
  7. 【系列索引】结合项目实例 回顾传统设计模式 打造属于自己的模式类系列
  8. IT人请注意你的身体![转]
  9. 专业研究HP procurve网络、阿姆瑞特和系统集成的论坛
  10. python中not 和 is None的区别