CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。欢迎加入 交流群。
github地址:https://github.com/breezedeus/cnocr

安装简单

pip install cnocr

各种场景的调用示例
常见的图片识别
所有参数都使用默认值即可。如果发现效果不够好,多调整下各个参数看效果,最终往往能获得比较理想的精度。

from cnocr import CnOcrimg_fp = './docs/examples/huochepiao.jpeg'
ocr = CnOcr()  # 所有参数都使用默认值
out = ocr.ocr(img_fp)print(out)


排版简单的印刷体截图图片识别
针对 排版简单的印刷体文字图片,如截图图片,扫描件图片等,可使用 det_model_name=‘naive_det’,相当于不使用文本检测模型,而使用简单的规则进行分行。

使用 det_model_name=‘naive_det’ 的最大优势是速度快,劣势是对图片比较挑剔。如何判断是否该使用此检测模型呢?最简单的方式就是拿应用图片试试效果,效果好就用,不好就不用。

from cnocr import CnOcrimg_fp = './docs/examples/multi-line_cn1.png'
ocr = CnOcr(det_model_name='naive_det')
out = ocr.ocr(img_fp)print(out)

识别结果:

更多详见:
https://cnocr.readthedocs.io/zh/latest/

具体的测试,以后再写,先做个记录。

一款优秀的中文识别库——ocr相关推荐

  1. 十多款优秀的Vue组件库介绍

    十多款优秀的Vue组件库介绍 1. iView UI组件库 iView 是一套基于 Vue.js 的开源 UI 组件库,主要服务于 PC 界面的中后台产品.iView的组件还是比较齐全的,更新也很快, ...

  2. python ocr中文识别库 tesseract安装及问题处理

    这个破东西,折腾了快1个小时,网上的教材太乱了. 我解决的主要是windows的问题 先下载exe.(一看到这个,我就有种预感,不妙) https://digi.bib.uni-mannheim.de ...

  3. 几款优秀的中文字体设计

    中文字体设计发展到现在,风格越来越多样化,特别是在广告(美术)字体方面,因为字数少 局限小,优秀的作品层出不穷,比较突出的应用在标志设计唱片封套设计.包装设计上. 平常见的比较多的有象素体风格的跟流线 ...

  4. android自动识别文字,Android文字识别tesseract ocr -训练样本库 识别字库

    目录 安装tesseract ocr引擎和jTessBoxEditor 安装jTessBoxEditor 开始制作box 准备好训练的图片 将图片转为tif格式的样本图片 合并样本图片 修改box文件 ...

  5. ABBYY FineReader 14 中文最新版含中文补丁【OCR文字识别软件】

    ABBYY FineReader是一款十分好用的PDF编辑和转换工具. ABBYY FineReader14作为该系列的最新版本,新版在诸多方面进行了功能增强和优化,包含大量的 PDF 编辑工具.文档 ...

  6. 16款优秀的Vue UI组件库推荐

    16款优秀的Vue UI组件库推荐 Vue 是一个轻巧.高性能.可组件化的MVVM库,API简洁明了,上手快.从Vue推出以来,得到众多Web开发者的认可. 在公司的Web前端项目开发中,多个项目采用 ...

  7. 17款优秀的Vue UI组件库汇总

    17款优秀的Vue UI组件库推荐 Vue 是一个轻巧.高性能.可组件化的MVVM库,API简洁明了,上手快.从Vue推出以来,得到众多Web开发者的认可. 在公司的Web前端项目开发中,多个项目采用 ...

  8. android 秒拍开源,六月份21款优秀Android开源库整理推荐

    原标题:六月份21款优秀Android开源库整理推荐 1.Android-DivergeView 仿美拍直播的点赞动画. 2.LRecyclerView RecyclerView下拉刷新,自动加载更多 ...

  9. deep_ocr 是使得 OCR 比 tesseract 更好的中文识别、身份证识别等等

    deep ocr 估计很多开发员使用tesseract做中文识别,但是结果不是一般的差,譬如下面的图片 $ tesseract -l chi_sim test_data.png out_test_da ...

  10. 基于pytorch的OCR识别库

    基于pytorch的OCR识别库 对一年来学习的算法做了一个整理,同时也方便使用(项目持续更新中) 识别库的地址: github地址 这里支持的算法包括: DBnet 论文链接 PSEnet 论文链接 ...

最新文章

  1. 2017年2月18日 K-means
  2. 我知道的一些 ”运行“ 窗体下的命令,个人使用
  3. 生成随机数放入整型数组怎么判断有没有重复_图的应用(1)-连通图的最小生成树(Prim算法和Kruskal算法)...
  4. 吐司面包的做法_无糖粗粮吐司面包的做法+配方,超柔超软,一次发酵
  5. Kubernetes(六) - Secret和私有仓库认证
  6. 如何删除Windows 7的保留分区
  7. html怎么改变一块区域颜色,更改HTML中所选区域的背景颜色/不透明度
  8. 【iCore1S 双核心板_ARM】例程三:EXTI中断输入实验——读取ARM按键状态
  9. 吉首大学 问题 L: 小李子的老年生活
  10. 使用 JSON JavaScriptSerializer 进行序列化或反序列化时出错。字符串的长度超过了为 maxJsonLength 属性设置的值。...
  11. 举例说明html语言的结构,第2章、HTML语言的基本结构.doc
  12. Linux—磁盘和文件系统管理(二)
  13. python 桌面应用 h5_hdf 5文件格式及python中利用h5py模块读写h5文件
  14. Vins-Mono 论文 Coding 一 7(3). pose_graph: 4DOF pose_graph
  15. 小巧时尚的机械键盘,通吃五台设备,雷柏MT510PRO键盘体验
  16. mysql中解决“SELECT command denied to user ‘nature‘@‘192.168.1.49‘ for table ‘user_variables_by_thread‘“
  17. 【历史上的今天】7 月 15 日:Mozilla 基金会正式成立;Enigma 密码机的首次工作;任天堂推出 FC 游戏机
  18. python精彩语句(来日方长,慢慢录入)
  19. svn update 出现skipped '.' 或skipped '目录名称'
  20. 伤寒杂病论.辨太阳病脉证并治(中)

热门文章

  1. 测试职业思考:如何成为一名优秀的软件测试工程师
  2. NOI-Linux使用技巧
  3. 鸿蒙系统与苹果系统,华为的鸿蒙系统和苹果的操作系统,有什么区别?
  4. 怎样一次删除许多WPS word中的文本框(及其内容)?简单方法
  5. JS数字正则表达式验证(全全全!!!)
  6. mysql 正则表达式 包含中文_sql 查询字段是中文/英文/数字 正则表达式
  7. vue解决分页组件删除和添加内容-页码出现错误
  8. js实现传参的防抖函数
  9. 安装打印机提示未能添加服务器,打印机未能链接到服务器
  10. 仪器检定是为了满足什么需求?为什么不直接全部校准或检定呢?