一款优秀的中文识别库——ocr
CnOCR 是 Python 3 下的文字识别(Optical Character Recognition,简称OCR)工具包,支持简体中文、繁体中文(部分模型)、英文和数字的常见字符识别,支持竖排文字的识别。自带了20+个训练好的识别模型,适用于不同应用场景,安装后即可直接使用。同时,CnOCR也提供简单的训练命令供使用者训练自己的模型。欢迎加入 交流群。
github地址:https://github.com/breezedeus/cnocr
安装简单
pip install cnocr
各种场景的调用示例
常见的图片识别
所有参数都使用默认值即可。如果发现效果不够好,多调整下各个参数看效果,最终往往能获得比较理想的精度。
from cnocr import CnOcrimg_fp = './docs/examples/huochepiao.jpeg'
ocr = CnOcr() # 所有参数都使用默认值
out = ocr.ocr(img_fp)print(out)
排版简单的印刷体截图图片识别
针对 排版简单的印刷体文字图片,如截图图片,扫描件图片等,可使用 det_model_name=‘naive_det’,相当于不使用文本检测模型,而使用简单的规则进行分行。
使用 det_model_name=‘naive_det’ 的最大优势是速度快,劣势是对图片比较挑剔。如何判断是否该使用此检测模型呢?最简单的方式就是拿应用图片试试效果,效果好就用,不好就不用。
from cnocr import CnOcrimg_fp = './docs/examples/multi-line_cn1.png'
ocr = CnOcr(det_model_name='naive_det')
out = ocr.ocr(img_fp)print(out)
识别结果:
更多详见:
https://cnocr.readthedocs.io/zh/latest/
具体的测试,以后再写,先做个记录。
一款优秀的中文识别库——ocr相关推荐
- 十多款优秀的Vue组件库介绍
十多款优秀的Vue组件库介绍 1. iView UI组件库 iView 是一套基于 Vue.js 的开源 UI 组件库,主要服务于 PC 界面的中后台产品.iView的组件还是比较齐全的,更新也很快, ...
- python ocr中文识别库 tesseract安装及问题处理
这个破东西,折腾了快1个小时,网上的教材太乱了. 我解决的主要是windows的问题 先下载exe.(一看到这个,我就有种预感,不妙) https://digi.bib.uni-mannheim.de ...
- 几款优秀的中文字体设计
中文字体设计发展到现在,风格越来越多样化,特别是在广告(美术)字体方面,因为字数少 局限小,优秀的作品层出不穷,比较突出的应用在标志设计唱片封套设计.包装设计上. 平常见的比较多的有象素体风格的跟流线 ...
- android自动识别文字,Android文字识别tesseract ocr -训练样本库 识别字库
目录 安装tesseract ocr引擎和jTessBoxEditor 安装jTessBoxEditor 开始制作box 准备好训练的图片 将图片转为tif格式的样本图片 合并样本图片 修改box文件 ...
- ABBYY FineReader 14 中文最新版含中文补丁【OCR文字识别软件】
ABBYY FineReader是一款十分好用的PDF编辑和转换工具. ABBYY FineReader14作为该系列的最新版本,新版在诸多方面进行了功能增强和优化,包含大量的 PDF 编辑工具.文档 ...
- 16款优秀的Vue UI组件库推荐
16款优秀的Vue UI组件库推荐 Vue 是一个轻巧.高性能.可组件化的MVVM库,API简洁明了,上手快.从Vue推出以来,得到众多Web开发者的认可. 在公司的Web前端项目开发中,多个项目采用 ...
- 17款优秀的Vue UI组件库汇总
17款优秀的Vue UI组件库推荐 Vue 是一个轻巧.高性能.可组件化的MVVM库,API简洁明了,上手快.从Vue推出以来,得到众多Web开发者的认可. 在公司的Web前端项目开发中,多个项目采用 ...
- android 秒拍开源,六月份21款优秀Android开源库整理推荐
原标题:六月份21款优秀Android开源库整理推荐 1.Android-DivergeView 仿美拍直播的点赞动画. 2.LRecyclerView RecyclerView下拉刷新,自动加载更多 ...
- deep_ocr 是使得 OCR 比 tesseract 更好的中文识别、身份证识别等等
deep ocr 估计很多开发员使用tesseract做中文识别,但是结果不是一般的差,譬如下面的图片 $ tesseract -l chi_sim test_data.png out_test_da ...
- 基于pytorch的OCR识别库
基于pytorch的OCR识别库 对一年来学习的算法做了一个整理,同时也方便使用(项目持续更新中) 识别库的地址: github地址 这里支持的算法包括: DBnet 论文链接 PSEnet 论文链接 ...
最新文章
- 2017年2月18日 K-means
- 我知道的一些 ”运行“ 窗体下的命令,个人使用
- 生成随机数放入整型数组怎么判断有没有重复_图的应用(1)-连通图的最小生成树(Prim算法和Kruskal算法)...
- 吐司面包的做法_无糖粗粮吐司面包的做法+配方,超柔超软,一次发酵
- Kubernetes(六) - Secret和私有仓库认证
- 如何删除Windows 7的保留分区
- html怎么改变一块区域颜色,更改HTML中所选区域的背景颜色/不透明度
- 【iCore1S 双核心板_ARM】例程三:EXTI中断输入实验——读取ARM按键状态
- 吉首大学 问题 L: 小李子的老年生活
- 使用 JSON JavaScriptSerializer 进行序列化或反序列化时出错。字符串的长度超过了为 maxJsonLength 属性设置的值。...
- 举例说明html语言的结构,第2章、HTML语言的基本结构.doc
- Linux—磁盘和文件系统管理(二)
- python 桌面应用 h5_hdf 5文件格式及python中利用h5py模块读写h5文件
- Vins-Mono 论文 Coding 一 7(3). pose_graph: 4DOF pose_graph
- 小巧时尚的机械键盘,通吃五台设备,雷柏MT510PRO键盘体验
- mysql中解决“SELECT command denied to user ‘nature‘@‘192.168.1.49‘ for table ‘user_variables_by_thread‘“
- 【历史上的今天】7 月 15 日:Mozilla 基金会正式成立;Enigma 密码机的首次工作;任天堂推出 FC 游戏机
- python精彩语句(来日方长,慢慢录入)
- svn update 出现skipped '.' 或skipped '目录名称'
- 伤寒杂病论.辨太阳病脉证并治(中)