本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别

master分支将保留一周,后续app分支将替换为master

实现功能

文字方向检测 0、90、180、270度检测(支持dnn/tensorflow)

支持(darknet/opencv dnn /keras)文字检测,支持darknet/keras训练

不定长OCR训练(英文、中英文) crnn\dense ocr 识别及训练 ,新增pytorch转keras模型代码(tools/pytorch_to_keras.py)

支持darknet 转keras, keras转darknet, pytorch 转keras模型

新增对身份证/火车票结构化数据识别

新增语音模型修正OCR识别结果

新增CNN+ctc模型,支持DNN模块调用OCR,单行图像平均时间为0.02秒以下

优化CPU调用,识别速度与GPU接近(近期更新)

环境部署

GPU部署 参考:setup.md

CPU部署 参考:setup-cpu.md

下载编译darknet(如果直接运用opencv dnn或者keras yolo3 可忽略darknet的编译)

git clone https://github.com/pjreddie/darknet.git

mv darknet chineseocr/

##编译对GPU、cudnn的支持 修改 Makefile

#GPU=1

#CUDNN=1

#OPENCV=0

#OPENMP=0

make

修改 darknet/python/darknet.py line 48

root = '/root/'##chineseocr所在目录

lib = CDLL(root+"chineseocr/darknet/libdarknet.so", RTLD_GLOBAL)

下载模型文件

模型文件地址:

复制文件夹中的所有文件到models目录

模型转换

pytorch ocr 转keras ocr

python tools/pytorch_to_keras.py -weights_path models/ocr-dense.pth -output_path models/ocr-dense-keras.h5

darknet 转keras

python tools/darknet_to_keras.py -cfg_path models/text.cfg -weights_path models/text.weights -output_path models/text.h5

keras 转darknet

python tools/keras_to_darknet.py -cfg_path models/text.cfg -weights_path models/text.h5 -output_path models/text.weights

编译语言模型

git clone --recursive https://github.com/parlance/ctcdecode.git

cdctcdecode

pip install .

下载语言模型

wget https://deepspeech.bj.bcebos.com/zh_lm/zh_giga.no_cna_cmn.prune01244.klm

mvzh_giga.no_cna_cmn.prune01244.klm chineseocr/models/

web服务启动

cdchineseocr## 进入chineseocr目录

ipython app.py 8080 ##8080端口号,可以设置任意端口

构建docker镜像

##下载Anaconda3 python 环境安装包(https://repo.anaconda.com/archive/Anaconda3-2019.03-Linux-x86_64.sh) 放置在chineseocr目录下

##建立镜像

docker build -t chineseocr .

##启动服务

docker run -d -p 8080:8080 chineseocr /root/anaconda3/bin/python app.py

识别结果展示

访问服务

参考

python自然场景文字识别_chineseocr相关推荐

  1. 基于深度学习的自然场景文字识别

    声明:本文来源,详细内容请参考原博文https://blog.csdn.net/xiaofei0801/article/details/72778223 1.1引言 传统光学字符识别主要面向高质量的文 ...

  2. python场景文字识别_chineseocr

    本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别 master分支将保留一周,后续app分支将替换为master 实现功能 文字方向检测 0.90.180.270度检测(支持dnn/t ...

  3. ICDAR 2019论文:自然场景文字定位技术详解

    自然场景文字定位是文字识别中非常重要的一部分.与通用的物体检测相比,文字定位更具挑战性,文字在长宽比.尺度和方向上有更大范围的变化.针对这些问题,本文介绍一种融合文字片段及金字塔网络的场景文字定位方法 ...

  4. CVPR 2020 | 旷视研究院探究优化场景文字识别的「词汇依赖」问题

    IEEE国际计算机视觉与模式识别会议 CVPR 2020 (IEEE Conference on Computer Vision and Pattern Recognition) 大会官方论文结果公布 ...

  5. keras优化算法_自然场景文本识别(OCR),keras-yolo3-densenet-ocr

    自然场景文本识别 我之前是做自然语言的,但公司有个ocr的项目必须要做,因此开始学习ocr相关知识,边学边做两个多月,还有很多不太明白的地方,只能大概讲一讲经验教训. 自然场景文本分类包括两个步骤,1 ...

  6. 识别中文_中文场景文字识别大赛官方baseline

    7月5日,由中国人工智能学会主办.百度深度学习平台飞桨(PaddlePaddle)承办的2019第二届中国"AI+"创新创业大赛-中文场景文字识别技术创新大赛启动.本届大赛围绕中文 ...

  7. 史上最全场景文字识别资源汇集(56篇重要论文 + 20 个开源代码 + 330 个实验结果 + 1882个统计信息)...

    点击上方"AI算法与图像处理",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:刘崇宇 转载自:CSIG文档图像分析与识别专委会 本 ...

  8. YunOS场景文字识别

    摘要: 该文章先介绍常见的文字识别方法,然后介绍YunOS在场景文字识别方面取得的进展.结果和技术方案.将重点讲解技术方案的两个主要部分:1)基于全卷积网络的从局部到整体的文字行检测方法:2)基于BL ...

  9. PaddleOCR实践之飞桨常规赛:中文场景文字识别

    简介 本项目是参加飞桨常规赛:中文场景文字识别(已结束)的项目,项目score为85.87141. 生成的预测文件为work/PaddleOCR中的test2.txt文件 项目任务为识别包含中文文字的 ...

最新文章

  1. JavaScript函数式编程学习
  2. layui中table监听单元格_最全总结 | 聊聊 Python 办公自动化之 PPT(中)
  3. 2020idea插件怎么同步_VScode 插件整理
  4. ThinkPHP6项目基操(3.控制器获取请求参数)
  5. 苹果面向Mac发布英特尔处理器漏洞缓解措施
  6. php 迭代和递归,实战PHP数据结构基础之递归
  7. kibana界面汉化
  8. python导入requests库_windows环境中python导入requests
  9. ENVI5.3.1使用Landsat 8影像进行预处理及分析实例操作
  10. 软件工程毕设(三)·进度考核表
  11. R语言使用RStudio将可视化结果保存为pdf文件(export--Save as PDF)
  12. 计算机英语 st,1st、2nd、3rd、…10th都是什么的缩写?怎么读?10th之...-1st-英语-司俜辰同学...
  13. word文档怎么批量解除锁定_word文档怎么解除锁定
  14. 某头条安卓逆向学习----改机/逆向/Hook/协议
  15. 计算机主板扩展槽,计算机内部所有插槽介绍,10分钟读懂电脑主板,高手必备!...
  16. quartz mysql 表_Quartz数据库表分析
  17. Android程序反破解技术
  18. win10多屏显示时分别设置壁纸
  19. ODU帧转OTU帧流程
  20. LumaFusion剪辑视频

热门文章

  1. php mysql数据备份命令_MySQL数据备份与恢复的相关操作命令
  2. 普通话/汉语发音口型大全
  3. python 正整数 连续多个数之和_vijos - P1302连续自然数和 (公式推导 + python)
  4. php页面 info,通过PATH_INFO方法实现页面伪静态_php
  5. python filter函数中写none_Python3基础 filter 第一个参数为NONE时 结果只返回为True的对象...
  6. python去重复功能_消除Python列表重复的几种方法,python,去,一些
  7. markdown 流程图_Markdown 进阶技能:用代码画流程图(编程零基础也适用)
  8. t分布 u分布 卡方分布_中心极限定理|z分布|t分布|卡方分布
  9. 浪潮as5300技术方案_浪潮智能存储AS5300G2双活解决方案
  10. PDH光端机的作用及其特点