基于YOLOv3 与CRNN的中文自然场景文字检测与识别
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
52CV君曾经分享过多篇关于文字检测与识别的文章:
华科白翔老师团队ECCV2018 OCR论文:Mask TextSpotter
华科新开源文本识别算法:ASTER与DeepLesion数据集百度云下载
开源OCR文字识别软件Calamari
OpenCV深度学习文本检测示例程序(EAST text detector)
AdvancedEAST高效场景文本检测(附Github地址)
ECCV18|这篇论文开源的车牌识别系统打败了目前最先进的商业软件(附Github地址)
(以上链接如果打不开,请进入“我爱计算机视觉”公众号查看本文原文)
基本都遵循“有价值有深度”的原则,希望它们能对大家真实的有帮助。
但以上文章及其对应的开源工程并没有专门针对中文自然场景文本检测与识别一整套解决方案的。检测是将文字从图像中定位出来,识别则是将其分类到特定字符。
对于那些在实际的工程项目中使用中文文字识别功能的朋友来说,则非常希望能有一套检测与识别功能均包含的开源库。
现在好了,Github上新出的OCR工程chineseocr就是这样的一套较好的整体解决方案。
该工程chineseocr使用今年新出的通用目标检测系统YOLOv3进行文本检测,使用华中科技大学白翔老师团队2015年的结合了CNN, RNN 与 CTC loss 的CRNN文本序列识别方案。请看chineseocr原作者给出的一些识别结果示例:
对于上面的印刷体文字的检测和识别还是很不错的!
对于想对文字识别尤其是中文识别有更深入了解和研究的朋友,我想紧跟前沿当然是非常好的,但系统的学习了解经典也是必不可少的,推荐你们购买清华大学丁晓青教授团队2017年出版的新书《文字识别:原理、方法和实践》。文字识别方向相关的书并不多,而这本书是该领域既全面又权威且最新的著作。
点击上面链接购买(如果不是在微信阅读本文,需要进入微信阅读本文才能看到链接及介绍),52CV君会获得一点佣金,也是对52CV君的一点小支持^_^,谢谢大家。
工程Github地址:
https://github.com/chineseocr/chineseocr
YOLOv3论文地址:
YOLOv3: An Incremental Improvement
https://arxiv.org/abs/1804.02767
CRNN论文地址:
An End-to-End Trainable Neural Network for Image-based Sequence Recognition and Its Application to Scene Text Recognition
https://arxiv.org/abs/1507.05717
(欢迎关注“我爱计算机视觉”公众号,一个有价值有深度的公众号~)
【本文由“我爱计算机视觉”发布,2018年09月15日】
基于YOLOv3 与CRNN的中文自然场景文字检测与识别相关推荐
- 在服务器上搭建基于yolo3 与crnn 实现中文自然场景文字检测及识别,GPU版本
Github地址 参考地址 作者大人,十分热心,对于我的问题,提供了大量的帮助,使我少走了很多的弯路,在此表示由衷的感谢 注意事项 使用nvidia-smi命令查看cuda的版本,必须是10.1或者1 ...
- 实现基于darknet框架实现CTPN版本自然场景文字检测 与CNN+CTCOCR文字识别的ChineseOCR搭建
Github地址 Github源码地址 支持系统:mac/ubuntu python=3.6 实现功能 文字检测: 文字识别: 支持GPU/CPU,CPU优化(opencv dnn) docker镜像 ...
- 论文翻译:自然场景文本检测与识别综述
论文翻译:自然场景文本检测与识别综述 引言 介绍 文章回顾 文本检测 文本识别 实验结果 总结和未来工作展望 引言 自然图片的检测和识别是计算机视觉领域的两个主要的问题,在运动视频分析,自动驾驶,工业 ...
- SSD: Signle Shot Detector 用于自然场景文字检测
前言 之前我在 论文阅读:SSD: Single Shot MultiBox Detector 中,讲了这个最新的 Object Detection 算法. 既然 SSD 是用来检测物体的,那么可不可 ...
- 基于深度学习的自然场景文字检测及端到端的OCR中文文字识别
向AI转型的程序员都关注了这个号
- 中文OCR场景文字检测工具cnstd、文本框文字识别工具cnocr调试评测
这款很好用的工具项目地址为:https://github.com/breezedeus/cnstd 目前基于PyTorch开发 首先需要安装相关依赖: pip install cnstdpip ins ...
- 自然场景文字检测方案总结
文章目录 1. 方案一 1.1 方案解析 1.1.1 比赛模型重要参数与信息 1.1.2 方法创新一 1.1.3 方法创新二 1.1.4 方法创新三 1.1.5 后处理技巧--剔除检测结果中极小的目标 ...
- python自然场景文字识别_chineseocr
本项目基于yolo3 与crnn 实现中文自然场景文字检测及识别 master分支将保留一周,后续app分支将替换为master 实现功能 文字方向检测 0.90.180.270度检测(支持dnn/t ...
- 基于深度学习的场景文本检测和识别(Scene Text Detection and Recognition)综述
1. 引言 文字是人类最重要的创作之一,它使人们在时空上可以有效地.可靠的传播或获取信息. 场景中的文字的检测和识别对我们理解世界很有帮助,它应用在图像搜索.即时翻译.机器人导航.工业自动化等领域. ...
最新文章
- 用CMD命令实现一个简单的网页搜索
- proe3.0安装教程
- Python面向对象(二)
- UI Component in CRM WebUI and Hybris
- dropload.js无限刷新解决方案
- unitec理工学院 计算机,2020年新西兰留学Unitec理工学院计算机硕士课程全面解析...
- 如何使用PHP中的字符串函数
- PAT1018. 锤子剪刀布
- Atitit.收银机小票打印功能的设计 java php c#.net版本
- 【数字信号】基于matlab GUI DTMF双音多频手机拨号仿真系统【含Matlab源码 1085期】
- java 基础 ppt_《Java基础入门》PPT_传智播客.rar
- xp系统计算机描述无法输入,电脑xp系统的输入法怎么设置
- 方正字体库大全(129款) 官方免费版​
- 网易云音乐歌词python
- js监听鼠标的滚轮滚动事件
- 二维码扫描枪对接手册
- java 动态切换数据源_Java动态切换数据源(AOP)
- 什么是PWM 和PFM?
- 第一次书写标书和述标经历
- 完美世界GameJam参加报告——《解字》游戏的设计与开发
热门文章
- jQuery验证表单插件——jquery-validation
- Vmware 连接局域网通过桥接方式
- php调用谷歌翻译,PHP调用谷歌翻译 | 学步园
- 数组翻转_LeetCode刷题实战151:翻转字符串里的单词
- opengl双三次bezier曲面_试驾艾瑞泽5 PLUS:双外观设计,搭L2级全速域驾驶辅助,月销要破万?...
- thaiphoon burner 使用_果粉请注意,苹果iPhone 12在日常使用时有两大隐忧
- linux系统5.5安装教程,图解安装Debian 9.5全过程
- android 网络编程面试题,Android面试题整理
- java kiwi_[转] Java 8 开发的 4 大顶级技巧
- python接口编程_Python 中的面向接口编程