Github:深度学习文本检测识别(OCR)精选资源汇总
点击我爱计算机视觉标星,更快获取CVML新技术
今天跟大家推荐一个Github项目,来自NAVER Clova AI Research的hwalsuklee同学汇总了近几年的基于深度学习进行文本检测、识别的论文、代码、数据集、教程资源,非常值得参考。
https://github.com/hwalsuklee/awesome-deep-text-detection-recognition
该项目不是简单的网址罗列,作者还很用心的将各个算法在公认标准测试集上的精度也一并列出,方便一目了然进行算法比较。
作者首先统计了深度学习OCR方向的文献:
可见这个方向基于深度学习的技术是大势所趋。
按研究方向,在这些论文中,尤以文本检测的数量最多,占比达48.9%,其次是文本识别21.7%,端到端文本识别占比14.1%。
文本检测汇总
在下图表格中,IC3代表该算法在ICDAR2013数据集上的精度,IC15代表该算法在ICDAR2015数据集上的精度,PRJ代表项目主页,CAFFE/TF等代表使用深度学习框架Caffe/TensorFlow等实现的代码。
从中我们可以看出,在ICDAR2013和ICDAR2015数据集上均为来自CVPR 2018的论文《FOTS: Fast Oriented Text Spotting with a Unified Network》取得了最高的精度,分别是0.925和0.8984,这是商汤科技的工作,代码已经开源。
下面是作者用论文发表时间和相应精度制作的散点图,可见该领域算法精度几乎是以45度角直线上升式发展。
文本识别汇总
文本识别的精度是在四个数据集上比较的,如下图。
在四个数据集上,综合表现最好的当属《ASTER: An Attentional Scene Text Recognizer with Flexible Rectification》,这篇文章发表于PAMI2018,来自华中科技大学白翔老师组,代码也开源了。
下面是来自两个数据集的散点图,同样识别技术也几乎以45度角直线式发展。
端到端文本识别
即包含文本检测与识别的全流程的算法。
综合看,来自商汤科技的FOTS和来自华科的Mask TextSpotter都很优秀。
值得注意的是Mask TextSpotter算法也已经开源了(https://github.com/lvpengyuan/masktextspotter.caffe2),此处没有列出。
52CV曾经专门解读过这篇论文:
华科白翔老师团队ECCV2018 OCR论文:Mask TextSpotter
下图为端到端文本识别的精度-发表时间散点图,相比之下,近两年的提升并不是很明显。
文本识别相关的其他方向
包括数据集、文本检索、字体变换、文档版面分析等。
作者还列出了该领域其他人做的资源总结和相关教程资源。
最后附上来自商汤科技的FOTS算法的Demo视频,看看它到底多强大。
再发一下地址:
https://github.com/hwalsuklee/awesome-deep-text-detection-recognition
希望对你有帮助~
加入专业讨论群
关注文本检测识别OCR技术,欢迎加入52CV-OCR专业讨论群,扫码添加CV君拉你入群:
(请务必注明:OCR)
喜欢在QQ交流的童鞋,可以加52CV官方QQ群:702781905。
(不会时时在线,如果没能及时通过验证还请见谅)
长按关注我爱计算机视觉
Github:深度学习文本检测识别(OCR)精选资源汇总相关推荐
- 【每周CV论文】深度学习文本检测与识别入门必读文章
欢迎来到<每周CV论文推荐>.在这个专栏里,还是本着有三AI一贯的原则,专注于让大家能够系统性完成学习,所以我们推荐的文章也必定是同一主题的. 文本检测和识别是计算机视觉的一个非常重要的应 ...
- keras faster物体检测_全网 | 深度学习目标检测算法(精选12篇)
太多的公众号每天的文章是否让你眼花缭乱?刷了好多文章,发现大都是转来转去?今天我在全网公众号里为大家精选主题为深度学习目标检测算法的文章12篇,其中包括综述,R-CNN,SPP-Net,Fast R- ...
- 大数据毕设项目 深度学习火焰检测识别 python opencv
文章目录 0 前言 1 基于YOLO的火焰检测与识别 2 课题背景 3 卷积神经网络 3.1 卷积层 3.2 池化层 3.3 激活函数: 3.4 全连接层 3.5 使用tensorflow中keras ...
- 商汤OCR文本检测+识别开源(FOTS),TF实现NBA记分牌识别
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx 常见的深度学习OCR过程中,会把文本检测与文本识别拆分成两个部分,通过先检测后识别的方法对图片 ...
- 【深度学习实践】基于深度学习的车牌识别(python,车牌检测+车牌识别)
车牌识别具有广泛的应用前景,基于传统方法的车牌识别效果一般比较差,随着计算机视觉技术的快速发展,深度学习的方法能够更好的完成车牌识别任务. 本文提供了车牌识别方案的部署链接,您可以在网页上体验该模型的 ...
- 基于深度学习的口罩识别与检测PyTorch实现
基于深度学习的口罩识别与检测PyTorch实现 1. 设计思路 1.1 两阶段检测器:先检测人脸,然后将人脸进行分类,戴口罩与不戴口罩. 1.2 一阶段检测器:直接训练口罩检测器,训练样本为人脸的标注 ...
- OCR技术系列之四】基于深度学习的文字识别(3755个汉字)(转)
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN ...
- 【OCR技术系列之四】基于深度学习的文字识别(3755个汉字)
上一篇提到文字数据集的合成,现在我们手头上已经得到了3755个汉字(一级字库)的印刷体图像数据集,我们可以利用它们进行接下来的3755个汉字的识别系统的搭建.用深度学习做文字识别,用的网络当然是CNN ...
- 基于Python的(拍照签到+网课在线检测)深度学习的人脸识别系统
摘 要 近年来,网络技术日新月异,我们已经进入了大数据的时代并成为其中第一员,由此带来数据量的飞跃式的增长,而如何利用这些数据产生实际的生产价值则成为了大数据时代的一个重要问题.而人脸识别技术是一份对 ...
最新文章
- 洛谷—— P1714 切蛋糕
- RHEL6基础之三RHEL官网获取ISO镜像
- Python逻辑运算符:if and
- 使用UTL_FILE在oracle中读写文本数据
- boost.asio基础篇 小白入门注解
- 通过Windows远程桌面连接将远程文件传输至本地
- 安装HDFS过程中Browse Directory报错
- download.js实现下载的基本用法
- TestBench基本写法与语法详解
- Proteus7.8 ISIS制图8个LED(针对初次使用者)
- python最小二乘法求a b_最小二乘法公式推导及Python实现
- 基于PostgreSQL+Geoserver+OpenLayers的Webgis台风路径地图服务发布
- 2048游戏回顾三:自定义Dialog和ProgressBar
- 腾讯云如何设置二级域名?
- WIFI能杀死植物吗?
- 如何获取QQ邮箱授权码?
- 计算机cs怎么使用技巧,CS里的fps设置方法(显卡篇)
- win10自带计算器闪退的解决办法
- 使用ESP8266构建一个简单的温湿度在线监测装置
- sdutacm- 数据结构实验之排序一:一趟快排
热门文章
- 线性代数【9】 - 特征值和特征向量
- android第三方推送实现,Android--利用第三方推送实现APP伪保活(小米篇)
- 51单片机c语言电子钟(已加入调时 '整点报时功能1),51单片机c语言电子钟(已加入调时、闹铃、整点报时功能1)万年历2...
- mysql递归自身连接_Mysql递归连接
- 计算机组成相关论文,计算机组成与结构课程论文.docx
- html lt p gt 标签的属性,科技常识:html中amp;lt;tableamp;gt;标签的各种属性介绍_table的使用...
- 山东鲁能轨道智能巡检机器人_城市轨道智能巡检机器人原来你这么酷炫!
- java怎么使用wcf_如何使用WCF服务
- zend studio mysql_Zend Studio的一些常用配置和使用帮助手册
- [leetcode]468. Validate IP Address验证有效IP地址