文本检测算法性能对比
文本检测算法性能对比
- 1. 任意四边形文本数据集
- 1.1 ICDAR15[^1]
- 2. 曲形文本数据集
- 2.1 CTW1500[^10]
- 2.2 Total-Text[^11]
本文会一直更新经典的、最新的或性能最好的文本检测算法
1. 任意四边形文本数据集
1.1 ICDAR151
该数据集包含1000张图片,其中训练集500张,测试集500张,这些图片从谷歌街景中搜集。目标是多个方向,标注为word级别的,四个点的坐标。
算法 | 发表时间 | 算法类型 | P | R | F |
---|---|---|---|---|---|
CTPN2 | ECCV-2016 | Regression | 0.74 | 0.52 | 0.61 |
IncepText3 | IJCAI-2018 | Segmentation | 0.938 | 0.873 | 0.905 |
PSENet4 | CVPR-2019 | Segmentation | 0.8692 | 0.845 | 0.8569 |
CRAFT5 | CVPR-2019 | Segmentation | 0.898 | 0.843 | 0.869 |
CRAFTS6 | ECCV-2020 | Segmentation | 0.853 | 0.890 | 0.871 |
EAST7 | CVPR-2017 | Hybrid | 0.833 | 0.783 | 0.807 |
DB8 | AAAI-2020 | Hybrid | 0.918 | 0.832 | 0.873 |
ContourNet9 | CVPR2020 | Hybrid | 0.94 | 0.901 | 0.87 |
DRRG10 | CVPR2020 | GCN | 0.8853 | 0.8469 | 0.8656 |
TextFuseNet11 | IJCAI-PRICAI-20 | Hybrid | 0.940 | 0.906 | 0.922 |
SDM12 | ECCV-2020 | Segmentation | 0.9196 | 0.8922 | 0.9057 |
2. 曲形文本数据集
2.1 CTW150013
该数据集是曲形文本检测集,包含1000张训练集和500张测试集,文本使用14个边界点标注,行标注级别。
算法 | 发表时间 | 算法类型 | P | R | F |
---|---|---|---|---|---|
PSENet4 | CVPR-2019 | Segmentation | 0.848 | 0.797 | 0.822 |
CRAFT5 | CVPR-2019 | Segmentation | 0.86 | 0.811 | 0.835 |
DB8 | AAAI-2020 | Hybrid | 0.869 | 0.802 | 0.834 |
ContourNet9 | CVPR2020 | Hybrid | 0.857 | 0.84 | 0.848 |
DRRG10 | CVPR2020 | GCN | 0.8593 | 0.8302 | 0.8445 |
TextFuseNet11 | IJCAI-PRICAI-20 | Hybrid | 0.897 | 0.851 | 0.874 |
SDM12 | ECCV-2020 | Segmentation | 0.8840 | 0.8442 | 0.8636 |
2.2 Total-Text14
与CTW1500不同的是,标注是word级别的,该数据集包含水平方向、多方向和曲形文本,共1225张训练集和300张测试集图片。
算法 | 发表时间 | 算法类型 | P | R | F |
---|---|---|---|---|---|
PSENet4 | CVPR-2019 | Segmentation | 0.84 | 0.779 | 0.809 |
CRAFT5 | CVPR-2019 | Segmentation | 0.876 | 0.799 | 0.836 |
CRAFTS6 | ECCV-2020 | Segmentation | 0.854 | 0.895 | 0.874 |
DB8 | AAAI-2020 | Hybrid | 0.871 | 0.825 | 0.847 |
ContourNet9 | CVPR2020 | Hybrid | 0.869 | 0.839 | 0.854 |
DRRG10 | CVPR2020 | GCN | 0.8654 | 0.8493 | 0.8573 |
TextFuseNet11 | IJCAI-PRICAI-20 | Hybrid | 0.892 | 0.858 | 0.875 |
SDM12 | ECCV-2020 | Segmentation | 0.9085 | 0.8603 | 0.8837 |
ICDAR2015[70]:D. Karatzas, L. Gomez-Bigorda, A. Nicolaou, S. K. Ghosh, A. D.Bagdanov, M. Iwamura, J. Matas, L. Neumann, V. R. Chandrasekhar, S. Lu, F. Shafait, S. Uchida, and E. Valveny. ICDAR 2015 competition on robust reading. In ICDAR, pages 1156–1160, 2015. Paper ↩︎
Tian Z, Huang W, He T, et al. Detecting text in natural image with connectionist text proposal network. European conference on computer vision(ECCV), 2016: 56-72. Paper Code ↩︎
Qiangpeng Yang, Mengli Cheng et al. IncepText: A New Inception-Text Module with Deformable PSROI Pooling for Multi-Oriented Scene Text Detection. In IJCAI 2018. Paper ↩︎
Wenhai W, Enze X, et al. Shape Robust Text Detection with Progressive Scale Expansion Network. In CVPR 2019. Paper Code ↩︎ ↩︎ ↩︎
Youngmin Baek, Bado Lee, et al. Character Region Awareness for Text Detection. In CVPR 2019. Paper ↩︎ ↩︎ ↩︎
Baek Y , Shin S , Baek J , et al. Character Region Attention For Text Spotting[J]. 2020. ↩︎ ↩︎
Zhou X, Yao C, Wen H, et al. EAST: an efficient and accurate scene text detector. CVPR, 2017: 2642-2651. Paper Code ↩︎
Minghui Liao, et al, Real-time Scene Text Detection with Differentiable Binarization. In AAAI, 2020. PaperCode ↩︎ ↩︎ ↩︎
Wang Y , Xie H , Zha Z , et al. ContourNet: Taking a Further Step toward Accurate Arbitrary-shaped Scene Text Detection[C]// 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). IEEE, 2020. ↩︎ ↩︎ ↩︎
Zhang S X , Zhu X , Hou J B , et al. Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection[J]. 2020. ↩︎ ↩︎ ↩︎
Ye J , Chen Z , Liu J , et al. TextFuseNet: Scene Text Detection with Richer Fused Features[C]// Twenty-Ninth International Joint Conference on Artificial Intelligence and Seventeenth Pacific Rim International Conference on Artificial Intelligence {IJCAI-PRICAI-20. 2020. ↩︎ ↩︎ ↩︎
Xiao S , Peng L , Yan R , et al. Sequential Deformation for Accurate Scene Text Detection[M]// Computer Vision – ECCV 2020. 2020. ↩︎ ↩︎ ↩︎
Yuliang L, Lianwen J, Shuaitao Z, et al. Curved Scene Text Detection via Transverse and Longitudinal Sequence Connection. Pattern Recognition, 2019.Paper ↩︎
Chee C K, Chan C S. Total-text: A comprehensive dataset for scene text detection and recognition.Document Analysis and Recognition (ICDAR), 2017 14th IAPR International Conference on. IEEE, 2017, 1: 935-942.Paper ↩︎
文本检测算法性能对比相关推荐
- 文本检测算法----TextFuseNet(IJCAI-PRICAI-20)
多种文本检测算法性能对比及算法介绍 (https://blog.csdn.net/qq_39707285/article/details/108754444) TextFuseNet: Scene T ...
- 分割文本_PSENet、PANNet、DBNet三个文本检测算法异同
点击蓝字关注我们 这三个文本检测算法都是segment base算法,通过由下而上的方式,先对text进行segment,然后再根据segment text,计算出text的instance PSEN ...
- 4种基于像素分割的文本检测算法
摘要:文本检测是文本读取识别的第一步,对后续的文本识别有着重大的影响.一般场景下,可以通过对通用目标检测算法进行配置修改,来实现对文本行的检测定位.本文主要介绍基于像素分割的文本检测算法. 本文分享自 ...
- PSENet PANNet DBNet 三个文本检测算法异同
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx 这三个文本检测算法都是segment base算法,通过由下而上的方式,先对text进行seg ...
- ICDAR2013文本检测算法的衡量方法(二)Rectangle Matching与DetEval
这是第二部分,第一部分请点击 ICDAR2013文本检测算法的衡量方法(一)Evaluation Levels 主要内容: Rectangle Matching, 或者bbox matching IC ...
- CVPR 2019 | 文本检测算法PSENet解读与开源实现
点击我爱计算机视觉标星,更快获取CVML新技术 作者:刘恒 编辑:CV君 PSENet文本检测算法来自论文<Shape Robust Text Detection with Progressiv ...
- 文本检测算法新思路:基于区域重组的文本检测
摘要:文本检测是文本读取识别的第一步,对后续的文本识别有着重大的影响.本文主要介绍基于区域重组的文本检测算法. 本文分享自华为云社区<技术综述十三:弯曲文本检测算法(一)>,作者: 我想静 ...
- 2020最新文本检测算法TextFuseNet
向AI转型的程序员都关注了这个号???????????? 人工智能大数据与深度学习 公众号:datayx TextFuseNet: Scene Text Detection with Richer ...
- AI实战:基于AdvancedEAST的自然场景图像文本检测算法
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx EAST文本检测与Keras实现 https://blog.csdn.net/linchuha ...
最新文章
- 认识Java Core和Heap Dump
- 单例模式——创建型模式
- Java并发编程,无锁CAS与Unsafe类及其并发包Atomic
- Segmentation fault (core dumped) -llinux系统内存错误报错信息
- github 上微信判断是否被删除的源码 以及使用解惑
- mysql怎么看实例名_南方“中看不中吃”的前4名水果,莲雾只是垫底,你怎么看?...
- presumably用法
- Ubuntu中EasyPR环境配置
- EXCEL中的定位条件(含快速删除空行,定位图片、文本框等对象)
- emacs java自动import_[转]emacs 代码自动补齐的三个方法
- php邮箱群发,PHP的邮件群发系统phplist配置方法详细总结
- AI绘图实战(一):制作购物车图标icon | Stable Diffusion成为设计师生产力工具
- 2017年3月17日华为内推上机考试
- Excel-VBA应用(1):批量提取单元格中的超链接URL
- getResource()的几种路径方式
- Html表格制作费用报销单
- 【云计算与大数据技术】虚拟化技术、开源技术Xen、KVM、OpenVZ的讲解(图文解释 超详细)
- jupyter notebook调试流程
- 什么是CW?CW通讯的优缺点是?
- openvpen最新安卓中文版_Zedge app官方下载-Zedge最新版本2020v6.8.4 安卓中文版-腾牛安卓网...