RRPN(《Arbitrary-Oriented Scene Text Detection via Rotation Proposals》)是文本检测中比较具有代表性的文章,文章地址:https://arxiv.org/pdf/1703.01086.pdf。

文章里面用到了MSRA-TD500数据集,数据集特点:多方向文本检测、大部分文本都在引导牌上、分辨率在1296x864到1920x1280之间、包含中英文、总共500张自然场景图片(Training 300 + Test 200)、标注以行为单位,而不是单词、每张图片都完全标注. 难以识别的有difficult标注。

数据集下载地址:http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_%28MSRA-TD500%29

在数据集下载之后,里面包含一个word:MSRA Text Detection 500 Database (MSRA-TD500) Readme.doc,详细介绍了数据集。

MSRA文本检测500数据库(MSRA-TD500)作为评估文本检测算法的基准被公开收集和发布,目的是跟踪自然图像中文本检测领域的最新进展,尤其是检测任意文本的进展,MSRA文本检测500数据库(MSRA-TD500)包含500个自然图像,使用数据包相机从室内(办公室和商场)和室外(街道)场景拍摄,室内图像主要是标志,门板和警示牌,而室外图像主要是复杂背景下的导板和广告牌。图像的分辨率从1296x864到1920x1280不等。由于文本的多样性和图像背景的复杂性,数据集非常具有挑战性。文本可以是不同的语言(中文,英文或两者的混合),字体,大小,颜色和方向。背景可能包含植被(例如树木和草)和重复的图案(例如窗户和砖块),这些图案与文字不太明显。

数据集分为两部分:训练集和测试集。训练集包含从原始数据集中随机选择的300个图像,其余200个图像构成测试集。此数据集中的所有图像都已完全注释。此数据集中的基本单位是文本行,而不是ICDAR数据集中使用的单词,因为很难根据空格将中文文本行划分为单个单词;即使对于英文文本行,在没有高级信息的情况下执行字分区也是非常重要的。

MSRA-TD500数据集(MSRA Text Detection 500 Database)相关推荐

  1. MSRA TD-500数据集

    Overview MSRA Text Detection 500 Database (MSRA-TD500) Cong Yao Huazhong University of Science and T ...

  2. 论文翻译-Scene Text Detection and Recognition: The Deep Learning Era

    论文翻译-Scene Text Detection and Recognition: The Deep Learning Era 原文地址:https://arxiv.org/pdf/1811.042 ...

  3. 基于深度学习的场景文本检测和识别(Scene Text Detection and Recognition)综述

    1. 引言 文字是人类最重要的创作之一,它使人们在时空上可以有效地.可靠的传播或获取信息. 场景中的文字的检测和识别对我们理解世界很有帮助,它应用在图像搜索.即时翻译.机器人导航.工业自动化等领域. ...

  4. character-level OCR之Character Region Awareness for Text Detection(CRAFT) 论文阅读

    Character Region Awareness for Text Detection 论文阅读 论文地址(arXiv) ,pytorch版本代码地址 最近在看一些OCR的问题,CRAFT是在场景 ...

  5. [论文笔记]Arbitrary-Oriented Scene Text Detection via Rotation Proposals

    Arbitrary-Oriented Scene Text Detection via Rotation Proposals 论文地址:https://arxiv.org/abs/1703.01086 ...

  6. CLEval: Character-Level Evaluation for Text Detection and Recognition Task 论文阅读

    CLEval: Character-Level Evaluation for Text Detection and Recognition Task 论文阅读 1.动机 2.主要思想 3.已有的相关方 ...

  7. 【翻译】Rosetta Large Scale System for Text Detection and Recognition in Images

    Rosetta: Large Scale System for Text Detection and Recognition in Images(大规模图像文本提取和识别系统) 摘要 ​ 在本文中,我 ...

  8. 【论文翻译】Scene Text Detection and Recognition: The Deep Learning Era 场景文本检测和识别:深度学习时代

    原文地址:Scene Text Detection and Recognition: The Deep Learning Era 文章目录 摘要 1.引言 2.深度学习时代之前的方法 2.1概括 3. ...

  9. Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection

    Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection 一,Overview 二,文本组件预测: ①首先每 ...

最新文章

  1. JDK相关版本特性浏览
  2. CRM项目经验总结-从DAO层到链接数据池
  3. leetcode 128. Longest Consecutive Sequence | 128. 最长连续序列(Java)
  4. 带属性的字符串(NSMutableAttributedString)的使用
  5. InfluxDb系列:几个关键概念(主要是和关系数据库做对比)
  6. 微信小程序的特点是什么?
  7. 计算机组成原理—高速缓冲存储器
  8. 从 “C语言之父” 那里学到的一些好东西!分享给你~
  9. 中国姓氏数据库 java_中国姓的数据库(sql版),下你妹CSDN,又不是你的资源要你妹积分!...
  10. 前后端传参(二)之数组对象
  11. 如何得到每个区域的每个土地利用类型的面积
  12. 编译内核时出现bad register name `%dil'错误
  13. JDBC中executeQuery、executeUpdate和execute之间的区别
  14. Python之ruamel.yaml模块详解(三)| ruamel.yaml与pyyaml的区别
  15. 搞懂Linux内存屏障(值得收藏)
  16. Python菜鸟在成长——熟悉PyCharm开发环境
  17. python爬虫练习-爬取暖心小故事并实现定时邮箱发送
  18. ruoyi 前后端分离 增加手机号登录
  19. Leetcode 1110:删点成林(超详细的解法!!!)
  20. ABAP 前台执行和后台执行

热门文章

  1. 人工智能趋势:语音识别发展前景广阔
  2. JavaScript var语句简析
  3. 软件版本控制Subversion和Git
  4. polyfill 与 transform-runtime
  5. Red5开发第一步-Hello World
  6. 3D视频的质量评价报告 (MSU出品)
  7. python写一个笔记软件_科学网—python学习笔记(1)——创建应用 - 高雪峰的博文...
  8. jQuery从后面开始截取
  9. 华为7c手机怎么恢复出厂设置_华为手机越用越卡,恢复出厂设置真有用?别乱来,看完就明白了!...
  10. Tomcat服务器报错IOException: Broken pipe