MSRA-TD500数据集(MSRA Text Detection 500 Database)
RRPN(《Arbitrary-Oriented Scene Text Detection via Rotation Proposals》)是文本检测中比较具有代表性的文章,文章地址:https://arxiv.org/pdf/1703.01086.pdf。
文章里面用到了MSRA-TD500数据集,数据集特点:多方向文本检测、大部分文本都在引导牌上、分辨率在1296x864到1920x1280之间、包含中英文、总共500张自然场景图片(Training 300 + Test 200)、标注以行为单位,而不是单词、每张图片都完全标注. 难以识别的有difficult标注。
数据集下载地址:http://www.iapr-tc11.org/mediawiki/index.php/MSRA_Text_Detection_500_Database_%28MSRA-TD500%29
在数据集下载之后,里面包含一个word:MSRA Text Detection 500 Database (MSRA-TD500) Readme.doc,详细介绍了数据集。
MSRA文本检测500数据库(MSRA-TD500)作为评估文本检测算法的基准被公开收集和发布,目的是跟踪自然图像中文本检测领域的最新进展,尤其是检测任意文本的进展,MSRA文本检测500数据库(MSRA-TD500)包含500个自然图像,使用数据包相机从室内(办公室和商场)和室外(街道)场景拍摄,室内图像主要是标志,门板和警示牌,而室外图像主要是复杂背景下的导板和广告牌。图像的分辨率从1296x864到1920x1280不等。由于文本的多样性和图像背景的复杂性,数据集非常具有挑战性。文本可以是不同的语言(中文,英文或两者的混合),字体,大小,颜色和方向。背景可能包含植被(例如树木和草)和重复的图案(例如窗户和砖块),这些图案与文字不太明显。
数据集分为两部分:训练集和测试集。训练集包含从原始数据集中随机选择的300个图像,其余200个图像构成测试集。此数据集中的所有图像都已完全注释。此数据集中的基本单位是文本行,而不是ICDAR数据集中使用的单词,因为很难根据空格将中文文本行划分为单个单词;即使对于英文文本行,在没有高级信息的情况下执行字分区也是非常重要的。
MSRA-TD500数据集(MSRA Text Detection 500 Database)相关推荐
- MSRA TD-500数据集
Overview MSRA Text Detection 500 Database (MSRA-TD500) Cong Yao Huazhong University of Science and T ...
- 论文翻译-Scene Text Detection and Recognition: The Deep Learning Era
论文翻译-Scene Text Detection and Recognition: The Deep Learning Era 原文地址:https://arxiv.org/pdf/1811.042 ...
- 基于深度学习的场景文本检测和识别(Scene Text Detection and Recognition)综述
1. 引言 文字是人类最重要的创作之一,它使人们在时空上可以有效地.可靠的传播或获取信息. 场景中的文字的检测和识别对我们理解世界很有帮助,它应用在图像搜索.即时翻译.机器人导航.工业自动化等领域. ...
- character-level OCR之Character Region Awareness for Text Detection(CRAFT) 论文阅读
Character Region Awareness for Text Detection 论文阅读 论文地址(arXiv) ,pytorch版本代码地址 最近在看一些OCR的问题,CRAFT是在场景 ...
- [论文笔记]Arbitrary-Oriented Scene Text Detection via Rotation Proposals
Arbitrary-Oriented Scene Text Detection via Rotation Proposals 论文地址:https://arxiv.org/abs/1703.01086 ...
- CLEval: Character-Level Evaluation for Text Detection and Recognition Task 论文阅读
CLEval: Character-Level Evaluation for Text Detection and Recognition Task 论文阅读 1.动机 2.主要思想 3.已有的相关方 ...
- 【翻译】Rosetta Large Scale System for Text Detection and Recognition in Images
Rosetta: Large Scale System for Text Detection and Recognition in Images(大规模图像文本提取和识别系统) 摘要 在本文中,我 ...
- 【论文翻译】Scene Text Detection and Recognition: The Deep Learning Era 场景文本检测和识别:深度学习时代
原文地址:Scene Text Detection and Recognition: The Deep Learning Era 文章目录 摘要 1.引言 2.深度学习时代之前的方法 2.1概括 3. ...
- Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection
Deep Relational Reasoning Graph Network for Arbitrary Shape Text Detection 一,Overview 二,文本组件预测: ①首先每 ...
最新文章
- JDK相关版本特性浏览
- CRM项目经验总结-从DAO层到链接数据池
- leetcode 128. Longest Consecutive Sequence | 128. 最长连续序列(Java)
- 带属性的字符串(NSMutableAttributedString)的使用
- InfluxDb系列:几个关键概念(主要是和关系数据库做对比)
- 微信小程序的特点是什么?
- 计算机组成原理—高速缓冲存储器
- 从 “C语言之父” 那里学到的一些好东西!分享给你~
- 中国姓氏数据库 java_中国姓的数据库(sql版),下你妹CSDN,又不是你的资源要你妹积分!...
- 前后端传参(二)之数组对象
- 如何得到每个区域的每个土地利用类型的面积
- 编译内核时出现bad register name `%dil'错误
- JDBC中executeQuery、executeUpdate和execute之间的区别
- Python之ruamel.yaml模块详解(三)| ruamel.yaml与pyyaml的区别
- 搞懂Linux内存屏障(值得收藏)
- Python菜鸟在成长——熟悉PyCharm开发环境
- python爬虫练习-爬取暖心小故事并实现定时邮箱发送
- ruoyi 前后端分离 增加手机号登录
- Leetcode 1110:删点成林(超详细的解法!!!)
- ABAP 前台执行和后台执行
热门文章
- 人工智能趋势:语音识别发展前景广阔
- JavaScript var语句简析
- 软件版本控制Subversion和Git
- polyfill 与 transform-runtime
- Red5开发第一步-Hello World
- 3D视频的质量评价报告 (MSU出品)
- python写一个笔记软件_科学网—python学习笔记(1)——创建应用 - 高雪峰的博文...
- jQuery从后面开始截取
- 华为7c手机怎么恢复出厂设置_华为手机越用越卡,恢复出厂设置真有用?别乱来,看完就明白了!...
- Tomcat服务器报错IOException: Broken pipe