识别中文_中文场景文字识别大赛官方baseline
7月5日,由中国人工智能学会主办、百度深度学习平台飞桨(PaddlePaddle)承办的2019第二届中国“AI+“创新创业大赛-中文场景文字识别技术创新大赛启动。本届大赛围绕中文场景文字识别赛题展开,参赛选手需使用飞桨预测图像区域并返回文字行内容。
7月24日,组委会正式发布官方基线,帮助选手快速熟悉比赛环境,助力取得优异成绩。
官方基线下载地址:
https://aistudio.baidu.com/aistudio/datasetdetail/8429
点击下载baseline_code.zip文件
报名传送门:
https://aistudio.baidu.com/aistudio/competition/detail/8
基线使用教程
Step1:登录https://aistudio.baidu.com/,创建Notebook项目,添加公开数据集《中文场景文字识别技术创新大赛_训练集》,运行项目。
Step2:解压训练数据集、baseline_code.zip压缩包
!tarxf data/data8429/train_images.tar.gz -C {解压路径}
!tarxf data/data8429/baseline_code.zip -C {解压路径}
Step3:建立数据集索引
本次比赛不限制词表,选手根据自行理解生成统计数据集中字符,并分配任意数字索引,将训练数据处理成数字。
Step4:根据{解压路径}修改train.py中的数据集路径,执行训练代码
!python{解压路径}/baseline_code/ocr_ctc_online/train.py
使用过程中如有任何疑问,欢迎加入本次大赛官方QQ群在线讨论(871326661)。
赛题介绍
近年来,中文场景文字识别技术在人们的日常生活中备受关注,具有丰富的应用场景,如:拍照翻译、图像检索、场景理解等。但该场景下的文字也面临着诸如问题,包括光照变化、低分辨率、字体以及排布多样性、中文字符种类多等复杂情况。如何解决上述问题成为一项极具挑战的任务。
本次大赛提供大规模的中文场景文字识别数据,包括21万张训练集图片和8万张测试集图片。数据集均采自中国街景,并由街景图片中的文字行区域(例如店铺标牌、地标等)截取得来。参赛选手需使用飞桨对图像区域中的文字行进行预测,返回文字行的内容。
赛程透露
2019/7/5 启动报名
2019/7/10 开放训练集数据,选手可训练调试模型
2019/7/24 发布官方基线
2019/8/5 截止报名
2019/9/20 截止提交结果
2019/9/23 排行榜前20名队伍截止提交材料
2019/9/27 公布最终排名前十获奖队伍名单
2019/10下旬或11月上旬 全国路演、颁奖
奖金设置
本次大赛不分初赛、复赛,最终排名第一的个人或团队将获得¥15,000元奖金,前十名队伍均有机会受邀参加下半年举办的全国路演活动。
免费GPU算力助力选手参赛
登录即送算力,每天登录AI Studio并运行Notebook即可获得12小时GPU算力,连续登录5天额外领取48小时GPU算力(有效期7天)。访问https://aistudio.baidu.com/aistudio/questionnaire?activityid=458申请最高长达120小时GPU算力(需登录百度账号)。
本次比赛要求必须提交使用深度学习平台飞桨训练的模型。飞桨是国内唯一功能完备的端到端开源深度学习平台,集深度学习训练和预测框架、模型库、工具组件、服务平台为一体,其兼具灵活和效率的开发机制、工业级应用效果的模型、超大规模并行深度学习能力、推理引擎一体化设计以及系统化的服务支持,致力于让深度学习技术的创新与应用更简单。飞桨将为本次参赛选手提供一站式开发服务。
AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型。有关AI Studio更多信息,欢迎访问https://aistudio.baidu.com/
欢迎加入竞赛官方交流QQ群(871326661),在线讨论。
2019第二届中国“AI+“创新创业大赛-中文场景文字识别技术创新大赛期待你的参与!
所有数据竞赛者的宝典
不失初心,不忘初衷
kaggle竞赛宝典
知乎专栏:@kaggle竞赛宝典
知乎:大野人007/谢嘉嘉
识别中文_中文场景文字识别大赛官方baseline相关推荐
- 中文场景文字识别技术创新大赛,总奖池5.4万!
点击我爱计算机视觉标星,更快获取CVML新技术 竞赛简介 为贯彻执行国家创新驱动发展战略,搭建人工智能领域综合性.集群化.市场化的产学研用综合协同创新平台,中国人工智能学会于2018年创办了首届中国& ...
- PaddleOCR实践之飞桨常规赛:中文场景文字识别
简介 本项目是参加飞桨常规赛:中文场景文字识别(已结束)的项目,项目score为85.87141. 生成的预测文件为work/PaddleOCR中的test2.txt文件 项目任务为识别包含中文文字的 ...
- Paddle入门实战系列(四):中文场景文字识别
✨写在前面:强烈推荐给大家一个优秀的人工智能学习网站,内容包括人工智能基础.机器学习.深度学习神经网络等,详细介绍各部分概念及实战教程,通俗易懂,非常适合人工智能领域初学者及研究者学习.➡️点击跳转到 ...
- php 点对点,浅析点对点(End-to-End)的场景文字识别
一.背景 随着智能手机的广泛普及和移动互联网的迅速发展,通过手机等移动终端的摄像头获取.检索和分享资讯已经逐步成为一种生活方式.基于摄像头的(Camera-based)的应用更加强调对拍摄场景的理解. ...
- 场景文字识别的算法创新与应用,来自百度的技术前沿
点击我爱计算机视觉标星,更快获取CVML新技术 几天前,52CV曾经向大家推荐百度家 OCR主题的飞桨博士会: 飞桨博士会第四期,中国深度学习技术俱乐部诚邀您加入 百度组织的这个会比较高端,很多52C ...
- 史上最全场景文字识别资源汇集(56篇重要论文 + 20 个开源代码 + 330 个实验结果 + 1882个统计信息)...
点击上方"AI算法与图像处理",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:刘崇宇 转载自:CSIG文档图像分析与识别专委会 本 ...
- poi hssfcellstyle 文字方向_揭秘!文字识别在高德地图数据生产中的演进
简介:丰富准确的地图数据大大提升了我们在使用高德地图出行的体验.相比于传统的地图数据采集和制作,高德地图大量采用了图像识别技术来进行数据的自动化生产,而其中场景文字识别技术占据了重要位置.商家招牌上的 ...
- YunOS场景文字识别
摘要: 该文章先介绍常见的文字识别方法,然后介绍YunOS在场景文字识别方面取得的进展.结果和技术方案.将重点讲解技术方案的两个主要部分:1)基于全卷积网络的从局部到整体的文字行检测方法:2)基于BL ...
- 基于深度学习的自然场景文字识别
声明:本文来源,详细内容请参考原博文https://blog.csdn.net/xiaofei0801/article/details/72778223 1.1引言 传统光学字符识别主要面向高质量的文 ...
最新文章
- 移动端web页面列表类上拉加载,查看详情,iframe嵌套第三方页面遇到的问题以及解决办法...
- Linux下安装Weblogic10.3.6并创建简单集群测试
- 网站模糊测试爆破工具Wfuzz
- 多列布局——column-width
- sqlserver 两个数据库同步
- tensorflow中的seq2seq例子为什么需要bucket? 有关tensorflow 的sequence2sequence例子,为什么需要用到buckets,rnn不是可以处理任意长度的数据吗
- mysql数据库语法_MySQL数据库语法(一)
- 微信公众号 模版消息 跳转到小程序报错{ errcode: 40013, errmsg: 'invalid appid hint: [cC6RwA09011295]' }
- LeetCode 247. 中心对称数 II(DP)
- 几张一模一样的照片_每隔几百年,就会出现一个和你一模一样的人?这些照片怎么解释?...
- win2016开启ntp_Windows服务器开启NTP服务
- ansile(2)模块之get_url
- 一个关于mahout0.5放置位置的错误,,,
- 计算机广告制作教程,Photoshop实例教程:制作网站横条广告
- 2021年低压电工考试题及低压电工模拟考试
- JavaScript打开APP
- 问题 J: 亚运会旗帜
- 实现n*n乘法口诀表
- java使用字符流读取文件
- li-poly_GitHub - kinglisky/lowpoly: low poly图片风格化工具
热门文章
- 【个人笔记】OpenCV4 C++ 快速入门 06课
- Git(11)-- Git 别名(alias)
- 单链表插入、删除操作单步解析(十三)
- Android报错:No resource found that matches the given name 'Theme.AppCompat.Light.NoActionBar'
- shell逻辑判断和-a区别
- Android逆向基础笔记—Android中的常用ARM汇编指令
- 结合源码探讨Android系统的启动流程
- 如何通过JNI传递对象执行回调
- Android开发之多线程编程Thread和Runnable使用
- java 抽象类 模板_Java学习day21-抽象类(abstract class)和模板设计模式(TemplateMethod)...