7月5日,由中国人工智能学会主办、百度深度学习平台飞桨(PaddlePaddle)承办的2019第二届中国“AI+“创新创业大赛-中文场景文字识别技术创新大赛启动。本届大赛围绕中文场景文字识别赛题展开,参赛选手需使用飞桨预测图像区域并返回文字行内容。

7月24日,组委会正式发布官方基线,帮助选手快速熟悉比赛环境,助力取得优异成绩。

官方基线下载地址:

https://aistudio.baidu.com/aistudio/datasetdetail/8429

点击下载baseline_code.zip文件

报名传送门

https://aistudio.baidu.com/aistudio/competition/detail/8

基线使用教程

Step1:登录https://aistudio.baidu.com/,创建Notebook项目,添加公开数据集《中文场景文字识别技术创新大赛_训练集》,运行项目。

Step2:解压训练数据集、baseline_code.zip压缩包

!tarxf data/data8429/train_images.tar.gz -C {解压路径}

!tarxf data/data8429/baseline_code.zip -C {解压路径}

Step3:建立数据集索引

本次比赛不限制词表,选手根据自行理解生成统计数据集中字符,并分配任意数字索引,将训练数据处理成数字。

Step4:根据{解压路径}修改train.py中的数据集路径,执行训练代码

!python{解压路径}/baseline_code/ocr_ctc_online/train.py

使用过程中如有任何疑问,欢迎加入本次大赛官方QQ群在线讨论(871326661)。

赛题介绍

近年来,中文场景文字识别技术在人们的日常生活中备受关注,具有丰富的应用场景,如:拍照翻译、图像检索、场景理解等。但该场景下的文字也面临着诸如问题,包括光照变化、低分辨率、字体以及排布多样性、中文字符种类多等复杂情况。如何解决上述问题成为一项极具挑战的任务。

本次大赛提供大规模的中文场景文字识别数据,包括21万张训练集图片和8万张测试集图片。数据集均采自中国街景,并由街景图片中的文字行区域(例如店铺标牌、地标等)截取得来。参赛选手需使用飞桨对图像区域中的文字行进行预测,返回文字行的内容。

赛程透露

  • 2019/7/5 启动报名

  • 2019/7/10 开放训练集数据,选手可训练调试模型

  • 2019/7/24 发布官方基线

  • 2019/8/5 截止报名

  • 2019/9/20 截止提交结果

  • 2019/9/23 排行榜前20名队伍截止提交材料

  • 2019/9/27 公布最终排名前十获奖队伍名单

  • 2019/10下旬或11月上旬 全国路演、颁奖

奖金设置

本次大赛不分初赛、复赛,最终排名第一的个人或团队将获得¥15,000元奖金,前十名队伍均有机会受邀参加下半年举办的全国路演活动。

免费GPU算力助力选手参赛

登录即送算力,每天登录AI Studio并运行Notebook即可获得12小时GPU算力,连续登录5天额外领取48小时GPU算力(有效期7天)。访问https://aistudio.baidu.com/aistudio/questionnaire?activityid=458申请最高长达120小时GPU算力(需登录百度账号)。

本次比赛要求必须提交使用深度学习平台飞桨训练的模型。飞桨是国内唯一功能完备的端到端开源深度学习平台,集深度学习训练和预测框架、模型库、工具组件、服务平台为一体,其兼具灵活和效率的开发机制、工业级应用效果的模型、超大规模并行深度学习能力、推理引擎一体化设计以及系统化的服务支持,致力于让深度学习技术的创新与应用更简单。飞桨将为本次参赛选手提供一站式开发服务。

AI Studio是基于百度深度学习平台飞桨的一站式AI开发平台,提供在线编程环境、免费GPU算力、海量开源算法和开放数据,帮助开发者快速创建和部署模型。有关AI Studio更多信息,欢迎访问https://aistudio.baidu.com/

欢迎加入竞赛官方交流QQ群(871326661),在线讨论。

2019第二届中国“AI+“创新创业大赛-中文场景文字识别技术创新大赛期待你的参与!

所有数据竞赛者的宝典

不失初心,不忘初衷

kaggle竞赛宝典

知乎专栏:@kaggle竞赛宝典

知乎:大野人007/谢嘉嘉

识别中文_中文场景文字识别大赛官方baseline相关推荐

  1. 中文场景文字识别技术创新大赛,总奖池5.4万!

    点击我爱计算机视觉标星,更快获取CVML新技术 竞赛简介 为贯彻执行国家创新驱动发展战略,搭建人工智能领域综合性.集群化.市场化的产学研用综合协同创新平台,中国人工智能学会于2018年创办了首届中国& ...

  2. PaddleOCR实践之飞桨常规赛:中文场景文字识别

    简介 本项目是参加飞桨常规赛:中文场景文字识别(已结束)的项目,项目score为85.87141. 生成的预测文件为work/PaddleOCR中的test2.txt文件 项目任务为识别包含中文文字的 ...

  3. Paddle入门实战系列(四):中文场景文字识别

    ✨写在前面:强烈推荐给大家一个优秀的人工智能学习网站,内容包括人工智能基础.机器学习.深度学习神经网络等,详细介绍各部分概念及实战教程,通俗易懂,非常适合人工智能领域初学者及研究者学习.➡️点击跳转到 ...

  4. php 点对点,浅析点对点(End-to-End)的场景文字识别

    一.背景 随着智能手机的广泛普及和移动互联网的迅速发展,通过手机等移动终端的摄像头获取.检索和分享资讯已经逐步成为一种生活方式.基于摄像头的(Camera-based)的应用更加强调对拍摄场景的理解. ...

  5. 场景文字识别的算法创新与应用,来自百度的技术前沿

    点击我爱计算机视觉标星,更快获取CVML新技术 几天前,52CV曾经向大家推荐百度家 OCR主题的飞桨博士会: 飞桨博士会第四期,中国深度学习技术俱乐部诚邀您加入 百度组织的这个会比较高端,很多52C ...

  6. 史上最全场景文字识别资源汇集(56篇重要论文 + 20 个开源代码 + 330 个实验结果 + 1882个统计信息)...

    点击上方"AI算法与图像处理",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者:刘崇宇 转载自:CSIG文档图像分析与识别专委会 本 ...

  7. poi hssfcellstyle 文字方向_揭秘!文字识别在高德地图数据生产中的演进

    简介:丰富准确的地图数据大大提升了我们在使用高德地图出行的体验.相比于传统的地图数据采集和制作,高德地图大量采用了图像识别技术来进行数据的自动化生产,而其中场景文字识别技术占据了重要位置.商家招牌上的 ...

  8. YunOS场景文字识别

    摘要: 该文章先介绍常见的文字识别方法,然后介绍YunOS在场景文字识别方面取得的进展.结果和技术方案.将重点讲解技术方案的两个主要部分:1)基于全卷积网络的从局部到整体的文字行检测方法:2)基于BL ...

  9. 基于深度学习的自然场景文字识别

    声明:本文来源,详细内容请参考原博文https://blog.csdn.net/xiaofei0801/article/details/72778223 1.1引言 传统光学字符识别主要面向高质量的文 ...

最新文章

  1. 移动端web页面列表类上拉加载,查看详情,iframe嵌套第三方页面遇到的问题以及解决办法...
  2. Linux下安装Weblogic10.3.6并创建简单集群测试
  3. 网站模糊测试爆破工具Wfuzz
  4. 多列布局——column-width
  5. sqlserver 两个数据库同步
  6. tensorflow中的seq2seq例子为什么需要bucket? 有关tensorflow 的sequence2sequence例子,为什么需要用到buckets,rnn不是可以处理任意长度的数据吗
  7. mysql数据库语法_MySQL数据库语法(一)
  8. 微信公众号 模版消息 跳转到小程序报错{ errcode: 40013, errmsg: 'invalid appid hint: [cC6RwA09011295]' }
  9. LeetCode 247. 中心对称数 II(DP)
  10. 几张一模一样的照片_每隔几百年,就会出现一个和你一模一样的人?这些照片怎么解释?...
  11. win2016开启ntp_Windows服务器开启NTP服务
  12. ansile(2)模块之get_url
  13. 一个关于mahout0.5放置位置的错误,,,
  14. 计算机广告制作教程,Photoshop实例教程:制作网站横条广告
  15. 2021年低压电工考试题及低压电工模拟考试
  16. JavaScript打开APP
  17. 问题 J: 亚运会旗帜
  18. 实现n*n乘法口诀表
  19. java使用字符流读取文件
  20. li-poly_GitHub - kinglisky/lowpoly: low poly图片风格化工具

热门文章

  1. 【个人笔记】OpenCV4 C++ 快速入门 06课
  2. Git(11)-- Git 别名(alias)
  3. 单链表插入、删除操作单步解析(十三)
  4. Android报错:No resource found that matches the given name 'Theme.AppCompat.Light.NoActionBar'
  5. shell逻辑判断和-a区别
  6. Android逆向基础笔记—Android中的常用ARM汇编指令
  7. 结合源码探讨Android系统的启动流程
  8. 如何通过JNI传递对象执行回调
  9. Android开发之多线程编程Thread和Runnable使用
  10. java 抽象类 模板_Java学习day21-抽象类(abstract class)和模板设计模式(TemplateMethod)...