互联网世界中,图片是传递信息的重要媒介。特别是电子商务、社交、搜索等领域,每天都有数以亿兆级别的图像在流动传播。基于深度学习的图片文字识别(OCR)技术正飞速发展,并深刻影响着信息的交互和传递方式,乃至改变相关行业的生产方式。而在学术领域,图片中的文字识别(OCR)同样也是研究重点,但目前业内依旧缺少基于网络图片的、以中文为主的OCR数据集。

近期,由阿里巴巴“图像和美”团队联合华南理工大学共同举办ICPR MTWI(Multi-Type Web Image)2018 挑战赛正式开启,并开放业内第一个基于网络图片的中英混合数据集——MTWI数据集。大赛聚焦OCR领域相关实用知识点的突破与解决,旨在与全球AI科研人才一起共同推动OCR在工业界的应用和发展。

本次大赛发布的MTWI数据集来源于真实网络场景,以“来源于实践,且高于实践”为构建理念,既考虑到学术价值同时也兼顾工业适用性。

不同于纯文档图片和场景文字图片,MTWI数据集中的图片多为作者设计或者二次加工所得。整体上看,这类图片不仅包含部分场景图片和文档图片,更多的是在这些图片基础上添加设计好的文字而成的新图片。

左一:空心字,切断字,中英混排 /左二:封面印刷文字,离散单字,重叠字/左三:实拍,自然场景,艺术文字/左四:大字中镶嵌小字,不同字号混排

从数据场景上看,本数据集涵盖了数码合成、物体表面、封面类印刷的中英文以及少量日文、韩文等类型的文字。而从文字版式上来看,包含了各种字体类型的单字、横排、竖排、倾斜排列、曲线排列、复杂混排(不同字号、不同字体、不同字间距的混合排布)等。

因此,本次大赛发布的数据集既有图片文字识别的共性也有本身的特性,突出覆盖前沿技术尚未解决或者遗漏的样例,并基于OCR领域乃至计算机视觉领域的前沿指标,设置文本检测,文本行识别,端到端的整图文字识别三个层次的赛题,对相关技术点的解决以及在工业领域的信息数字化应用将具有直接的推动作用。

本次ICPR MTWI 2018 挑战赛基于天池数据众智平台,目前已开启报名通道,吸引了来自国内外2000余支队伍报名参赛,其中不乏OCR研究领域的知名院校团队。赛事组委会将在2018年6月1日评出获奖名单,并于ICPR2018大会期间在北京进行颁奖。

更多大赛详情及赛事最新动态,请点击【阅读原文】登录ICPR MTWI 2018 挑战赛官网或扫描下方二维码报名参赛!

关于主办团队:


阿里巴巴“图像和美”团队是阿里巴巴从事图像技术历史最悠久的团队,在OCR领域,多年来不断整合前沿技术和行业经验,打磨出了能够承载跨行业应用的技术架构,形成了完备的图像文字定位、识别和理解的人工智能技术体系。目前已在阿里巴巴集团内部的图片管控,搜索,智能审核等领域扮演重要角色,并推出“读光”OCR云产品,包括文档图片,网络图片,表格图片和卡证照图片的文字识别服务,正致力于为政务、司法以及金融等行业提供安全高效的OCR解决方案。

你会心动吗?ICPR 2018 MTWI挑战赛开启相关推荐

  1. ICPR 2018 MTWI挑战赛开启 开放首个网络图片数据集

    近期,由阿里巴巴"图像和美"团队联合华南理工大学共同举办ICPR MTWI (Multi-Type Web Image)2018 挑战赛正式开启,并开放业内第一个基于网络图片的中英 ...

  2. ICPR 2018|阿里巴巴读光OCR及MTWI数据集亮相引关注

    近日,第24届国际模式识别大会(ICPR 2018)在北京举办,阿里巴巴"图像和美"团队成为会场焦点,在本次ICPR大会中,阿里巴巴"图像和美"团队集中展示了在 ...

  3. 清华朱文武团队斩获NIPS 2018 AutoML挑战赛亚军,高校排名第一

    来源:新智元 本文约2000字,建议阅读10分钟. 本文介绍了NIPS 2018 AutoML挑战赛的最终结果,清华大学计算机系朱文武团队斩获第二,高校排名雄踞第一. NIPS 2018 AutoML ...

  4. 智源“高能对撞粒子分类挑战赛”开启,品鉴宇宙粒子的独特“味道”

    2019 年 11 月,北京智源人工智能研究院联合数据评测平台 biendata,共同发布了粒子碰撞数据集,其中包含数百万条高能对撞中所产生的喷注信息(质量.能量.方向等),以及相关的碰撞事件信息和喷 ...

  5. 第四届“强网”拟态防御国际精英挑战赛开启战幕,打造广义功能安全新标杆

    11月9日,第四届"强网"拟态防御国际精英挑战赛在南京江宁开启战幕,来自国内外的48支顶尖战队将在线上展开连续72小时巅峰对决! 紫金山实验室开幕式现场 首届中国网络空间内生安全发 ...

  6. INTERSPEECH 2021 AutoSpeech挑战赛开启报名

    近年来,语音唤醒在智能家具.车载设备等场景中得到广泛应用.而在智能设备控制.仓储物流个性化统计等更多复杂应用场景中,需要使用者通过专属声纹和专属唤醒词来唤醒设备,定制化唤醒词.特定说话人的声纹验证等个 ...

  7. 全球首届“AI球球大作战:Go-Bigger多智能体决策智能挑战赛”开启

    <球球大作战>是一款风靡全球的休闲电子竞技游戏,以大球吃小球为目标,简单有趣却又斗智斗勇. 你不知道的是,AI世界也拥有了自己的<球球大作战>. 前不久,OpenDILab开源 ...

  8. 奖金15万!全球首届“AI球球大作战:Go-Bigger多智能体决策智能挑战赛”开启

    关注公众号,发现CV技术之美 <球球大作战>是一款风靡全球的休闲电子竞技游戏,以大球吃小球为目标,简单有趣却又斗智斗勇. 你不知道的是,AI世界也拥有了自己的<球球大作战>. ...

  9. 动作定位、检测与理解,ICCV 2021 DeeperAction挑战赛开启~

    本次ICCV 2021的DeeperAction挑战赛旨在推动人类动作理解领域研究从传统的动作识别转向更深入的动作理解任务,希望模型能够在不同视频中对人类动作的进行定位和详细理解. 具体来说,组织者提 ...

最新文章

  1. C++ algorithm的sort函数总结
  2. ORB-SLAM3系列-多地图管理
  3. 利用UIWebView获取userAgent需要注意的地方
  4. 通过style来控制隔行显示不同颜色 .
  5. DL之FCN:FCN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
  6. Linux下套接字详解(补充)--OSI七层与TCP/IP五层网络架构详解
  7. c语言中组合函数,排列组合c怎么算 公式是什么
  8. 《互联网人如厕报告》,厕所竟成互联网人的 “最后净土”
  9. Makefile:include和-include
  10. 2008生产实习 日程安排
  11. C++网络编程实例(初识多线程)
  12. python解题工程力学_工程力学学习指导与解题指南(普通高等教育十三五规划教材)...
  13. ffmpeg webm 提取_使用ffmpeg转换webm格式
  14. iOS实时美颜滤镜实现
  15. mysql从指定条数开始查询_mysql数据库指定条数数据查询的主要方法
  16. 澳大利亚麦考瑞大学计算机学院王岩教授招收2022-2023年入学博士研究生和双学位博士生
  17. 70万行代码、历时20年,一名开发人员写出的史诗般的计算机程序
  18. 经典数据结构之2-3树
  19. Redhat Linux 5.3环境实施DB2 V9.7 HADR
  20. 博士员工离职率21.8%,任正非反思:华为这么大,英雄为何无用武之地?

热门文章

  1. 广州大学纺织服装学院计算机应用,广州大学纺织服装学院代码是多少
  2. 怎么将做个文件做成二维码?扫描二维码展示文件怎么做?
  3. 华为手机卡在升级界面_华为通用强制升级教程 华为官方卡刷教程
  4. 南京java架构师工资_java架构师工资一般是多少?怎么提升才能获得高薪?
  5. string字符串输入
  6. vs2013 编译 该文件已在源编辑器之外被修改
  7. 相对定位的元素会在原先的地方
  8. linux 子程序返回错误代码,execvp:在程序中调子程序并获取返回值
  9. 串行通信 - Modbus协议
  10. 垃圾收集器面试总结(一)