近期,由阿里巴巴“图像和美”团队联合华南理工大学共同举办ICPR MTWI (Multi-Type Web Image)2018 挑战赛正式开启,并开放业内第一个基于网络图片的中英混合数据集——MTWI数据集。大赛聚焦OCR领域相关实用知识点的突破与解决,旨在与全球AI科研人才一起共同推动OCR在工业界的应用和发展。

互联网世界中,图片是传递信息的重要媒介。特别是电子商务、社交、搜索等领域,每天都有数以亿兆级别的图像在流动传播。基于深度学习的图片文字识别(OCR)技术正飞速发展,并深刻影响着信息的交互和传递方式,乃至改变相关行业的生产方式。而在学术领域,图片中的文字识别(OCR)同样也是研究重点,但目前业内依旧缺少基于网络图片的、以中文为主的OCR数据集。

本次大赛发布的MTWI数据集来源于真实网络场景,以“来源于实践,且高于实践”为构建理念,既考虑到学术价值同时也兼顾工业适用性。

不同于纯文档图片和场景文字图片,MTWI数据集中的图片多为作者设计或者二次加工所得。整体上看,这类图片不仅包含部分场景图片和文档图片,更多的是在这些图片基础上添加设计好的文字而成的新图片。


左一:空心字,切断字,中英混排;左二:封面印刷文字,离散单字,重叠字;左三:实拍,自然场景,艺术文字;左四:大字中镶嵌小字,不同字号混排

从数据场景上看,本数据集涵盖了数码合成、物体表面、封面类印刷的中英文以及少量日文、韩文等类型的文字。而从文字版式上来看,包含了各种字体类型的单字、横排、竖排、倾斜排列、曲线排列、复杂混排(不同字号、不同字体、不同字间距的混合排布)等。

因此,本次大赛发布的数据集既有图片文字识别的共性也有本身的特性,突出覆盖前沿技术尚未解决或者遗漏的样例,并基于OCR领域乃至计算机视觉领域的前沿指标,设置文本检测,文本行识别,端到端的整图文字识别三个层次的赛题,对相关技术点的解决以及在工业领域的信息数字化应用将具有直接的推动作用。


本次ICPR MTWI 2018 挑战赛基于天池数据众智平台,目前已开启报名通道,吸引了来自国内外2000余支队伍报名参赛,其中不乏OCR研究领域的知名院校团队。赛事组委会将在2018年6月1日评出获奖名单,并于ICPR2018大会期间在北京进行颁奖。
了解本次大赛更多详情及赛事最新动态,请登录ICPR MTWI 2018 挑战赛官网(https://tianchi.aliyun.com/markets/tianchi/icpr_mtwi_2018_challenge)或扫描下方二维码报名参赛!

关于主办团队:

阿里巴巴“图像和美”团队是阿里巴巴从事图像技术历史最悠久的团队,在OCR领域,多年来不断整合前沿技术和行业经验,打磨出了能够承载跨行业应用的技术架构,形成了完备的图像文字定位、识别和理解的人工智能技术体系。目前已在阿里巴巴集团内部的图片管控,搜索,智能审核等领域扮演重要角色,并推出“读光”OCR云产品,包括文档图片,网络图片,表格图片和卡证照图片的文字识别服务,正致力于为政务、司法以及金融等行业提供安全高效的OCR解决方案。

ICPR 2018 MTWI挑战赛开启 开放首个网络图片数据集相关推荐

  1. 你会心动吗?ICPR 2018 MTWI挑战赛开启

    互联网世界中,图片是传递信息的重要媒介.特别是电子商务.社交.搜索等领域,每天都有数以亿兆级别的图像在流动传播.基于深度学习的图片文字识别(OCR)技术正飞速发展,并深刻影响着信息的交互和传递方式,乃 ...

  2. ICPR 2018|阿里巴巴读光OCR及MTWI数据集亮相引关注

    近日,第24届国际模式识别大会(ICPR 2018)在北京举办,阿里巴巴"图像和美"团队成为会场焦点,在本次ICPR大会中,阿里巴巴"图像和美"团队集中展示了在 ...

  3. 清华朱文武团队斩获NIPS 2018 AutoML挑战赛亚军,高校排名第一

    来源:新智元 本文约2000字,建议阅读10分钟. 本文介绍了NIPS 2018 AutoML挑战赛的最终结果,清华大学计算机系朱文武团队斩获第二,高校排名雄踞第一. NIPS 2018 AutoML ...

  4. 长亮科技发布2018年报:营收首破十亿元,直面蚂蚁金服竞争压力

    4月14日晚间,长亮科技(300348)发布2018年年度报告.财报显示,2018年公司实现合同总额11.74亿元,同比增长33.93%;实现营业收入10.87亿元,同比增长23.63%;上市后连续7 ...

  5. 2018虹软视觉AI开放平台开发者大赛,助力开发者梦想起航

    过去,人们因为出门忘带钥匙而烦恼,因为排队检票人山人海而焦灼-- 自从有了人脸识别算法赋能,出门不用再带钥匙,排队实时人证核验检票--刷脸轻松畅行. 对于人脸识别黑科技感兴趣的你是不是也跃跃欲试呢? ...

  6. 重磅!ICCV 2019 COCO + Mapillary 联合识别挑战赛开启!

    点击我爱计算机视觉标星,更快获取CVML新技术 ICCV 2019 最值得期待的挑战赛 -- COCO + Mapillary Joint Recognition Challenge Workshop ...

  7. 云天励飞AI芯片新鲜出炉 亮相高交会开启深圳首展

    11月14日,为期5天的第二十届中国国际高新技术成果交易会(以下简称"高交会")在深圳会展中心开幕.作为深圳人工智能领域的独角兽,云天励飞携具有自主知识产权并于近期成功流片的AI芯 ...

  8. 动作定位、检测与理解,ICCV 2021 DeeperAction挑战赛开启~

    本次ICCV 2021的DeeperAction挑战赛旨在推动人类动作理解领域研究从传统的动作识别转向更深入的动作理解任务,希望模型能够在不同视频中对人类动作的进行定位和详细理解. 具体来说,组织者提 ...

  9. 第四届“强网”拟态防御国际精英挑战赛开启战幕,打造广义功能安全新标杆

    11月9日,第四届"强网"拟态防御国际精英挑战赛在南京江宁开启战幕,来自国内外的48支顶尖战队将在线上展开连续72小时巅峰对决! 紫金山实验室开幕式现场 首届中国网络空间内生安全发 ...

最新文章

  1. Exchange Server 2010 灾难恢复
  2. ECS控制台支持创建资源时绑定标签
  3. 2020-10-27(原码,反码,补码的产生)
  4. python异步_Python中的异步编程
  5. NOIP练习赛题目5
  6. ASP.NET状态管理之十三(总结)
  7. 20170808上课笔记
  8. rssi室内定位算法原理_室内定位方案常用的4种定位算法
  9. [动态规划] leetcode 10 正则表达式匹配
  10. class.forname()中要写相对路径吗?_自考考试时间推迟,自考通过率会降低吗?
  11. 关于java的外语文献_java英文参考文献(涵盖3年最新120个)
  12. c语言字符 ul,c语言 #define 中的UL
  13. 华为静态路由及默认路由的配置
  14. IOS:IOS集成开发和环境的介绍
  15. arcgis中字段的融合_利用ArcGis进行地理处理之三(融合)
  16. Angularjs DataTable表格自动刷新
  17. Spring boot 启动后没反应
  18. centos linux开机启动项,Centos 配置开机启动项
  19. 英雄联盟手游正式上线,白拿22个永久英雄11个皮肤,太香了
  20. GO使用go get -u “包“: fatal: unable to access ‘https://github.com/..‘: Failed to connect to报错

热门文章

  1. Spring Cloud-Alibaba
  2. 历史性一刻,中国航天器首次登上火星!!!
  3. 自用的一些平时记录. 时不时更新
  4. XmlHttp的open( )方法
  5. SHA-256 算法-java实现
  6. html表格 内容间距,html怎么设置表格间距
  7. hive计算指定日期所在周的第一天和最后一天
  8. CSDN Blogger小工具
  9. 【详解】Executors框架之Executors
  10. 7.Docker容器使用辅助工具汇总