DAS 2020 (Document Analysis System,文档分析系统研讨会) 于 7月26-29日在武汉召开,本次研讨会中有不少精彩的内容,昨天向大家推荐了来自华南理工大学金连文老师和 Adobe 研究院的Sun Tong 博士的分享:

DAS 2020 Keynote Speech | 深度学习时代的 OCR

DAS 2020 Keynote Speech | Adobe 文档分析技术介绍

今天向大家推荐在该会议上来自 印度国际信息技术学院(IIIT)C. V. Jawahar 教授的分享:Documents Understanding Beyond Text Recognition.

该分享指出文档分析技术正从文本识别向着更高级的文档理解发展,文档理解含有丰富的内涵:

1. 文档的布局检测分割;

2. 结构化信息提取,比如表格检测与识别等;

3. 基于文档识别的内容视觉问答。

包括相关技术和数据集的介绍,相信对从事OCR领域的朋友有帮助。

以下为完整PDF,52CV 获得授权发布。大家也可以在我爱计算机视觉公众号后台回复“文档理解”获取PDF文件全文。

备注:ocr

OCR交流群

文本检测、识别、编辑等更多最新技术,若已为CV君其他账号好友请直接私信。

我爱计算机视觉

微信号:aicvml

QQ群:805388940

微博知乎:@我爱计算机视觉

投稿:amos@52cv.net

网站:www.52cv.net

在看,让更多人看到  

文档理解最新技术介绍 | DAS 2020 Keynote Speech相关推荐

  1. DAS 2020 Keynote Speech | Adobe 文档分析技术介绍

    DAS 2020 (Document Analysis System,文档分析系统研讨会) 于 7月26-29日在武汉召开,本次研讨会中有不少精彩的内容,昨天向大家推荐了来自华南理工大学金连文老师的 ...

  2. DAS 2020 Keynote Speech | 深度学习时代的 OCR

    DAS 2020 (Document Analysis System,文档分析系统研讨会) 于 7月26-29日在武汉召开,本次研讨会中有不少精彩的内容,今天向大家重磅推荐来自华南理工大学金连文老师的 ...

  3. MSRA-万字综述 直击多模态文档理解

    文 | 付奶茶 随着最近几年多模态大火的,越来越多的任务都被推陈出新为多模态版本.譬如,传统对话任务,推出了考虑视觉信息的多模态数据集:事件抽取,也推出视频形式的多模态版本:就连 grammar in ...

  4. 论文解读丨LayoutLM: 面向文档理解的文本与版面预训练

    摘要:LayoutLM模型利用大规模无标注文档数据集进行文本与版面的联合预训练,在多个下游的文档理解任务上取得了领先的结果. 本文分享自华为云社区<论文解读系列二十五:LayoutLM: 面向文 ...

  5. 别再搞纯文本了!多模文档理解更被时代需要!

    文 | Ryan 都已经2021年了,互联网已经今非昔比,20年前纯文本的日子已经一去不复返,文字已经满足不了网页.文章的需求,绝大部分都会有着精心设计的表格.图片,甚至视频.PDF文档这种富文本格式 ...

  6. 谷歌发布端到端AI平台,还有用于视频和表格的AutoML、文档理解API等多款工具

    谷歌又有了大动作.在大洋彼岸的谷歌Cloud Next conference大会上,谷歌一口气发布了多款AI新品和工具,主要包括: 端到端的AI平台 用于处理视频和表格数据的AutoML Tables ...

  7. 掘金量化—Python SDK文档—5.API 介绍(2)

    Python SDK文档 5.API介绍 5.6通用数据函数(免费) python 通用数据 API 包含在 gm3.0.148 版本及以上版本,不需要引入新库 get_symbol_infos - ...

  8. 源代码文档生成 Doxygen介绍(转载)

    源代码文档生成 Doxygen介绍(转载) 收藏 Doxygen介绍 一.Doxygen介绍 在项目开发过程中最重要的是如何和团队中其它成员沟通,如何在项目完成后减低维护成本,随着公司的人员流动,怎样 ...

  9. 文档中没有介绍的SQL Server DBCC命令

    文档中没有介绍的SQL Server DBCC命令 http://www.searchdatabase.com.cn/showcontent_11822.htm http://www.searchda ...

最新文章

  1. iOS中UIDynamic物理仿真详解
  2. 目前的Android恶意软件分类
  3. Android JNI入门第五篇——Android.mk分析
  4. 通俗说一下python和人工智能有什么关系
  5. T-SQL 之 多表联合更新
  6. 三星Galaxy S22系列发布会准确时间曝光:2月9日正式揭晓
  7. freebsd 6.2 安装配置笔记[转]
  8. php装逼的面试问题,面试读心术,教你如何优雅的在面试官前装逼
  9. 干掉 SQL 中的 like,我用 es 后运营小姐姐们都说好快!
  10. Graphical Model(概率图模型)的浅见
  11. 【读书笔记《Android游戏编程之从零开始》】2.Hello,World!
  12. bzoj 3237: [Ahoi2013]连通图 并查集+线段树分治
  13. 3-JS-数据类型-数组
  14. 逻辑学学习.14 --- 谓词逻辑(六):数量量词和摹状词
  15. js调用一次函数,中间增加一个内容
  16. Succinimidyl Carboxymethyl Ester-PEG-Mal,Mal-poly(ethylene glycol)-SCM
  17. distribute by sort by
  18. kafka reassign 限速_车主无忧:为什么放弃开源Kafka?
  19. centos 计算器_计算初学者进行服务器centos 7.6系统及orca、xtb、gaussian 16软件的安装乱谈...
  20. 转:真正的管理不会像交响乐一样,只由一人来指挥千军万马

热门文章

  1. 数据竞赛入门-金融风控(贷款违约预测)三、特征工程
  2. 设计模式学习笔记——享元(Flyweight)模式
  3. Javascritp入门
  4. QT [004] QT SDK 和 QT quick 和 QT creator的区别历史和沿袭
  5. php调用谷歌翻译,PHP调用谷歌翻译 | 学步园
  6. linux修改默认python版本_Linux 升级 Python 并修改默认版本
  7. java通信录教程_java实现通讯录管理系统
  8. 使用java连接ftp服务器_Java如何连接到FTP服务器?
  9. 单片机定时器_单片机定时器/计数器基本原理
  10. 百度php笔试题目,12/11/17 百度PHP笔试题目整理