摘要:文档理解着重于从非结构化文档中识别并提取键值对信息,并将其输出为结构化数据。在过往的信息提取中,大多数工作仅仅只关注于提取文本的实体关系,因此并不适用于直接用于文档理解上。

本文分享自华为云社区《论文解读系列十三:全局信息对于图网络文档解析的影响》,作者:一笑倾城 。

1 背景介绍

文档理解着重于从非结构化文档中识别并提取键值对信息,并将其输出为结构化数据。在过往的信息提取中,大多数工作仅仅只关注于提取文本的实体关系,并不适用于直接用于文档理解上。

在ICDAR2019的比赛上,参赛者被要求从发票收据等文档中提取键值对信息。因此本文提出了一种包含了全局信息,并且结合了视觉信息的图网络结构,来完成从非结构化文档中提取关键信息的任务。

2 网络结构

本文将文档理解任务转化为图节点分类任务。对于文本的全局和局部信息获取:

使用CLS抓取全局文本序列的分类信息,生成w0,并将其与每个单独文本(w1,w2…,wn)放在同一输入向量中。经过BERT模型,独立地对每个元素进行编码,这样模型拥有了局部和全局信息,同时也能对全局和局部文本进行embedding

对于图片的全局和局部信息获取:使用的是相似的方法,不过是基于CNN网络来捕捉全局和局部的图像特征

文本和图像特征拼接:将图像特征和文本特征进行特征融合(concat)

网络构建:

给定文档内的一组文本段,构建一个虚拟的全局节点作为信息沟通枢纽,这样每两个非相邻节点之间也是two-hop neighbors, 减少信息沟通损失的同时全局信息也能很直接输出到局部节点上。

聚合邻居使得每一个节点与two-hop neighbors两两之间通过激活函数(leaky-relu)进行模型参数更新,并且使用了K-attention来提高模型的能力(通过多个attention然后合并所有attention的机制)

信息提取:

3 实验结果

在阿里巴巴天池竞赛的数据及上效果。

相关消融实验:移除视觉特征后,在天池数据以及SROIE上,能明显看出视觉特征可以在提取结构化信息的问题上发挥重要的作用。同理,删除全局节点也降低了模型精度,也验证了全局连接在图结构中的重要性。

点击关注,第一时间了解华为云新鲜技术~

带你看论文丨全局信息对于图网络文档解析的影响相关推荐

  1. 第一次网络信息基础作业记录文档

    第一次网络信息基础作业记录文档 这是我第一次网信作业的记录,欢迎大家讨论与指正 任务要求:写个网页 主题:自选,健康: 实现方法: a) 使用HTML5编写,用文字编辑器,不要使用Frontpage之 ...

  2. 基于Java毕业设计毕业生论文管理系统源码+系统+mysql+lw文档+部署软件

    基于Java毕业设计毕业生论文管理系统源码+系统+mysql+lw文档+部署软件 基于Java毕业设计毕业生论文管理系统源码+系统+mysql+lw文档+部署软件 本源码技术栈: 项目架构:B/S架构 ...

  3. java计算机毕业设计论文评审系统源代码+数据库+系统+lw文档

    java计算机毕业设计论文评审系统源代码+数据库+系统+lw文档 java计算机毕业设计论文评审系统源代码+数据库+系统+lw文档 本源码技术栈: 项目架构:B/S架构 开发语言:Java语言 开发软 ...

  4. PHP实习之路—NO.1(看LINUX、APACHE、MYSQL、PHP文档)

    PHP实习之路-NO.1(看LINUX.APACHE.MYSQL.PHP文档): 基本功一定要扎实! 本文转自 Lee_吉  博客,原文链接:    http://blog.51cto.com/121 ...

  5. [css] 你有去看过或者了解过css的标准文档吗?

    [css] 你有去看过或者了解过css的标准文档吗? 当然,CSS 中可以研究的太多了,比如 css2 的层叠上下文极其诡异,比如 body 的默认值与普通 dom 的不同,flex-shrink 的 ...

  6. 带你读论文丨基于视觉匹配的自适应文本识别

    摘要:ECCV2020 通过视觉匹配的方法来做文本识别,解决文档识别中的文本识别多样性和泛化性问题 本文分享自华为云社区<论文解读二十三:基于视觉匹配的自适应文本识别>,作者: woohe ...

  7. 计算机基础课程教学创新,计算机基础课程教学学生创新能力的培养-计算机基础论文-计算机论文(12页)-原创力文档...

    计算机基础课程教学学生创新能力的培养-计算机基础论文-计算机论文 --文章均为WORD文档,下载后可直接编辑使用亦可打印-- 摘要:作为高校教育中一门具有基础性的重要课程,计算机基础课程对于发展学生综 ...

  8. 京东:网传通过 Bug 抢茅台是假消息;罗永浩回应带货价格非「全网最低」;Rust 文档团队解散 | 极客头条...

    整理 | 屠敏 头图 | CSDN 下载自东方 IC 「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 一分钟 ...

  9. 计算机辅助设计技术认识的论文,计算机辅助设计论文(7页)-原创力文档

    学号 广 州 大 学 计算机辅助设计论文 题 目:计算机在室内设计中的应用与影响 专 业: 硕 士 姓名: 研究生 指 导 老 师 : 广州大学美术与设计学院 计算机在室内设计中的应用与影响 摘要: ...

最新文章

  1. 06-3. 单词长度(15)
  2. QtCreator5.12.6安装图文教程
  3. Mesos容器引擎的架构设计和实现解析
  4. error_logs
  5. 信息学奥赛一本通(1194:移动路线)
  6. Java的8大排序的基本思想及实例解读
  7. ae软件安装计算机丢失,Win10系统AE软件安装失败怎么办
  8. java中lastmodified_Java File lastModified()用法及代码示例
  9. Python库积累之Selenium(一)-Seleniun基础
  10. iOS编辑预览视频小结
  11. 数独问题流程图_数独游戏的难度等级分析及求解算法研究
  12. 数据结构几个最简单的阐述完整版(带你入门:链表,栈,队列,哈希表,树)通俗易懂简单明了
  13. ios安卓模拟器_iOS模拟器来了?苹果大一统时代会对游戏行业造成哪些冲击?
  14. 【数字电路抢救】3 逻辑函数的卡诺图化简
  15. 苹果id密码忘记了怎么重新设置?请收好这份攻略!
  16. uniapp按照官方《针对plus.runtime.install在安卓9.0+上无法执行的解决方案》处理后报错:安装包解析错误
  17. eMP 服务开发说明
  18. 光脚丫学LINQ(003):排序结果集
  19. [汇] 立即寻址,直接寻址,间接寻址
  20. 如何在本地上次文件到GitHub

热门文章

  1. (26)HTML兼容写法
  2. (36) css企业代码书写规范
  3. Bootstrap 模态框插件Modal 的选项
  4. Git笔记(5) 状态记录
  5. antd vue关闭模态对话框_如何在Bootstrap项目中用Vue.js替代jQuery
  6. python填空题及答案知乎_GitHub - HSINAN/zhihu-python: 获取知乎内容信息,包括问题,答案,用户,收藏夹信息...
  7. linux操作系统下建用户,如何用Linux操作系统批量建立用户的shell
  8. vue中下载excel的使用,后端链接两种情况,一个是链接,一个是文件流
  9. docker build no such file or directory
  10. 配置管理-CMMI的五个等级