摘要

引入了一种名为RobusTabNet的方法来进行表格检测和结构识别。对于表格检测,使用CornerNet来作为RPN。对于表格结构识别,提出了基于空间CNN的分割模块和基于Grid CNN的单元格合并模块,因此表格结构识别可以识别具有大空白空间的表格和扭曲的表格。

一、引言

随着文档数量的爆炸式增长,迫切需要自动表格检测技术从文档中重建表格以支持下游应用(信息检索/问答)->实际的应用场景中,表格结构样式复杂(无边界表、跨页表),内容复杂(表格、图像、公式),背景对象复杂(图形、流程图、结构布局文本),嵌套表格,图像质量差(失真、弯曲等)->现有的方法和问题

二、相关工作

三、方法

Overview

模型组成:表格检测器+表格提取器

步骤:1.表格检测器检测表格并从原始图像中裁切出来,调整为适当的分辨率

2.输入到表格结构识别器重建单元格结构

CornerNet-FRCN based table detector

使用cornnet作为FRCN的RPN

Split-and-merge based table structure recognizer

1.从原始图像中裁剪每个检测到的表格并调整大小确保有足够的行间距用于分离线预测

2.每个表格图像被input到表格结构识别器中。1)预测row separator mask和column separator mask 2)使用CCA从所有mask中提取行列分割线 3)使用grid cnn将错误拆分的单元为合并为跨单元 1)和3)共享同一个CNN主干网络

  • 分隔线预测:

标出行列分隔线和文件行的边界框

行分隔线分别上下移动,列分隔线分别左右移动直到接触到被标记的非跨单元的文本框

获得分隔区域,确保每个分隔区域像素小于8

  • 单元格生成:

二值化,提取连接分量

  • 单元格合并:

四、Loss

五、实验

六、结论和未来工作

表格识别论文阅读——《Robust Table Detection and Structure Recognition from Heterogeneous Document Images》相关推荐

  1. 表格识别论文和数据集

    Awesome-Table-Recognition A curated list of resources dedicated to table recognition github会长期维护和更新, ...

  2. 【论文阅读】 Object Detection in 20 Years: A Survey

    [论文阅读]Object Detection in 20 Years: A Survey 摘要 论文介绍 1.目标检测 2.目标检测的里程碑 3.数据集 4.性能度量 摘要 本篇博客参考Object ...

  3. 行为识别论文阅读(2)——3D Human Sensing, Action and Emotion Recognition in Robot Assisted Therapy of Children

    行为识别论文阅读(2)--3D Human Sensing, Action and Emotion Recognition in Robot Assisted Therapy of Children ...

  4. 基于dota的目标检测(旋转框)论文阅读Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectors

    基于dota的目标检测(旋转框)|论文阅读Oriented Object Detection in Aerial Images with Box Boundary-Aware Vectors 文章目录 ...

  5. 论文阅读 [TPAMI-2022] DE-GAN: A Conditional Generative Adversarial Network for Document Enhancement

    论文阅读 [TPAMI-2022] DE-GAN: A Conditional Generative Adversarial Network for Document Enhancement 论文搜索 ...

  6. 论文阅读 R-FCN: Object Detection via Region-based Fully Convolutional Networks

    本文转载自: http://www.cnblogs.com/lillylin/p/6277094.html R-FCN论文阅读(R-FCN: Object Detection via Region-b ...

  7. 论文阅读“Robust multi-view clustering with incomplete information”

    论文标题 Robust multi-view clustering with incomplete information 论文作者.链接 作者:Yang, Mouxing and Li, Yunfa ...

  8. 论文阅读-Robust Image Retargeting via Axis-Aligned Deformation

    标题:Robust Image Retargeting via Axis-Aligned Deformation 年份:2012 作者:Daniele Panozzo,Ofir Weber,Olga ...

  9. 虹膜识别-论文阅读1

    hello,这是鑫鑫鑫的论文分享站,今天分享的文章是Iris Recognition With Off-the-Shelf CNN Features: A Deep Learning Perspect ...

最新文章

  1. Kubernetes Eviction Manager工作机制分析
  2. C语言基本数据结构之二(二叉树的三种遍历,节点数以及深度算法)
  3. 大数据和云计算时代的机遇
  4. linux执行class文件_深入理解linux内核——可执行文件执行过程(2)
  5. [深度学习] 自然语言处理 --- Self-Attention(二) 动画与代码演示
  6. ioctl 函数 参数 详解
  7. 海报框架模型Photoshop PSD样机模板
  8. 前端跨域之Jsonp实现原理及.Net下Jsonp的实现
  9. 【元胞自动机】基于matlab元胞自动机甲板火灾下人群疏散【含Matlab源码 1291期】
  10. 【CF-gym101964:B】Broken Watch(找规律+推导+自然溢出/java大数)
  11. 安卓机器人做图软件_移动机器人领域,除了工业(安卓)一体机,工控机也必不可少...
  12. 石河子大学计算机研究生好考吗,石河子大学2020考研经验分享
  13. 强化学习Q-Learning实现机器人走迷宫
  14. ui测试怎么做?依据文档有哪些_软件开发流程涉及到哪些文档?其中有你需要了解的外包开发中的猫腻...
  15. 拼多多:补贴与盈利背道而驰
  16. tif文件转为shp文件_ArcGIS栅格数据与矢量数据的转换
  17. python 形态学
  18. result returns more than one elements; nested exception is javax.persistence.NonUniqueResultExceptio
  19. Delphi ListView的用法(常用技巧) 作者:蓝色忧郁
  20. 教师专业发展规划计算机教师,初中信息技术教师个人发展计划

热门文章

  1. 烟草管理系统配备产品介绍
  2. Android Studio项目中各目录的图标含义
  3. Undefined symbols for architecture i386: _OBJC_CLASS_$_AVOSCloud, referenced from:
  4. 计算机主机中网络适配器,第三章计算机网络设备.ppt
  5. ssm上传图片文件到ftp(图片压缩处理)
  6. 2006素材网站大全
  7. 零基础小白适合学习3D游戏建模嘛?
  8. 【洛谷P3951】小凯的疑惑【数论】
  9. 实战USB互联线组网共享上网
  10. C++常见编译/链接错误及其解决办法