PubLayNet:36万文档图像版面分析数据集
向AI转型的程序员都关注了这个号????????????
机器学习AI算法工程 公众号:datayx
PubLayNet是文档图像版面分析的大型数据集,其布局用多边形边框分割标注。文档的来源是PubMed Central Open Access子集(商业用途集合)。通过匹配PubMed Central Open Access子集中的文章的PDF格式和XML格式,自动生成注释。有关更多详细信息,请参见我们的论文
https://arxiv.org/pdf/1908.07836.pdf
PubLayNet包含超过36万个文档图像,其中注释了典型的文档布局元素。实验表明,在PubLayNet上训练的深度神经网络可以准确识别科学文章的布局。预先训练的模型也是在不同文档域上进行转移学习的更有效的基本模式
数据集 获取:
关注微信公众号 datayx 然后回复 版面分析 即可获取。
AI项目体验地址 https://loveai.tech
阅读过本文的人还看了以下文章:
【全套视频课】最全的目标检测算法系列讲解,通俗易懂!
《美团机器学习实践》_美团算法团队.pdf
《深度学习入门:基于Python的理论与实现》高清中文PDF+源码
特征提取与图像处理(第二版).pdf
python就业班学习视频,从入门到实战项目
2019最新《PyTorch自然语言处理》英、中文版PDF+源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
《深度学习之pytorch》pdf+附书源码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
《Python数据分析与挖掘实战》PDF+完整源码
汽车行业完整知识图谱项目实战视频(全23课)
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!
《神经网络与深度学习》最新2018版中英PDF+源码
将机器学习模型部署为REST API
FashionAI服装属性标签图像识别Top1-5方案分享
重要开源!CNN-RNN-CTC 实现手写汉字识别
yolo3 检测出图像中的不规则汉字
同样是机器学习算法工程师,你的面试为什么过不了?
前海征信大数据算法:风险概率预测
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
VGG16迁移学习,实现医学图像识别分类工程项目
特征工程(一)
特征工程(二) :文本数据的展开、过滤和分块
特征工程(三):特征缩放,从词袋到 TF-IDF
特征工程(四): 类别特征
特征工程(五): PCA 降维
特征工程(六): 非线性特征提取和模型堆叠
特征工程(七):图像特征提取和深度学习
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
蚂蚁金服2018秋招-算法工程师(共四面)通过
全球AI挑战-场景分类的比赛源码(多模型融合)
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python+flask搭建CNN在线识别手写中文网站
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
机器学习算法资源社群
不断上传电子版PDF资料
技术问题求解
QQ群号: 333972581
长按图片,识别二维码
PubLayNet:36万文档图像版面分析数据集相关推荐
- 细粒度 文档图像版面分析
基于实例分割网络的细粒度文档图像版面分析 英文引用:Zhao P, Wang W, Cai Z, et al. Accurate Fine-Grained Layout Analysis for th ...
- 多模态大模型时代下的文档图像智能分析与处理
多模态大模型时代下的文档图像智能分析与处理 0. 前言 1. 人工智能发展历程 1.1 传统机器学习 1.2 深度学习 1.3 多模态大模型时代 2. CCIG 文档图像智能分析与处理论坛 2.1 文 ...
- 展望AI时代,把握文档图像智能分析与处理的未来(文末送书)
[CCIG技术论坛回顾]展望AI时代,把握文档图像智能分析与处理的未来 前言 CCIG技术论坛 内容回顾及探讨 一.人工智能大模型时代的文档识别与理解 1.1 文档分析与识别 介绍 1.2 文档识别历 ...
- 文档图像智能分析与处理:CCIG技术论坛的思考与展望
文档图像智能分析与处理:CCIG技术论坛的思考与展望 文档识别与理解的发展趋势 视觉-语言预训练模型在文档处理中的应用 篡改文本图像的生成与检测的研究进展 华为云OCR技术的进展与行业实践 智能文档处 ...
- 大咖齐聚CCIG论坛——文档图像智能分析的产业前沿
目录 1 文档图像智能分析技术 2 大咖齐聚CCIG@2023 3 议题介绍 3.1 从模式识别到类脑研究 3.2 视觉-语言预训练模型演进及应用 3.3 篡改文本图像的生成和检测 3.4 智能文档处 ...
- 2021-IEEE论文-深度神经网络在文档图像表格识别中的应用现状及性能分析
2021年5月12日收到, 2021年6月4日接受, 出版日期2021年6月9日, 当前版本日期2021年6月24日. 原论文下载地址 摘要 - Abstract 表格识别的第一阶段是检测文档中的 ...
- 合合信息亮相CCIG2023:多位大咖共话智能文档未来,文档图像内容安全还面临哪些技术难题?
近日,中国图象图形大会(CCIG 2023)(简称"大会")在苏州圆满落幕.本届大会以"图象图形·向未来"为主题,由中国科学技术协会指导,中国图象图形学学会主办 ...
- AlexNet做文档布局分析 (版面分析)数据集
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx 文档布局分析 (Document Layout Analysis) 是识别和分类文本文档的扫描 ...
- 文档图片校正 计算机软件,一种复杂版面扭曲文档图像快速校正方法.PDF
第33卷第6期 计算机应用与软件 Vol33No.6 2016年6月 ComputerApplicationsandSoftware Jun.2016 一种复杂版面扭曲文档图像快速校正方法 曾凡锋 ...
最新文章
- jQuery中用ajax访问php接口文件
- 【数据挖掘】卷积神经网络 ( 视觉原理 | CNN 模仿视觉 | 卷积神经网络简介 | 卷积神经网络组成 | 整体工作流程 | 卷积计算图示 | 卷积计算简介 | 卷积计算示例 | 卷积计算参数 )
- Java内部抽象类的匿名类初始化
- Java里的稀疏矩阵Sparse Array
- c# 命名空间命名规范_C#中的命名空间
- JavaScript中的运算符
- C++学习之路 | PTA乙级—— 1066 图像过滤 (15 分)(精简)
- 记一次MySQL数据库恢复(附方案)
- Nginx中间件web服务安装
- 小程序按钮调用扫一扫_他在一个小程序“按钮”上动了个手脚,生意大火,赢得美人归!...
- 萤石云官方Demo下载并二次开发 QT5.12.10
- 使用moy快速开发后台管理系统(一)
- SketchUp:SketchUp草图大师经典案例之利用跟随路径工具工具设计椭球图文教程
- 服务器光猫一直亮不响应,光猫光信号正常,且光猫和路由器都重启过,还是上不了网咋办?...
- Java JDK安装及环境变量配置(windows)
- linux多点触摸屏驱动程序,Linux系统实现支持多点触控操作[视频]
- GAN_1——基础知识
- 2020总结与2021前瞻
- Programming Rust Fast, Safe Systems Development(译) 错误处理(第七章)
- python 字幕文件ass格式转换成srt格式
热门文章
- 关于 element 可以被找到但是不能被click()的问题
- 什么才是年轻人需要的手机?看完OPPO R11就有了答案!
- linux上samba+本地yum源最简单的配置
- 使用 Segue 傳送選取的 Table Cell 內容到下一個 View
- .net2005登录控件
- [翻译]SharePoint2007中创建Forms认证方式的站点
- 数据库学mysql python_mysql学习(4)python操作数据库
- javastring转long的方法_被JDK坑的没商量?来试试这些方法吧
- 盒子模型代码_果冻公开课第五课:五分钟理清盒模型的前世今生
- 【入门篇】接口自动化测试