「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。

本期 AI Drive,我们邀请到微软亚洲研究院自然语言计算组实习生徐毅恒,为大家带来预训练时代下的文档智能专题直播。对本期主题感兴趣的小伙伴,今晚 7 点,我们准时相约 PaperWeekly B 站直播间。

直播信息

文档智能是一种旨在针对富文本文档进行理解并抽取其中非结构化信息的技术。LayoutLM 的成功证明了针对文本和布局进行预训练的有效性。在此基础上,我们提出了多模态预训练模型 LayoutLMv2 及其多语言扩展 LayoutXLM,通过对文本、布局和图像进行联合预训练,进一步提高了模型的性能,在多项任务中取得了新的突破。

LayoutLMv2:

https://aclanthology.org/2021.acl-long.201/

开源代码:

https://aka.ms/layoutlmv2

LayoutXLM:

https://arxiv.org/abs/2104.08836

开源代码:

https://aka.ms/layoutxlm

文档智能综述:

https://www.microsoft.com/en-us/research/publication/document-ai-benchmarks-models-and-applications-in-chinese/

本次分享的具体内容有:

  • 文档智能背景以及 LayoutLM

  • LayoutLMv2:新一代多模态文档理解模型

  • LayoutXLM:针对多语言文档的扩展

  • 文档智能前沿综述

嘉宾介绍

 徐毅恒 / 微软亚洲研究院实习生 

徐毅恒,微软亚洲研究院自然语言计算组实习生,研究方向为自然语言处理和多模态文档理解。目前在 KDD, ACL, COLING 等国际会议发表论文。

直播地址 & 交流群

本次直播将在 PaperWeekly B 站直播间进行,扫描下方海报二维码点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道

B 站直播间:

https://live.bilibili.com/14884511

合作伙伴

????

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

今晚直播 | 微软亚洲研究院徐毅恒:预训练时代下的文档智能相关推荐

  1. MSRA提出通用文档预训练模型LayoutLM,通往文档智能之路!

    星标/置顶小屋,带你解锁 最萌最前沿的NLP.搜索与推荐技术 随着数字化进程的加快,文档.图像等载体的结构化分析和内容提取成为关乎企业数字化转型成败的关键一环,自动.精准.快速的信息处理对于生产力的提 ...

  2. #####haohaohaohao#######MSRA提出通用文档预训练模型LayoutLM,通往文档智能之路!

    星标/置顶小屋,带你解锁 最萌最前沿的NLP.搜索与推荐技术 随着数字化进程的加快,文档.图像等载体的结构化分析和内容提取成为关乎企业数字化转型成败的关键一环,自动.精准.快速的信息处理对于生产力的提 ...

  3. 【NLP】预训练时代下的文本生成|模型技巧

    今天推荐一篇人大出品的37页文本生成综述: A Survey of Pretrained Language Models Based Text Generation https://arxiv.org ...

  4. 今晚8点直播 | 微软亚洲研究院副院长刘铁岩:机器学习技术前沿与未来展望

    人工智能正受到越来越多的关注,而这波人工智能浪潮背后的最大推手就是"机器学习".机器学习从业者在当下需要掌握哪些前沿技术?展望未来,又会有哪些技术趋势值得期待? AI科技大本营联合 ...

  5. 周四直播 | 微软亚洲研究院副院长刘铁岩:机器学习技术前沿与未来展望

    人工智能备受关注.取得革命性进步背后的最大推手是"机器学习".机器学习从业者在当下需要掌握哪些前沿技术?展望未来,又会有哪些技术趋势值得期待? AI科技大本营联合华章科技特别邀请到 ...

  6. 微软亚洲研究院等提出CNN训练新方法RePr,准确率显著提升

    今天为大家带来的论文导读是由布兰迪斯大学和微软亚洲研究院所提出的RePr--专为卷积神经网络所设计的训练方法.该方法通过对滤波器的重要性进行排序,对网络进行修剪,并迭代训练完整网络和子网络,提升网络表 ...

  7. 【NLP从零入门】预训练时代下,深度学习模型的文本分类算法(超多干货,小白友好,内附实践代码和文本分类常见中文数据集)

    如今NLP可以说是预训练模型的时代,希望借此抛砖引玉,能多多交流探讨当前预训练模型在文本分类上的应用. 1. 任务介绍与实际应用 文本分类任务是自然语言处理(NLP)中最常见.最基础的任务之一,顾名思 ...

  8. 北京内推 | 微软亚洲研究院DKI组招聘大模型方向研究实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 微软亚洲研究院 Cloud Intelligence组是微软亚洲研究院DK ...

  9. 北京/上海内推 | 微软亚洲研究院DKI组招聘因果机器学习算法实习生

    合适的工作难找?最新的招聘信息也不知道? AI 求职为大家精选人工智能领域最新鲜的招聘信息,助你先人一步投递,快人一步入职! 微软亚洲研究院 Cloud Intelligence 组是微软亚洲研究院D ...

最新文章

  1. showdoc windows 搭建_Windows 搭建在线文档工具showdoc工具
  2. php集成环境wamp搭建后,如何配置服务器
  3. 通过 EXPLAIN 分析低效 SQL 的执行计划
  4. C++五子棋(三)——判断鼠标有效点击
  5. 神策营销云:微信生态中,「电商」如何借“运营工具”,抢占 4.5 亿流量红利?...
  6. 吴恩达 coursera AI 专项五第一课(下)总结+作业答案
  7. boost::fusion::traits::is_view用法的测试程序
  8. 入门 | 如何为你的回归问题选择最合适的机器学习方法?
  9. python入门之函数调用educoder_Educode Python入门之函数调用
  10. NULL、nil、Nil、NSNull的区别
  11. 【转】数据库软考笔记(一)第一章 计算机硬件基础知识笔记总结
  12. 设计模式之观察者模式(Java)
  13. 服务器系统和数据库,服务器系统和数据库
  14. viewport总结
  15. 华为招聘产业联盟高级专家、 开发者生态专家
  16. sudo和su命令简介
  17. 微机原理课程设计-接口芯片编程记录
  18. 计算机常用的采样频率,采样频率
  19. 如何使用 DiskGenius 合并分区
  20. 解决CSS样式重复定义带来的冲突问题

热门文章

  1. 秒过,度目智慧通行让常态化防疫更高效
  2. 关闭 Adobe Flash 沙箱(保护模式)解决Flash崩溃及卡顿问题
  3. 微信小程序 request请求数据 模块输出
  4. 关于删除数据仓库的数据
  5. 修改ONET.XML自定义SPS站点
  6. mysql运用与实践_MySQL开发与实践 PDF 下载
  7. mysql最大述_mysql最大字段数量及 varchar类型总结
  8. 北京林大计算机科技应为abc哪类,北京林业大学新生入学要准备什么?
  9. 离开当前屏幕的判断方法_Android App内存泄露测试方法总结
  10. mysql乐观和悲观锁实现_mysql实现乐观锁和悲观锁该怎么编写?