公众号 系统之神与我同在

本文包含四个部分:

1、语义理解与图(预训练模型与外部知识)

2、ERNIESage(语义图理解技术)

3、知识增强预训练(隐式与显式知识表示)

4、工业应用落地(案例介绍)

语义理解与图

文本匹配的多种视角



ERINE的辉煌胜绩


更强ERNIE模型的使用,可访问文心平台: https://ai.baidu.com/easydl/nlp/

GraphSage的介绍

GraphSAGE源于图卷积网络

图像卷积将一个像素点周围的像素按照不同的权重叠加起来。


图结构卷积将一个节点周围的邻居按照不同的权重叠加起来。

图像取样和聚合


已有方法对文本+图的局限


项目代码:https://github.com/PaddlePaddle

文本图的来源:知识引入


ERNIESage-Node节点语义理解


ERNIESage-Edge边的“单塔”聚合

ERNIESage-Node与ERNIESage-Edge对比

ERNIESage-1 Neighbor:邻居的单塔聚合

·用ERNIE来作为节点聚合函数实现邻居**“单塔”聚合**
·序不变性:互不相见Attention Mask,以及独立Position Embedding
·长度无限:Sampling机制、ERNIE Doc

ERNIESage-N Neighbor:多阶邻居的token-level深度聚合

结合NodeEdge的方案,将token-level的交互扩展到通用多层聚合
保留每一层的Token级别特征,并且每一层通过Multi-Head Attention交互

ERNIESage 4种模型总结


① 结合语义与结构信息ERNIESage取得最好效果:MRR平均提升**+9.7%**

② ERNIESage横向比较:使用ERNIE建模邻居信息取得最优效果
ERNIESage在文本图推理TextGraph-14 Coling协办比赛中的应用

2006年开始举办,今年为第14届
数据量少, 人工标注困难
挑战难度大, 基于图的多步推理
任务目标:在解释图中进行多步文本推理,召回出符合推理过程的若干节点



ERNIESage在文本图推理TextGraph-14 Coling协办比赛中的应用

基于ERNIESage模型以60.33的MAP分数取得第1名,领先第二名2%

显式Explicit/隐式Impicit引入知识

显式知识引入

·额外知识库的引入(上线逻辑复杂)
·知识建模(计算效率变慢)

隐式知识引入

·预训练的方法“尽量”捕捉知识
·不需要再扩大预训练模型


知识增强预训练


聚合知识模块——负责知识交互, 捕捉知识之间关系

通过知识增强的 CLS还原被Mask的Tokens

下游任务应用



工业应用落地

工业落地案例#1: 关键词触发

工业落地案例#2: 地图POI ERNIESage检索

总结

将知识以图的形式加入到语义理解中

用ERNIESage建模语义图

通过知识增强预训练来提升模型效果

知识增强图语义理解技术相关推荐

  1. 百度黄正杰:知识增强图语义理解技术

    导读:本文的题目为知识增强图语义理解技术,主要介绍: 语义理解与图:预训练模型与外部知识 ERNIESage:百度语义图理解技术 知识增强预训练:隐式与显式知识表示 工业落地应用:案例介绍 01 语义 ...

  2. 百度孙宇:百度语义理解技术ERNIE及其应用

    不到现场,照样看最干货的学术报告! 嗨,大家好.这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频--足 ...

  3. 百度“知识增强的跨模态语义理解技术”获国家技术发明奖

    11月3日,2020年度国家科学技术奖励大会在京举行,百度"知识增强的跨模态语义理解关键技术及应用"获国家技术发明二等奖. 该技术旨在通过构建大规模知识图谱,关联跨模态信息,通过知 ...

  4. 技术动态 | GML如何做药物发现?奥尔胡斯大学最新《知识增强图机器学习在药物发现中的应用》综述...

    转载公众号 | 专知 将人工智能(AI)融入药物发现领域已经成为一个日益增长的跨学科科学研究领域.然而,传统的人工智能模型在处理复杂的生物医学结构(如2D或3D蛋白质和分子结构)和为输出提供解释方面存 ...

  5. CCKS 2019 | 百度 CTO 王海峰详解知识图谱与语义理解

    本文转载自公众号:机器之心.: 8 月 24 日至 27 日在杭州召开的 2019 年全国知识图谱与语义计算大会(CCKS 2019)上,百度 CTO 王海峰发表了题为<知识图谱与语义理解> ...

  6. 基于知识图谱的语义理解技术及应用

    知识图谱构建.多领域数据集.相关资料 知识图谱在人工智能应用中的重要价值日益突显.百度构建了超大规模的通用知识图谱,并在搜索.推荐.智能交互等多项产品中广泛应用.同时,随着文本.语音.视觉等智能技术的 ...

  7. 直播预告 PhD Debate-8 | 迈向常识知识的高级语义理解

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 常识作为一类高级知识,根据中科院曹存根教授的<A Survey of Commonsense Knowledge Acquisit ...

  8. AI时代的文本智能化利器:百度语义理解技术与平台文心ERNIE

    阅读原文:https://mp.weixin.qq.com/s/Efs1929lxXEv7C3Up72EVg 语言与知识技术,被归类为认知智能,一直是人工智能最热门的研究与应用领域. 9月15日,百度 ...

  9. PhD Debate-8 | 迈向常识知识的高级语义理解

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 常识是一类高级知识,是人的认知神经状态的内化反应.根据中科院曹存根教授在<A Survey of Commonsense Know ...

最新文章

  1. 看过漫改,但你看过「改漫」吗?AI 一键让影视变漫画
  2. IOS可执行文件学习总结
  3. 云南边境“国际新娘”享受国家防艾免费政策
  4. boost::bind时候注意性能问题
  5. GIAC | 大数据分析系统在游戏领域的迭代与实践
  6. VS Code 1.39 发布!Web 版 VS Code 是否离我们越来越近了?(文末彩蛋)
  7. 如果你需要从不同的服务器(不同域名)上获取数据就需要使用跨域 HTTP 请求...
  8. 这群程序员工作日竟然不用上班?
  9. c语言实现字符串转16进制,C语言实现字符串中(10进制和16进制)转成十进制数(示例代码)...
  10. 基于品类关系,虚拟类目如何建设? 1
  11. IDEA设置字体大小的问题
  12. 用vue+vant框架写手机端
  13. 【笔记整理】数字信号处理复习——FT、DTFT、DFT和FFT之间的关系
  14. Druid【部署 01】最新版本的(安装+启动服务+打开控制台+本地文件数据载入+数据查询)及(小内存服务器启动JVM参数调整)一次学会使用Druid的完整流程(已完成)
  15. firefox flash插件
  16. 弗曼学习方法-终极快速学习方法
  17. 基于egret的小游戏——拼图
  18. MPEG4和DivX的问题解答荟萃
  19. uniapp上传图片
  20. 花2个月面过华为测开岗,拿个30K不过分吧?

热门文章

  1. android bsp学习_Android BSP成长计划随笔之虚拟设备搭建和input系统
  2. 电脑,win10无法进入休眠模式解决方法 史上最全
  3. php删除二维数组元素_php二维数组如何删除元素
  4. 太原理工大学机器人团队20天学习打卡day14(51单片机初步)
  5. Linux 命令行 安装Anaconda3
  6. 关于学生课堂行为识别算法
  7. linux分辨率调整
  8. 微软小冰再进化,EQ 的极致是理性
  9. android超频使用方法,如何通过超频提升Android平板电脑速度
  10. 解决PHP使用MPDF,图片不显示。