知识增强图语义理解技术
公众号 系统之神与我同在
本文包含四个部分:
1、语义理解与图(预训练模型与外部知识)
2、ERNIESage(语义图理解技术)
3、知识增强预训练(隐式与显式知识表示)
4、工业应用落地(案例介绍)
语义理解与图
文本匹配的多种视角
ERINE的辉煌胜绩
更强ERNIE模型的使用,可访问文心平台: https://ai.baidu.com/easydl/nlp/
GraphSage的介绍
GraphSAGE源于图卷积网络
图像卷积将一个像素点周围的像素按照不同的权重叠加起来。
图结构卷积将一个节点周围的邻居按照不同的权重叠加起来。
图像取样和聚合
已有方法对文本+图的局限
项目代码:https://github.com/PaddlePaddle
文本图的来源:知识引入
ERNIESage-Node节点语义理解
ERNIESage-Edge边的“单塔”聚合
ERNIESage-Node与ERNIESage-Edge对比
ERNIESage-1 Neighbor:邻居的单塔聚合
·用ERNIE来作为节点聚合函数实现邻居**“单塔”聚合**
·序不变性:互不相见Attention Mask,以及独立Position Embedding
·长度无限:Sampling机制、ERNIE Doc
ERNIESage-N Neighbor:多阶邻居的token-level深度聚合
结合Node和Edge的方案,将token-level的交互扩展到通用多层聚合
保留每一层的Token级别特征,并且每一层通过Multi-Head Attention交互
ERNIESage 4种模型总结
① 结合语义与结构信息的ERNIESage取得最好效果:MRR平均提升**+9.7%**
② ERNIESage横向比较:使用ERNIE建模邻居信息取得最优效果
ERNIESage在文本图推理TextGraph-14 Coling协办比赛中的应用
2006年开始举办,今年为第14届
数据量少, 人工标注困难
挑战难度大, 基于图的多步推理
任务目标:在解释图中进行多步文本推理,召回出符合推理过程的若干节点
ERNIESage在文本图推理TextGraph-14 Coling协办比赛中的应用
• 基于ERNIESage模型以60.33的MAP分数取得第1名,领先第二名2%
显式Explicit/隐式Impicit引入知识
显式知识引入
·额外知识库的引入(上线逻辑复杂)
·知识建模(计算效率变慢)
隐式知识引入
·预训练的方法“尽量”捕捉知识
·不需要再扩大预训练模型
知识增强预训练
聚合知识模块——负责知识交互, 捕捉知识之间关系
通过知识增强的 CLS还原被Mask的Tokens
下游任务应用
工业应用落地
工业落地案例#1: 关键词触发
工业落地案例#2: 地图POI ERNIESage检索
总结
将知识以图的形式加入到语义理解中
用ERNIESage建模语义图
通过知识增强预训练来提升模型效果
知识增强图语义理解技术相关推荐
- 百度黄正杰:知识增强图语义理解技术
导读:本文的题目为知识增强图语义理解技术,主要介绍: 语义理解与图:预训练模型与外部知识 ERNIESage:百度语义图理解技术 知识增强预训练:隐式与显式知识表示 工业落地应用:案例介绍 01 语义 ...
- 百度孙宇:百度语义理解技术ERNIE及其应用
不到现场,照样看最干货的学术报告! 嗨,大家好.这里是学术报告专栏,读芯术小编不定期挑选并亲自跑会,为大家奉献科技领域最优秀的学术报告,为同学们记录报告干货,并想方设法搞到一手的PPT和现场视频--足 ...
- 百度“知识增强的跨模态语义理解技术”获国家技术发明奖
11月3日,2020年度国家科学技术奖励大会在京举行,百度"知识增强的跨模态语义理解关键技术及应用"获国家技术发明二等奖. 该技术旨在通过构建大规模知识图谱,关联跨模态信息,通过知 ...
- 技术动态 | GML如何做药物发现?奥尔胡斯大学最新《知识增强图机器学习在药物发现中的应用》综述...
转载公众号 | 专知 将人工智能(AI)融入药物发现领域已经成为一个日益增长的跨学科科学研究领域.然而,传统的人工智能模型在处理复杂的生物医学结构(如2D或3D蛋白质和分子结构)和为输出提供解释方面存 ...
- CCKS 2019 | 百度 CTO 王海峰详解知识图谱与语义理解
本文转载自公众号:机器之心.: 8 月 24 日至 27 日在杭州召开的 2019 年全国知识图谱与语义计算大会(CCKS 2019)上,百度 CTO 王海峰发表了题为<知识图谱与语义理解> ...
- 基于知识图谱的语义理解技术及应用
知识图谱构建.多领域数据集.相关资料 知识图谱在人工智能应用中的重要价值日益突显.百度构建了超大规模的通用知识图谱,并在搜索.推荐.智能交互等多项产品中广泛应用.同时,随着文本.语音.视觉等智能技术的 ...
- 直播预告 PhD Debate-8 | 迈向常识知识的高级语义理解
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 常识作为一类高级知识,根据中科院曹存根教授的<A Survey of Commonsense Knowledge Acquisit ...
- AI时代的文本智能化利器:百度语义理解技术与平台文心ERNIE
阅读原文:https://mp.weixin.qq.com/s/Efs1929lxXEv7C3Up72EVg 语言与知识技术,被归类为认知智能,一直是人工智能最热门的研究与应用领域. 9月15日,百度 ...
- PhD Debate-8 | 迈向常识知识的高级语义理解
点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 常识是一类高级知识,是人的认知神经状态的内化反应.根据中科院曹存根教授在<A Survey of Commonsense Know ...
最新文章
- 看过漫改,但你看过「改漫」吗?AI 一键让影视变漫画
- IOS可执行文件学习总结
- 云南边境“国际新娘”享受国家防艾免费政策
- boost::bind时候注意性能问题
- GIAC | 大数据分析系统在游戏领域的迭代与实践
- VS Code 1.39 发布!Web 版 VS Code 是否离我们越来越近了?(文末彩蛋)
- 如果你需要从不同的服务器(不同域名)上获取数据就需要使用跨域 HTTP 请求...
- 这群程序员工作日竟然不用上班?
- c语言实现字符串转16进制,C语言实现字符串中(10进制和16进制)转成十进制数(示例代码)...
- 基于品类关系,虚拟类目如何建设? 1
- IDEA设置字体大小的问题
- 用vue+vant框架写手机端
- 【笔记整理】数字信号处理复习——FT、DTFT、DFT和FFT之间的关系
- Druid【部署 01】最新版本的(安装+启动服务+打开控制台+本地文件数据载入+数据查询)及(小内存服务器启动JVM参数调整)一次学会使用Druid的完整流程(已完成)
- firefox flash插件
- 弗曼学习方法-终极快速学习方法
- 基于egret的小游戏——拼图
- MPEG4和DivX的问题解答荟萃
- uniapp上传图片
- 花2个月面过华为测开岗,拿个30K不过分吧?