论文解读:K-BERT:Enabling Language Representation with Knowledge Graph(AAAI-20)
Part1 Introduction
BERT这种公共模型,对于通用领域表现优秀,但是垂直领域表现不佳,除非在垂直领域进行训练,但是非常耗时耗力。将知识图谱整合到语言表示中,领域知识将能提升垂直领域的任务,并且模型具有更好的可解释性。
论文提出的K-BERT通过引进知识图谱(将知识库中的结构化信息(三元组)融入到预训练模型)中,可以更好地解决领域相关任务。
Part2 Methods
模型主要包括四个子模块:Knowledge layer、Embedding layer、Seeing layer和Mask-Transformer Encoder
对于输入句子,知识层首先从KG中将相关的三元组注入,将原始句子转换为句子树。 然后将句子树同时输入到嵌入层和查看层,然后将其转换为令牌级嵌入表示和可见矩阵。 可见矩阵用于控制每个标记的可见区域,防止由于注入太多知识而改变原始句子的含义。
Knowledge layer用于将知识图谱注入到句子中并且完成句子树的转换。
1)Knowledge layer
Input:s=[
论文解读:K-BERT:Enabling Language Representation with Knowledge Graph(AAAI-20)相关推荐
- 论文解读:Exploring Graph-structured Passage Representation for Multi-hop Reading Comprehension with Grap
论文解读:Exploring Graph-structured Passage Representation for Multi-hop Reading Comprehension with Grap ...
- 论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering
论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering 本文解决KBQA中的子问题--Relat ...
- 论文解读:Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings
论文解读:Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings ...
- 论文浅尝 | DI刊发的那些有关Knowledge Graph的论文
本文转载自公众号:数据智能英文刊 知识图谱被称为人工智能的基石,它的前身是语义网,由谷歌在2012年率先提出,用于改善自身的搜索业务.Data Intelligence执行主编.东南大学计算机科学与技 ...
- 【论文阅读笔记】Multi-Task Feature Learning for Knowledge Graph Enhanced
Multi-Task Feature Learning for Knowledge Graph Enhanced 1.框架 MKR是一个通用的.端对端深度推荐框架, 由三个主要部分组成:推荐模块.KG ...
- [论文翻译]DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning
DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning 0 总结 名称 项目 题目 DeepPath: A Re ...
- 论文学习1-DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning
文章目录 摘要 Introduction 最近工作 基于PRA的其他方法 其他使用强化学习的方法 我们的方法 方法介绍(强化学习 摘要 研究了大规模知识图的学习推理问题.更具体地说,我们描述了一个用于 ...
- 论文解读:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference
论文解读:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference 随着 ...
- BERT(一)--论文翻译:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
转载请注明出处:https://blog.csdn.net/nocml/article/details/124860490 传送门: BERT(一)–论文翻译:BERT: Pre-training o ...
最新文章
- 西南交大量子计算机,交大量子光电实验室
- 关于nsurlsession
- P4321-随机漫游【状压dp,数学期望,高斯消元】
- 使用Java 8.0进行类型安全的依赖项注入
- js时间搓化为今天明天_js转时间戳,时间戳转js
- linux的基础知识——守护进程
- EAST: An Efficient and Accurate Scene Text Detector(自然场景下文本识别)训练,测试
- 任意门怎么用团发_任意门日淘app官方手机版-任意门日淘安卓版下载v1.4.6-壹六下载...
- 市面上大部分渗透工具下载
- Paperreading 之二 多人人体姿态估计COCO2017冠军—CPN
- Compass实战 站内搜索
- HIVE 多个相同属性字段元素合并到一列中
- 互联网医疗泡沫破灭,一场从线上回归线下的技术圈地运动?
- Prometheus企业级监控——理论入门
- 用计算机测声音频率,什么软件可以测声音频率?
- 移动端 懒加载、下拉刷新、上拉加载
- 【创业说】零经验接手APP运营推广,聊聊这两个月我是怎么熬过来的
- 现代交换技术中,分组交换和电路交换的区别
- WiFi基础学习到实战(三:WiFi网络“物理层”)
- 2022年计算机软件水平考试电子商务设计师(中级)练习题及答案
热门文章
- html DOM------document
- word文件不能编辑是什么原因
- Python try...except...时捕获异常时具体文件和行数
- H5调用手机的前后摄像头,canvas显示,自带截图,兼容ios和android
- pgpool读写分离,配置设置及调研
- iis网站服务器+sql server数据库服务器安全
- 简易在线投票系统(php)——前端设计(html部分)
- java微博源码_基于jsp的微博-JavaEE实现微博 - java项目源码
- 手机/移动端的UI框架-Vant和NutUI
- linux驱动-platform详解