Part1 Introduction
BERT这种公共模型,对于通用领域表现优秀,但是垂直领域表现不佳,除非在垂直领域进行训练,但是非常耗时耗力。将知识图谱整合到语言表示中,领域知识将能提升垂直领域的任务,并且模型具有更好的可解释性。
论文提出的K-BERT通过引进知识图谱(将知识库中的结构化信息(三元组)融入到预训练模型)中,可以更好地解决领域相关任务。
Part2 Methods

模型主要包括四个子模块:Knowledge layer、Embedding layer、Seeing layer和Mask-Transformer Encoder
对于输入句子,知识层首先从KG中将相关的三元组注入,将原始句子转换为句子树。 然后将句子树同时输入到嵌入层和查看层,然后将其转换为令牌级嵌入表示和可见矩阵。 可见矩阵用于控制每个标记的可见区域,防止由于注入太多知识而改变原始句子的含义。
Knowledge layer用于将知识图谱注入到句子中并且完成句子树的转换。
1)Knowledge layer
Input:s=[

论文解读:K-BERT:Enabling Language Representation with Knowledge Graph(AAAI-20)相关推荐

  1. 论文解读:Exploring Graph-structured Passage Representation for Multi-hop Reading Comprehension with Grap

    论文解读:Exploring Graph-structured Passage Representation for Multi-hop Reading Comprehension with Grap ...

  2. 论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering

    论文解读:Improved Neural Relation Detection for Knowledge Base Question Answering   本文解决KBQA中的子问题--Relat ...

  3. 论文解读:Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings

    论文解读:Improving Multi-hop Question Answering over Knowledge Graphs using Knowledge Base Embeddings    ...

  4. 论文浅尝 | DI刊发的那些有关Knowledge Graph的论文

    本文转载自公众号:数据智能英文刊 知识图谱被称为人工智能的基石,它的前身是语义网,由谷歌在2012年率先提出,用于改善自身的搜索业务.Data Intelligence执行主编.东南大学计算机科学与技 ...

  5. 【论文阅读笔记】Multi-Task Feature Learning for Knowledge Graph Enhanced

    Multi-Task Feature Learning for Knowledge Graph Enhanced 1.框架 MKR是一个通用的.端对端深度推荐框架, 由三个主要部分组成:推荐模块.KG ...

  6. [论文翻译]DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

    DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning 0 总结 名称 项目 题目 DeepPath: A Re ...

  7. 论文学习1-DeepPath: A Reinforcement Learning Method for Knowledge Graph Reasoning

    文章目录 摘要 Introduction 最近工作 基于PRA的其他方法 其他使用强化学习的方法 我们的方法 方法介绍(强化学习 摘要 研究了大规模知识图的学习推理问题.更具体地说,我们描述了一个用于 ...

  8. 论文解读:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference

    论文解读:Exploiting Cloze Questions for Few Shot Text Classification and Natural Language Inference   随着 ...

  9. BERT(一)--论文翻译:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

    转载请注明出处:https://blog.csdn.net/nocml/article/details/124860490 传送门: BERT(一)–论文翻译:BERT: Pre-training o ...

最新文章

  1. 西南交大量子计算机,交大量子光电实验室
  2. 关于nsurlsession
  3. P4321-随机漫游【状压dp,数学期望,高斯消元】
  4. 使用Java 8.0进行类型安全的依赖项注入
  5. js时间搓化为今天明天_js转时间戳,时间戳转js
  6. linux的基础知识——守护进程
  7. EAST: An Efficient and Accurate Scene Text Detector(自然场景下文本识别)训练,测试
  8. 任意门怎么用团发_任意门日淘app官方手机版-任意门日淘安卓版下载v1.4.6-壹六下载...
  9. 市面上大部分渗透工具下载
  10. Paperreading 之二  多人人体姿态估计COCO2017冠军—CPN
  11. Compass实战 站内搜索
  12. HIVE 多个相同属性字段元素合并到一列中
  13. 互联网医疗泡沫破灭,一场从线上回归线下的技术圈地运动?
  14. Prometheus企业级监控——理论入门
  15. 用计算机测声音频率,什么软件可以测声音频率?
  16. 移动端 懒加载、下拉刷新、上拉加载
  17. 【创业说】零经验接手APP运营推广,聊聊这两个月我是怎么熬过来的
  18. 现代交换技术中,分组交换和电路交换的区别
  19. WiFi基础学习到实战(三:WiFi网络“物理层”)
  20. 2022年计算机软件水平考试电子商务设计师(中级)练习题及答案

热门文章

  1. html DOM------document
  2. word文件不能编辑是什么原因
  3. Python try...except...时捕获异常时具体文件和行数
  4. H5调用手机的前后摄像头,canvas显示,自带截图,兼容ios和android
  5. pgpool读写分离,配置设置及调研
  6. iis网站服务器+sql server数据库服务器安全
  7. 简易在线投票系统(php)——前端设计(html部分)
  8. java微博源码_基于jsp的微博-JavaEE实现微博 - java项目源码
  9. 手机/移动端的UI框架-Vant和NutUI
  10. linux驱动-platform详解