ERNIE-Enhanced Language Representation with Informative Entities 阅读笔记
2019年清华在ACL提出ERNIE模型,同年,百度也提出一个ERNIE模型。本篇论文主要针对的是清华的模型。
BERT模型在很多NLP任务中取得很好的效果,但是BERT模型只是就事论事,缺乏对知识的理解。因此ERINE模型在输入上加入了sentence存在于知识图谱中的实体信息。比如’Bob is a writer.‘,在bert中原始的输入为[‘Bob’, ‘is’, ‘a’, ‘writer’, ‘.’],ERINE加入的额外输入为[‘Q191000’, ‘UNK’, ‘UNK’, ‘Q1910001’, ‘.’ ]。这里的’Q191000’,‘Q1910001’是’Bob’、 'writer’这两个实体的id。对于包含多个token的实体,比如Jim Henson,只会和第一个token Jim进行对齐,因为作者假设模型会自动将实体信息传递到token上。
ERNIE和Bert在与训练基础上,都增加了预测MASK实体,但是原本标注的实体信息可能存在错误,因此ENRIE采用了以下三个策略:
- 5%概率随机替换实体,以期模型可以纠正错误的实体对齐
- 15%概率mask掉实体,以期模型可以抽取出没有标注的实体
- 80%概率,保留原来的实体,以期能够将实体与知识进行融合,提高NLU效果
该模型的架构如下图所示:
可以看到,该模型在T-Encoder上和bert是一样的,但是K-Encoder上,ERNIE不仅包含原始的输入,还假如了实体在知识图谱中的信息。
根据原始代码,可以画出如下的结构图:
引用:像ERNIE那样做个有知识的BERT
输入token以及entities的enbedding后,分别用5层bertlayer_sim(T-Encoder,即原始的transformer)、1层bertlayermix(K-Encoder)、6层bertlayer(K-Encoder)得到最终输出。
在普通任务上,bert和ERNIE模型的输入是一样的,但在实体相关的任务上,ERNIE需要经过特殊处理。Entity Typing任务中,在实体两端加入ENT这个token;在Relation Classification任务中,在头部实体两端加入HD这个token,在尾部实体加入TL这个token。
ERNIE-Enhanced Language Representation with Informative Entities 阅读笔记相关推荐
- ERNIE: Enhanced Language Representation with Informative Entities 论文研读
1. 摘要 NLP表示模型如BERT的预训练模型能够在大量的纯文本语料中捕获丰富的语义信息,并且通过微调改进NLP任务的效果.然而,已存在的预训练语言模型很少考虑将知识图谱的结构化信息融入其中,从 ...
- esrgan_ESRGAN: Enhanced Super-Resolution Generative Adversarial Networks【阅读笔记】
针对SRGAN提出的几点改进,获得了PIRM2018视觉质量的第一名. 首先是使用去掉BN层的Residual in Residual Dense Block作为网络的basic unit.并且使用r ...
- [论文阅读笔记17]A Survey on Knowledge Graph-Based Recommender Systems
一,题目 TKDE 2020 A Survey on Knowledge Graph-Based Recommender Systems 综述:基于知识图谱的推荐系统 In IEEE Transact ...
- 阅读《SentiLARE: Sentiment-Aware Language Representation Learning with Linguistic Knowledge》
SentiLARE: Sentiment-Aware Language Representation Learning with Linguistic Knowledge Abstract 现有的预训 ...
- 论文阅读笔记:BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
提示:阅读论文时进行相关思想.结构.优缺点,内容进行提炼和记录,论文和相关引用会标明出处. 文章目录 前言 介绍 背景知识 相关工作 具体实现结构 Pre-training BERT Fine-tun ...
- 论文阅读笔记(4):Local Convex Representation with Pruning for Manifold Clustering ,带剪枝的局部凸表达进行流形聚类
论文阅读笔记(4):带剪枝的局部凸表达进行流形聚类 介绍 文章主要贡献 理论上:局部凸表达(Local Convex Representation, **LCR**) 剪枝方法:估计流形的内在维数以剪 ...
- T-PAMI-2021论文Semi-Supervised Multi-View Deep Discriminant Representation Learning阅读笔记
提示:文 0.论文信息 题目:Semi-Supervised Multi-View Deep Discriminant Representation Learning 期刊: IEEE Transac ...
- Align before Fuse: Vision and Language Representation Learning with Momentum Distillation
ALBEF:Align before Fuse: Vision and Language Representation Learning with Momentum Distillation 论文链接 ...
- # 互信息最大化[视角统一]:Align before Fuse: Vision Language Representation Learning with Momentum Distillation
互信息最大化[视角统一]:Align before Fuse: Vision and Language Representation Learning with Momentum Distillati ...
- Reconstruction and Representation of 3D Objects with Radial Basis Functions 阅读笔记
Reconstruction and Representation of 3D Objects with Radial Basis Functions 阅读笔记 紧接着上面的连篇blog,本篇学习如何 ...
最新文章
- 别再用kill -9关闭程序了......
- 我问占小狼到底什么是面向对象编程?他转头就走。
- 阿里云查看mysql版本_查看mysql版本
- 【C++多线程系列】【七】实现经典的C/S架构
- 《研磨设计模式》chap20 享元模式 Flyweight (1)前奏介绍
- 目标检测特殊层:PSROIPooling详解
- LINUX Find命令使用
- Java 理论与实践:让 J2EE 脱离容器
- php mysql删除失败_php+MySQL实战案例【七】数据编辑、删除
- SoftWater——SDN+UnderWater系列论文一
- 最小二乘法支持向量机一般用在什么场合_人工智能科普|机器学习重点知识——支持向量机SVM...
- 如何把nas的功能效果最大化?
- 4.2第一个窗口程序
- python封装:隐藏对象中的属性或方法(三分钟读懂)
- 火山图 多个样本、_statTarget-基于QC样本的代谢组学数据校正
- Win11未安装Defender怎么办?解决Win11未安装Defender的方法
- 带权有向无环图的最短路径(使用拓扑排序的方法)
- cacti的安装与配置(一)安装
- c安卓开发视频教程!我把所有Android第三方库整理成了PDF,醍醐灌顶!
- 一阶线性常微分方程解法
热门文章
- 格式工厂 vtt字幕 加入视频
- 云计算是互联网和计算机技术发展的产物,云计算 是传统计算机和网络技术发展融合的产物,它意味着计算能力也可作为一种商品通过互联网进行流通 。...
- firewalld防火墙IP伪装和端口转发
- vue实战优化 打包后 vender文件过大问题
- 2019ICPC徐州打铁心得
- 山西藏家捐献44幅明清寺观壁画在山西博物院展出(图)
- 解锁图案-九宫格有多少种组合?安全吗?用程序来解答
- excel插件方格格子
- requestLayout() improperly called by android.widget.GridView{43cefbd VFED.VC.. .F...... 0,0-2190,319
- 怎么看公司邮箱服务器地址,怎么看企业邮箱是哪里的