小样本关系分类:STAD: Self-Training with Ambiguous Data for Low-Resource Relation Extraction Extraction
论文核心
对于模型在无标注数据集的预测结果,根据预测概率分为3部分,置信度比较高,置信度中等的和置信度较低的。对于置信度较高的部分,可以认为和人工标注数据集相同,质量可观。对于置信度中等的部分,论文中的创新点是这部分怎么使用的问题?
着重于模糊集,并提出了一种利用模糊实例和有把握的实例来改进低资源RE系统的方法。
存在问题:1)如何识别模棱两可的实例的候选标签;2)如何用模棱两可的实例训练一个新模型
总体感觉,还是在于如何讲好一个故事。
任务形式:小样本关系分类任务。
模型结构
使用自训练方式,self training,利用人工标注数据训练一个teacher model,让labeled data 和置信度高的data训练一个student model。
文章的不同是在于使用confident data和ambiguous data训练一个student model。
如图2所示,常用的自我训练的流程是按以下步骤进行的。(1) 使用人类标注的数据来训练教师模型;(2)
使用教师模型对未标注的数据进行标签预测;(3)
通过预先定义的概率阈值(在第2.2节中描述)选择有把握的自动标注实例,其余为不确定的实例;(4)
结合有把握的自动标注数据和人类标注的数据来训练学生模型(图2中红色虚线矩形)。
关系抽取
1 labeled data and confidence data
(‘[E1]头部实体[/E1]‘和’[E2]尾部实体[/E2]’)被插入到输入标记中以包住实体。具体来说,两个起始实体标记(‘[E1]‘和’[E2]’)的输出表示被串联起来作为实体的表示
损失函数:交叉熵
2 模糊数据集
模糊数据集的构建:
看下就能看懂,不难。
模糊数据集的训练:使用的是negtive training的方式,
虽然不能保证是哪个类别,但一定一个保证不属于哪个类别。构建负例样本,采用的那个概率最低的类别作为负例。
标签体系:采用软标签,partial label,概率最低的label为反标签,之后,概率相当的标签作为正标签。
损失函数:交叉熵
联合训练
统一labeled data和人工标注数据集&模糊数据集(反向训练)的训练任务:
z-p是绝对值。
奇怪,数据集没有在fewrel上做。
怎么吧故事讲好呢?
小样本关系分类:STAD: Self-Training with Ambiguous Data for Low-Resource Relation Extraction Extraction相关推荐
- IJCAI 2022 | 基于自适应虚词增强的小样本逆关系分类
©作者 | 窦春柳 单位 | 天津大学 来源 | 开放知识图谱 论文标题: Function-words Adaptively Enhanced Attention Networks for Few- ...
- 论文浅尝 - IJCAI2022 | 基于自适应虚词增强的小样本逆关系分类
论文作者:窦春柳,天津大学,研究方向:知识图谱 论文链接:http://arxiv.org/abs/2204.12111 代码地址:https://github.com/DOU123321/FAEA- ...
- 【论文】Awesome Relation Classification Paper(关系分类)(PART II)
0. 写在前面 上一篇[论文]Awesome Relation Extraction Paper(关系抽取)(PART I)介绍了一些关系抽取和关系分类方面的经典论文,主要是以CNN模型为主,今天我们 ...
- NLP-信息抽取-关系抽取-2016:Attention-BiLSTM实体关系分类器【基于双向LSTM及注意力机制的关系分类】【数据集:SemEval-2010 Task 8】
<原始论文:Attention-based bidirectional long short-term memory networks for relation classification&g ...
- ICML2020 | 基于贝叶斯元学习在关系图上进行小样本关系抽取
今天给大家介绍来自加拿大蒙特利尔大学Mila人工智能研究所唐建教授课题组在ICML2020上发表的一篇关于关系抽取的文章.作者利用全局关系图来研究不同句子之间的新关系,并提出了一种新的贝叶斯元学习方法 ...
- 论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类
论文笔记整理:余海阳,浙江大学硕士,研究方向为知识图谱.自然语言信息抽取. 链接:https://www.aaai.org/Papers/AAAI/2019/AAAI-GaoTianyu.915.pd ...
- (42)根据时钟关系分类时钟
(42)根据时钟关系分类时钟 1 文章目录 1)文章目录 2)时序约束引言 3)FPGA时序约束课程介绍 4)根据时钟关系分类时钟 5)技术交流 6)参考资料 2 时序约束引言 1)什么是静态时序分析 ...
- 知识图谱问答 | (3) 关系分类概述
本篇博客主要基于微软亚洲研究院段楠老师的<智能问答>第三章 关系分类 进行整理. 1. 简介 给定一段自然语言文本以及该文本中出现的若干实体(e1,...,en)(e_1,...,e_n) ...
- 译文:Relation Classification via Multi-Level Attention CNNs 使用多层级attention机制的CNN进行关系分类
通过多层面的attention CNN的关系分类 原文:Relation Classification via Multi-Level Attention CNNs http://eprints.bi ...
最新文章
- hive 使用技巧笔记
- ORA-12518,TNS:listener could not hand off client connection
- hdu 6112 今夕何夕
- php实现网站插件机制的方法
- python plot画图_Python进阶之Matplotlib入门(四)
- Oracle 数据库安装教程(11g)
- 技术自查番外篇六:死锁及解决办法
- 查询IP所在区段(C#)
- flume(三):常见source、channel和sink总结
- [读史思考] 魏王真的被张仪忽悠瘸了吗?
- 利用单片机最小系统外接DS12C887 在LCD1602上显示实时时钟
- 未来数字科技趋势分析与前沿热点解读
- git branch 和 git checkout -b 创建新brach的区别
- **旗舰店服务器迁移方案
- uniapp入门学习
- 小程序如何租用云服务器,开发小程序怎样租用云服务器
- 这几种常见的保护电路,你都了解吗?
- 机器视觉让工业生产实现智能化
- 在Jetson TK1上安装ROS(机器人操作系统)
- 基于 Quasar和JAVA的开源可视化展示系统
热门文章
- 路由追踪程序traceroute/tracert分析与科普
- 初识Scrapy之再续火影情缘
- 计算机毕业设计Python+djang的小区疫情防控系统(源码+系统+mysql数据库+Lw文档)
- [附源码]JAVA毕业设计实验室耗材管理系统(系统+LW)
- Ubuntu 修改默认 Python版本
- c语言中1 3.0,1.4.1 先看Turbo C/C++ 3.0(3)
- Excel和XML的相互转换(JAVA语言)
- Unity3d C# 实现纯鼠标平滑控制场景摄像头(相机)实现自由旋转、移动和围绕节点移动旋转等功能(含源码工程)
- 中欧基金窦玉明:资管机构进阶之道
- 安卓Android调用C语言实现其他进程应用app的内存变量读取修改与利用BusyBox实现应用暂停和恢复(Native层)