论文核心

对于模型在无标注数据集的预测结果,根据预测概率分为3部分,置信度比较高,置信度中等的和置信度较低的。对于置信度较高的部分,可以认为和人工标注数据集相同,质量可观。对于置信度中等的部分,论文中的创新点是这部分怎么使用的问题?

着重于模糊集,并提出了一种利用模糊实例和有把握的实例来改进低资源RE系统的方法。

存在问题:1)如何识别模棱两可的实例的候选标签;2)如何用模棱两可的实例训练一个新模型

总体感觉,还是在于如何讲好一个故事。

任务形式:小样本关系分类任务。

模型结构

使用自训练方式,self training,利用人工标注数据训练一个teacher model,让labeled data 和置信度高的data训练一个student model。

文章的不同是在于使用confident data和ambiguous data训练一个student model。

如图2所示,常用的自我训练的流程是按以下步骤进行的。(1) 使用人类标注的数据来训练教师模型;(2)
使用教师模型对未标注的数据进行标签预测;(3)
通过预先定义的概率阈值(在第2.2节中描述)选择有把握的自动标注实例,其余为不确定的实例;(4)
结合有把握的自动标注数据和人类标注的数据来训练学生模型(图2中红色虚线矩形)。

关系抽取

1 labeled data and confidence data

(‘[E1]头部实体[/E1]‘和’[E2]尾部实体[/E2]’)被插入到输入标记中以包住实体。具体来说,两个起始实体标记(‘[E1]‘和’[E2]’)的输出表示被串联起来作为实体的表示

损失函数:交叉熵

2 模糊数据集

模糊数据集的构建:
看下就能看懂,不难。

模糊数据集的训练:使用的是negtive training的方式,
虽然不能保证是哪个类别,但一定一个保证不属于哪个类别。构建负例样本,采用的那个概率最低的类别作为负例。

标签体系:采用软标签,partial label,概率最低的label为反标签,之后,概率相当的标签作为正标签。

损失函数:交叉熵

联合训练

统一labeled data和人工标注数据集&模糊数据集(反向训练)的训练任务:
z-p是绝对值。


奇怪,数据集没有在fewrel上做。

怎么吧故事讲好呢?

小样本关系分类:STAD: Self-Training with Ambiguous Data for Low-Resource Relation Extraction Extraction相关推荐

  1. IJCAI 2022 | 基于自适应虚词增强的小样本逆关系分类

    ©作者 | 窦春柳 单位 | 天津大学 来源 | 开放知识图谱 论文标题: Function-words Adaptively Enhanced Attention Networks for Few- ...

  2. 论文浅尝 - IJCAI2022 | 基于自适应虚词增强的小样本逆关系分类

    论文作者:窦春柳,天津大学,研究方向:知识图谱 论文链接:http://arxiv.org/abs/2204.12111 代码地址:https://github.com/DOU123321/FAEA- ...

  3. 【论文】Awesome Relation Classification Paper(关系分类)(PART II)

    0. 写在前面 上一篇[论文]Awesome Relation Extraction Paper(关系抽取)(PART I)介绍了一些关系抽取和关系分类方面的经典论文,主要是以CNN模型为主,今天我们 ...

  4. NLP-信息抽取-关系抽取-2016:Attention-BiLSTM实体关系分类器【基于双向LSTM及注意力机制的关系分类】【数据集:SemEval-2010 Task 8】

    <原始论文:Attention-based bidirectional long short-term memory networks for relation classification&g ...

  5. ICML2020 | 基于贝叶斯元学习在关系图上进行小样本关系抽取

    今天给大家介绍来自加拿大蒙特利尔大学Mila人工智能研究所唐建教授课题组在ICML2020上发表的一篇关于关系抽取的文章.作者利用全局关系图来研究不同句子之间的新关系,并提出了一种新的贝叶斯元学习方法 ...

  6. 论文浅尝 | 混合注意力原型网络的含噪音少样本的关系分类

    论文笔记整理:余海阳,浙江大学硕士,研究方向为知识图谱.自然语言信息抽取. 链接:https://www.aaai.org/Papers/AAAI/2019/AAAI-GaoTianyu.915.pd ...

  7. (42)根据时钟关系分类时钟

    (42)根据时钟关系分类时钟 1 文章目录 1)文章目录 2)时序约束引言 3)FPGA时序约束课程介绍 4)根据时钟关系分类时钟 5)技术交流 6)参考资料 2 时序约束引言 1)什么是静态时序分析 ...

  8. 知识图谱问答 | (3) 关系分类概述

    本篇博客主要基于微软亚洲研究院段楠老师的<智能问答>第三章 关系分类 进行整理. 1. 简介 给定一段自然语言文本以及该文本中出现的若干实体(e1,...,en)(e_1,...,e_n) ...

  9. 译文:Relation Classification via Multi-Level Attention CNNs 使用多层级attention机制的CNN进行关系分类

    通过多层面的attention CNN的关系分类 原文:Relation Classification via Multi-Level Attention CNNs http://eprints.bi ...

最新文章

  1. hive 使用技巧笔记
  2. ORA-12518,TNS:listener could not hand off client connection
  3. hdu 6112 今夕何夕
  4. php实现网站插件机制的方法
  5. python plot画图_Python进阶之Matplotlib入门(四)
  6. Oracle 数据库安装教程(11g)
  7. 技术自查番外篇六:死锁及解决办法
  8. 查询IP所在区段(C#)
  9. flume(三):常见source、channel和sink总结
  10. [读史思考] 魏王真的被张仪忽悠瘸了吗?
  11. 利用单片机最小系统外接DS12C887 在LCD1602上显示实时时钟
  12. 未来数字科技趋势分析与前沿热点解读
  13. git branch 和 git checkout -b 创建新brach的区别
  14. **旗舰店服务器迁移方案
  15. uniapp入门学习
  16. 小程序如何租用云服务器,开发小程序怎样租用云服务器
  17. 这几种常见的保护电路,你都了解吗?
  18. 机器视觉让工业生产实现智能化
  19. 在Jetson TK1上安装ROS(机器人操作系统)
  20. 基于 Quasar和JAVA的开源可视化展示系统

热门文章

  1. 路由追踪程序traceroute/tracert分析与科普
  2. 初识Scrapy之再续火影情缘
  3. 计算机毕业设计Python+djang的小区疫情防控系统(源码+系统+mysql数据库+Lw文档)
  4. [附源码]JAVA毕业设计实验室耗材管理系统(系统+LW)
  5. Ubuntu 修改默认 Python版本
  6. c语言中1 3.0,1.4.1 先看Turbo C/C++ 3.0(3)
  7. Excel和XML的相互转换(JAVA语言)
  8. Unity3d C# 实现纯鼠标平滑控制场景摄像头(相机)实现自由旋转、移动和围绕节点移动旋转等功能(含源码工程)
  9. 中欧基金窦玉明:资管机构进阶之道
  10. 安卓Android调用C语言实现其他进程应用app的内存变量读取修改与利用BusyBox实现应用暂停和恢复(Native层)