Raki的读paper小记:Soft Gazetteers for Low-Resource Named Entity Recognition
Abstract & Introduction & Related Work
- 研究任务
低资源的命名实体识别 - 已有方法和相关工作
- 将基于语篇标签、词形和手动创建的实体列表(称为地名索引)的语言学特征整合到神经模型中会导致 在英语数据上实现更好的NER
- 面临挑战
- 但直接将地名词典特征整合到这些模型中是很困难的,因为这些语言的地名词典要么覆盖范围有限,要么完全没有。由于缺乏可用的低资源语言的注释者,扩展它们既费时又费钱。
- 创新思路
- 引入了soft-gazetteers,一种基于高资源语言和大型英语知识库的现成数据来创建连续值的地名录特征的方法
- 使用了实体连接方法
- 实验结论
我们的实验证明了我们提出的软地名词典特征的有效性,在四种低资源语言中,平均比baseline提高了4个F1点。四种语言分别为:基尼亚卢旺达语、奥罗莫语、僧伽罗语和提格里尼亚语(什么牛马语言?)
Binary Gazetteer Features
二元地名录特征是用来指示对应的n-gram是否在地名录中出现
Entity Linking
实体链接(EL)是将命名实体的mention与其在结构化知识库(KB)中的相应条目联系起来的任务(Hachey等人,2013)。例如,将提到的实体 "火星 "与维基百科的条目联系起来。在大多数实体链接系统中(Hachey等人,2013年;Sil等人,2018年),第一步是筛选出候选的KB条目,这些条目由实体消歧算法进一步处理。候选检索方法,一般来说,也会根据输入的mention对每个候选结果进行评分
Soft Gazetteer Features
为低资源语言创建地名录是很困难的,我们提出一种软地名录,对比特定的指定地名录特征的值为0或1,软地名录是连续的,其值介于0到1之间
对于每一个span,我们假设有实体链接抽取方法返回一系列候选的结构化知识库,并对候选结果进行评分排名
尝试用不同的方式,候选名单来生成特征向量:
- 只选top1
- 选top3,三个特征向量
- 对于top3,判断跟候选类型t是否一致
- 计算前30名候选人的类型计数
- 计算连续两种得分间的差距
我们通过拼接这些特征的各自向量来试验这些特征的不同组合。连接后的向量通过一个具有tanh非线性的全连接神经网络层,然后用于NER模型中
Named Entity Recognition Model
增加一个自动编码器来重构手工制作的特征会导致NER性能的提高。自动编码器将BiLSTM的隐藏状态作为输入到一个具有sigmoid激活函数的全连接层,并重建了特征。这迫使BiLSTM保留来自特征的信息。软地名词典特征重建的交叉熵损失是自动编码器的目标,LAEL_{AE}LAE
训练损失是 CRF和自编码器的loss的综合
Experiments
Methods
Soft gazetteer methods
我们试验了为低资源语言设计的不同的候选检索方法。这些方法只用维基百科的小型双语词典进行训练,其规模与地名词典相似
- WIKIMEN:WikiMention方法被用于几个最先进的EL系统中,其中,双语维基百科的链接被用来检索适当的英文KB候选
- Pivot-based-entity-linking:这种方法使用n-gram神经嵌入法(Wieting等人,2016)在字符层面对实体提及进行编码,并计算其与KB条目的相似性。我们用两个变体进行实验,并遵循Zhou等人(2020)的超参数选择。
1)PBELSUPERVISED:根据目标低资源语言中的少量双语维基百科链接进行训练。
2)PBELZERO:在一些高资源语言(“支点”)上训练,并以零起点的方式转移到目标语言上。我们使用的转移语言是斯瓦希里语用于基尼亚卢旺达语,印度尼西亚语用于奥罗莫语,印地语用于僧伽罗语,以及阿姆哈拉语用于提格雷语
Oracles
作为准确率的上限,我们与两个人为的强大系统进行比较。
- ORACLEEL:对于软地名词典,我们假设完美的候选检索,如果提及的内容不是NIL,则总是返回正确的KB条目作为首要候选。
- ORACLEGAZ:我们通过在地名词典中增加所有的命名实体来人为地增加BINARYGAZ的容量。我们的数据集中的所有命名的实体。
Conclusion
我们提出了一种为低资源NER创建特征的方法,并在四种低资源语言上展示了其有效性。未来可能的方向包括使用更复杂的特征设计和候选检索方法的组合
Remark
模型很简单,这个软地名录方法感觉有点小复杂(
总之还行
Raki的读paper小记:Soft Gazetteers for Low-Resource Named Entity Recognition相关推荐
- Raki的读paper小记:OFA: UNIFYING ARCHITECTURES, TASKS, AND MODALITIES THROUGH A SIMPLE Seq2Seq FRAMEWORK
Abstract&Introduction&Related Work 研究任务 多模式预训练的统一范式 包括图像生成.visual-grounding(visual grounding ...
- Raki的读paper小记:Prompting ELECTRA: Few-Shot Learning with Discriminative Pre-Trained Models
Abstract&Introduction&Related Work 研究任务 基于提示学习的ELECTRA 已有方法和相关工作 ELECTRA 面临挑战 基于判别模型的预训练模型的f ...
- Raki的读paper小记:Named Entity Recognition without Labelled Data: A Weak Supervision Approach(半成品)
Abstract & Introduction & Related Work 研究任务 无标注数据NER学习 已有方法和相关工作 Unsupervised domain adaptat ...
- Raki的读paper小记:Image as a Foreign Language: BEIT Pretraining for All Vision and Vision-Language Tasks
Abstract&Introduction&Related Work 研究任务 语言+视觉模态预训练任务 已有方法和相关工作 masked data已经成为一种主流 面临挑战 现有的多 ...
- Raki的读paper小记:Forget-free Continual Learning with Winning Subnetworks
Abstract&Introduction&Related Work 研究任务 用子网络做CL 已有方法和相关工作 彩票假说(LTH)证明了稀疏子网络(称为中奖彩票)的存在,这些子网络 ...
- Raki的读paper小记:Neuro-Inspired Stability-Plasticity Adaptation for Continual Learning in Sparse Nets
Abstract&Introduction&Related Work 研究任务 Continual Learning 已有方法和相关工作 面临挑战 创新思路 利用持续学习过程中的持续稀 ...
- Stetman读paper小记:ATTEQ-NN
注:本周笔者阅读了龚雪鸾.陈艳娇的文章ATTEQ-NN:Attention-based QoE-aware Evasive Backdoor Attacks.本文讲了作者设计的一种基于注意力机制的后门 ...
- Stetman读paper小记:BackdoorBench - A Comprehensive Benchmark of Backdoor Learning
之前因为参与了实验室后门攻击的项目,阅读了一下这篇关于后门学习的综合性基准测试的研究工作,在此记录一下学习笔记与心得. 1 摘要 这篇文章介绍了一个名为BackdoorBench的基准测试,用于评估后 ...
- Named Entity Recognition without Labelled Data:A Weak Supervision Approach论文详读
Named Entity Recognition without Labelled Data: A Weak Supervision Approach 无标记数据的命名实体识别:一种弱监督方法 创新点 ...
- 【不想读paper的时候看看】阅读文献?
[不想读paper的时候看看]为何阅读文献? 最近看了中国科学院大学(国科大/果壳)图书馆对我们一年级集中教学的同学关于图书馆资源与服务的培训PPT,截取了一些较有感触的slides做一下笔记. 1. ...
最新文章
- 第三部分 基本类型:第16章 数组
- 8.STM32中对ADC1_Config()函数(ADC1_GPIO_Config()和ADC1_Mode_Config())的理解(自定义)测试ADC转换电压值输出到终端上。
- Android 获取 AudioRecord 麦克风音量大小并做选择性发送
- 三、Git多人开发:不同人修改了同文件的不同区域如何处理
- python合并pdf 加书签_Python生成pdf目录书签的实例方法
- linux修改python默认版本
- 标签页 html实现,htmlcssjs实现tab标签页示例代码.pdf
- HttpClient读取数据乱码的解决方案
- 手机怎么打开html游戏,网页游戏打不开怎么解决 网页游戏打不开解决方法
- linux7 iperf,CentOS 7下安装Iperf
- 信鸽 ios tag推送 php,信鸽推送集成
- 如何使用linux command line 利用Entrez Direct下载NCBI数据
- Excel 组及分级显示制作教程
- 3rd TMA大数据营销案例征集赛正式启动,报名ing!
- 网易邮箱添加html,在网易邮箱中实行添加标签窗口的详细步骤
- 计算机 存储体 存储单元 存储元 存储字 存储字长的联系
- A2DP音频流在安卓系统中的实现
- “血洗”Twitter,“杀疯了”的马斯克究竟想干啥?
- ZEMAX常用操作数及常见用法(更新中。。。)
- 手机软件升级文件如何恢复
热门文章
- 摩托罗拉里程碑2刷android 2.3.4
- 初步解决网同客户端升级后局域网不能上网的问题
- Deepin 的远程连接
- python根据关键词下载图片_python批量下载PPT图片,看完本代码你也会批量下载图片...
- java实验十三io_Java语言基础13—IO
- python脚本画pie饼图_小白学Python(11)——pyecharts,绘制饼图 Pie
- python大牛基础_十年Python大牛总结的python基础知识实例,快收藏!
- linux pci带宽,Linux查看PCIe版本及速率
- Python入门经典(2K超清)
- ue4服务器稳定性,ue4 客户端 服务器