1.ner问题

1.在目标域没有手工标记的数据时,NER怎么进行问题?

2.研究的目标域因为没有标注数,不可作迁移学习?

1.提出弱监督方案;依赖于广泛的标签函数来自动注释目标域的文本,然后使用Markov模型把这些标签整合在一起,把整合后的标注送入到最终的NER模型进行识别。做实验在实体层次上有7个百分点的提升。

2.提出ws在没有标签数据的情况下去bootstrap(提升)NER模型;这个方法主要是依赖标注函数去标注,然后通过考虑标注的准确性与混淆性使用HMM模型统一这些带有noise的标签,最后再采用最终的模型去进行训练

1. NER的广泛的标签函数集合,包括在不同文本领域上训练的神经模型、地名 词典、启发式函数和文档级约束。

2. 一种新的弱监督模型,适合于序列标签任务,并能够包括概率标签预测。

3. 标签函数和聚合模型开源

2.相关工作

2.1 无监督域自适应

无监督域适应试图调整来自源域的知识来预测通常具有本质上不同特征的目标域中的新实例。

方法:

使用pivots调整特征空间(SCL)

代维转换特征空间

划分成一般与域特征

多任务

基于域自适应的微调

2.2 聚合的注释

聚合来自多个来源的注释的方法在很大程度上集中于来自众包注释的嘈杂数据,Kim和Ghahramani(2012)的贝叶斯分类器组合方法使用预测的线性组合将多个独立分类器组合在一起。提出了一种基于条件随机场(crf)的模型参数学习方法。Nguyen等人(2017b)提出了一种隐马尔可夫模型(Hidden Markov Model)来聚合大众来源的序列标注,并发现显式地对标注器建模可以改进POS- tagging和NER。最后,Simpson和Gurevych(2019)提出了一种完全贝叶斯方法来处理聚合多个序列标注的问题,使用变分EM来计算模型参数的后向分布。

2.3 弱监督

远程监督

Snorkel 框架

深度概率逻辑:间接监督的统一框架

Swellshark

2020 - 噪声规则中的弱监督序列标记

2.4 集成学习

bagging, boosting and random forests

3.方法模型

3.1 Labelling functions – 标注函数

域外模型:使用已有的标注数据中进行训练模型,来自于四个数据(Ontonotes, CoNLL 2003,Broad Twitter Corpus, NER-annotated corpus of SEC filings)。

这些模型都是由biLSTM+CRF的模型训练出来的;

Gazetteers:Wikipedia,Geonames,Crunchbase Open Data Map, DBPedia

Heuristic functions(启发式): 每个函数专门识别特定类型的命名实体。例如 日期、时间、金额、百分比和基数/序号值这些特殊实体,是由专门的启发式来处理。

Document-level relations: 引入一个标签函数来捕获文档中的标签一致性约束;

3.2 Aggregation model

HMM模型。

为了确保更快的收敛,我们引入了一个新的约束到似然函数:对于每个标记位置i,对应的潜在标签si必须在至少一个标签函数中具有非零概率(否则该标签在该位置的可能性被设置为零)。换句话说,如果一个标签由至少一个标签函数产生,那么聚合模型只会预测一个特定的标签。这个简单的约束使EM收敛,因为它在每个时间步长的状态空间限制为几个可能的标签。

3.3 Sequence labelling model

一旦对来自目标域的文档的标签功能进行聚合,我们就可以在统一的注释上训练序列标签模型,而不会对使用的模型类型施加任何限制。为了利用潜在标签上的后边缘分布p̃s,优化应设法使p̃s的预期损失最小化:

式中hθ(·)为序列标记模型的输出。这相当于最小化神经模型输出和聚集模型产生的概率标签之间的交叉熵误差。

4.实验

数据集

CoNLL 2003,Reuters & Bloomberg

结果

15:Named Entity Recognition without Labelled Data: A Weak Supervision Approach相关推荐

  1. Named Entity Recognition without Labelled Data:A Weak Supervision Approach论文详读

    Named Entity Recognition without Labelled Data: A Weak Supervision Approach 无标记数据的命名实体识别:一种弱监督方法 创新点 ...

  2. Raki的读paper小记:Named Entity Recognition without Labelled Data: A Weak Supervision Approach(半成品)

    Abstract & Introduction & Related Work 研究任务 无标注数据NER学习 已有方法和相关工作 Unsupervised domain adaptat ...

  3. [论文阅读笔记44]Named Entity Recognition without Labelled Data:A Weak Supervision Approach

    一,题目 Named Entity Recognition without Labelled Data:A Weak Supervision Approach 无标记数据的命名实体识别: 一种弱监督方 ...

  4. 复现:Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data

    信达雅的原则: 数据->模型->训练. Named Entity Recognition with Small Strongly Labeled and Large Weakly Labe ...

  5. 论文:Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data

    Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data 目录 Named Entity R ...

  6. ACL21 - Named Entity Recognition with Small Strongly Labeled and Large Weakly Labeled Data

    Jiang H, Zhang D, Cao T, et al. Named Entity Recognition with Small Strongly Labeled and Large Weakl ...

  7. 【论文笔记-NER综述】A Survey on Deep Learning for Named Entity Recognition

    本笔记理出来综述中的点,并将大体的论文都列出,方便日后调研使用查找,详细可以看论文. 神经网络的解释: The forward pass com- putes a weighted sum of th ...

  8. TENER: Adapting Transformer Encoder for Named Entity Recognition 笔记

    TENER: Adapting Transformer Encoder for Named Entity Recognition Abstract(摘要) 1 Introduction(介绍) 2 R ...

  9. MRC Framework for Named Entity Recognition【代码解读】

    一.预备知识 介绍文章 A Unified MRC Framework for Named Entity Recognition[文章学习]:https://blog.csdn.net/qq_1694 ...

最新文章

  1. 面试官:讲讲Spring框架Bean的加载过程
  2. 安装Maltego默认插件
  3. mysql 改变枚举值_mysql 改变数据类型为枚举不成功?
  4. 阿里大规模业务混部下的全链路资源隔离技术演进
  5. php 实体转html,PHP 转HTML标签为实体, 把实体html标签转为,过滤html标签 | 学步园...
  6. 诺奖经济学家:中国与世界可找到差异化空间推动合作共赢
  7. C# 中是否支持 Like 和 ln 条件的参数化查询 ?
  8. flume linux 命令,Linux环境Flume安装配置及使用
  9. 弹性屋顶涂料行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)
  10. vs visual stdio 调试 显示指针为数组
  11. NbPreferences使用用户首选项时要注意的问题
  12. 20个Android游戏源码,…
  13. LVDS信号与TTL信号
  14. LCD自适应LED背光控制技术
  15. 分布式应用之分布式缓存
  16. 如何通过软件实现自动阶梯计电梯费
  17. jspssh健身房会员卡信息管理系统
  18. 利用Django框架简单设计一个登陆页面
  19. OSDI2020:Delos中的虚拟共识
  20. 推荐算法(推广搜)——广告和推荐有什么不同?

热门文章

  1. 图解B+树并和B-树特点对比总结
  2. [附源码]Nodejs计算机毕业设计金牛社区疫情防控系统Express(程序+LW)
  3. 渝首家跨国“威客”登陆美国
  4. 硬盘分类(HDD、HHD、SSD)简介
  5. SpringBoot+vue前后端分离博客项目
  6. VIJOS-P1078 松鼠吃果子
  7. 技术从业者的未来(2)
  8. MATLAB第2次作业,matlab作业二
  9. shell root切换oracle_细说Shell脚本(一)
  10. 行业大咖齐聚鹏城 八大峰会打造2021深圳国际全触与显示展“新名片”