点击上方,选择星标置顶,每天给你送干货

阅读大概需要7分钟

跟随小博主,每天进步一丢丢

作者:习翔宇

https://zhuanlan.zhihu.com/p/35789254

在自然语言处理中,从分析技术上可以分为下面三种

  • 词法分析 lexical analysis

  • 句法分析 syntactic parsing

  • 语义分析 semantic parsing

其中语义分析是指将自然语言句子转化为反映这个句子语义的形式化表达。例如

  1. 我吃了一块肉

  2. 一块肉被我吃了

在语义上都表示为吃(我,肉)的意思,但句子结构却有不同。

句子的语义分析是对句子处理技术更高一级的要求,在信息检索、信息抽取、自动文摘等应用广泛。


1. SRL定义

Semantic Role Labeling (SRL) is defined as the task to recognize arguments for a given predicate and assign semantic role labels to them.

语义角色标注是一种浅层语义分析技术,以句子为单位,分析句子的谓词-论元结构,其理论基础来源于Fillmore(1968)年提出的格语法,不对句子所包含的语义信息进行深入分析。具体来说,语义角色标注的任务就是以句子的谓词为中心,研究句子中各成分与谓词之间的关系,并且用语义角色来描述他们之间的关系。例如如下所示

SRL实例

这个句子中包括:

  1. 谓词 “发表”

  2. 施事 “奥巴马”

  3. 受事 “演说”

  4. 时间 “昨晚”

  5. 地点 “在白宫”

语义角色标注就是要针对句子中的(核心)谓词来确定其他论元以及其他论元的角色。


2. 语料及语义角色

英文的SRL数据集包括:

  1. FrameNet

  2. PropBank

汉语的SRL数据集较少,应用最多的是Chinese Proposition Bank(CPB)[1].

The goal of the Chinese Proposition Bank project is to create a corpus of text annotated with information about basic semantic propositions. Predicate-argument relations are being added to the syntactic trees of the Chinese Treebank.

其中成分包括三种:

  • 谓词是整个句子的核心词,一般是动词或者形容词;

  • 核心论元表示跟这个谓词直接相关的论元,用ArgN来表示,

  • Semantic Adjuncts表示不与谓词直接相关的论元,可独立存在,用ArgM-XXX来表示,例如时间、地点、目的、程度、范围等等;

SRL语义角色标签和含义如下所示

标记语料举例如下所示:


3. 传统SRL方法

传统SRL方法主要包括以下步骤:

其中:

  • 候选论元剪除指从句子中剪除掉不可能成为论元的词,通常采用基于规则的方法,例如遍历语法树、句法依存树等方法;

  • 论元识别,指从候选论元中识别出所有属于该谓词的论元,一般看作二值分类问题,采用SVM或者最大熵分类等方法;

  • 论元标注,指对识别出的论元赋予语义角色,一般看作多值分类问题;

  • 后处理,指对标注结果进行进一步处理,例如删除语义重复的论元等。

在论元识别和论元分类中,都是看作了分类问题来进行求解,在论元识别和论元标注中的特征往往不同,主要包括以下内容:

  • 谓词

  • 路径

  • 短语类型

  • 位置

  • 语态

  • 中心词

  • 从属关系

  • 论元的第一个和最后一个词

  • 组合特征

  • ……

传统SRL方法的不足包括以下内容:

  • Firstly, performances are heavily dependent on feature engineering, which needs domain knowledge and laborious work of feature extraction and selection. (性能依赖于特征工程,需要领域知识和大量的特征提取工作)

  • Secondly, although sophisticated features are designed, the long-range dependencies in a sentence can hardly be modeled. (没有特征能够表示长距离的依赖关系)

  • Thirdly, a specific annotated dataset is often limited in its scalability, but the existence of heterogenous resource, which has very different semantic role labels and annotation schema but related latent semantic meaning, can alleviate this problem. However, traditional methods cannot relate distinct annotation schemas and introduce heterogeneous resource with ease.(无法引入异构资源来解决数据不足的问题)


4. 基于深度学习的SRL方法

在深度学习占领了自然语言处理领域之后,基于深度学习的SRL方法也得到了广泛应用且效果良好。

例如Zhen Wang[2]等人提出了采用双向RNN的方法来进行中文语义角色标注,网络结构如下所示:

Feng Qian[3]提出将dependency tree structure通过architecture engineering的方法(而非feature engineering的方法)放入到LSTM cell中,能够充分利用句子的句法依存结果提高结果,网络结构如下所示。

Reference

  • http://verbs.colorado.edu/chinese/cpb/

  • Wang Z, Jiang T, Chang B, et al. Chinese semantic role labeling with bidirectional recurrent neural networks[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing. 2015: 1626-1631.

  • Qian F, Sha L, Chang B, et al. Syntax Aware LSTM model for Semantic Role Labeling[C]//Proceedings of the 2nd Workshop on Structured Prediction for Natural Language Processing. 2017: 27-32.


方便交流学习,备注:昵称-学校(公司)-方向,进入DL&NLP交流群。

方向有很多:机器学习、深度学习,python,情感分析、意见挖掘、句法分析、机器翻译、人机对话、知识图谱、语音识别等。

记得备注呦

推荐阅读:

【ACL 2019】腾讯AI Lab解读三大前沿方向及20篇入选论文

【一分钟论文】IJCAI2019 | Self-attentive Biaffine Dependency  Parsing

【一分钟论文】 NAACL2019-使用感知句法词表示的句法增强神经机器翻译

【一分钟论文】Semi-supervised Sequence Learning半监督序列学习

【一分钟论文】Deep Biaffine Attention for Neural Dependency Parsing

详解Transition-based Dependency parser基于转移的依存句法解析器

经验 | 初入NLP领域的一些小建议

学术 | 如何写一篇合格的NLP论文

干货 | 那些高产的学者都是怎样工作的?

一个简单有效的联合模型

近年来NLP在法律领域的相关研究工作


让更多的人知道你“在看”

【NLP】语义角色标注(Semantic Role Labelling)相关推荐

  1. 语义角色标注 Semantic Role Labeling(SRL) 初探(整理英文tutorial)

    语义角色标注 本文链接 最近调研了一下语义角色标注,记录如下 将语言信息结构化,方便计算机理解句子中蕴含的语义信息. 语义角色标注 (Semantic Role Labeling, SRL) 是一种浅 ...

  2. 自然语言处理基础技术之语义角色标注

    今天是总结nlp基础技术的最后一篇,后面开始工具实战篇,我觉得实践对新手小白入门是相当有帮助的~~ #语义角色标注定义: 维基百科定义:Semantic role labeling, sometime ...

  3. 自然语言处理(NLP)之pyltp的介绍与使用(中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注)

    pyltp的简介   语言技术平台(LTP)经过哈工大社会计算与信息检索研究中心 11 年的持续研发和推广, 是国内外最具影响力的中文处理基础平台.它提供的功能包括中文分词.词性标注.命名实体识别.依 ...

  4. NLP知识包--语义分析-语义角色标注

    源于文本分析课程 语义分析 自然语言处理层次(从下到上)(层次是固定的吗?这样的层次对NLP研究有什么帮助?) 语用分析 语义分析 句法分析 词法分析 语音分析 语义分析 目标:信息检索.自动问答.填 ...

  5. 语义角色标注视为依存句法分析任务:探索论元内部的隐式树结构

    ©作者 | 张宇 单位 | 苏州大学博士生 研究方向 | 句法分析/语义分析 语义角色标注(SRL)是 NLP 中一个基础且重要的任务,主要涉及谓词和论元的识别,以及相应的角色标签标注等等. 最近主流 ...

  6. 什么是语义角色标注?

    01 定义 先来看看语义角色标注在维基百科上的定义:Semantic role labeling, sometimes also called shallow semantic parsing, is ...

  7. 基于飞桨PaddlePaddle的语义角色标注任务全解析

    https://www.toutiao.com/a6706071441667785219/ 2019-06-24 20:22:10 自然语言处理中的自然语言句子级分析技术,可以大致分为词法分析.句法分 ...

  8. 基于依存句法与语义角色标注的事件抽取项目

    EventTriplesExtraction 项目地址:https://github.com/liuhuanyong/EventTriplesExtraction EventTriplesExtrac ...

  9. 人工智能 - paddlepaddle飞桨 - 深度学习基础教程 - 语义角色标注

    语义角色标注 本教程源代码目录在book/label_semantic_roles,初次使用请您参考Book文档使用说明. 说明¶ 本教程可支持在 CPU/GPU 环境下运行 Docker镜像支持的C ...

  10. PaddlePaddle︱开发文档中学习情感分类(CNN、LSTM、双向LSTM)、语义角色标注

    PaddlePaddle出教程啦,教程一部分写的很详细,值得学习. 一期涉及新手入门.识别数字.图像分类.词向量.情感分析.语义角色标注.机器翻译.个性化推荐. 二期会有更多的图像内容. 随便,帮国产 ...

最新文章

  1. bzoj 2190: [SDOI2008]仪仗队 线性欧拉函数
  2. springMVC如何接收和发送json数据对象
  3. sqlldr 导入乱码,Oracle客户端字符集问题
  4. 使用.NET Core 3.1构建Windows Worker服务以删除文件夹中的旧文件
  5. c++成员声明中的非法限定名_new 一个对象有哪两个过程?很多人在面试中都问住了...
  6. 推荐一个CSLab------英真时代(非广告,真心的)
  7. S3C2440 LCD驱动(FrameBuffer)实例开发一(转)
  8. php如何获取li标签中的值,多个 (li) 标签如何获取获取选中的里面的某个特定值??...
  9. 计算机网络-01-计算机网络体系结构
  10. Web渗透测试-实战 方法 思路 总结
  11. 自定义竖着的SeekBar
  12. 百度祝恒书:百度智能招聘技术和应用实践
  13. Java如何打印输出九九乘法表
  14. linux运行getch吗,在linux中使用getch()函数
  15. 树莓派 MFRC522 读取
  16. Python-可变和不可变类型
  17. socket 配置选项 理解 socket errorno 情况收集
  18. Python装逼指南——五行代码实现批量抠图
  19. 如何找到 java 程序 CPU 使用率100%的原因
  20. discuz手机论坛模板 discuz!超简约手机论坛模板

热门文章

  1. Python 安装 lxml 插件
  2. Studio for WPF:使用 C1TileView 创建图片库
  3. 关于PHP你可能不知道的10件事
  4. python-unittest学习2--生成报告
  5. SonarLint插件的安装与使用
  6. 基于Wi-Fi的HID注射器,利用WHID攻击实验
  7. Linux 怎么重启 mysql
  8. C编程语言中16位整型数据的取值范围介绍
  9. LC-130 被环绕区域
  10. VMD的相关命令(转载)