NLP工具——Stanza依存关系含义详解

  • 1. 概要
  • 2. 详细介绍
    • 2.1 核心论元
      • 2.1.1 nsubj: nominal subject(名词主语)
      • 2.1.2 obj: object(宾语)
      • 2.1.3 iobj: indirect object(间接宾语)
      • 2.1.4 csubj: clausal subject(从句主语)
      • 2.1.5 ccomp: clausal complement(从句补足语)
      • 2.1.6 xcomp: open clausal complement(开放从句补足语)
    • 2.2 非核心依存
      • 2.2.1 obl: oblique nominal(间接名词)
      • 2.2.2 vocative: vocative(呼格词)
      • 2.2.3 expl: expletive(感叹词)
      • 2.2.4 dislocated: dislocated elements(错位元素)
      • 2.2.5 advcl: adverbial clause modifier(状语从句修饰语)
      • 2.2.6 advmod: adverbial modifier(状语修饰语)
      • 2.2.7 discourse: discourse element(语素)
      • 2.2.8 aux: auxiliary(辅助词)
      • 2.2.9 cop: copula(连接词)
      • 2.2.10 mark: marker(标记词)
    • 2.3 名义依存
      • 2.3.1 nmod: nominal modifier(名词修饰语)
      • 2.3.2 appos: appositional modifier(同位语修饰语)
      • 2.3.3 nummod: numeric modifier(数字修饰语)
      • 2.3.4 acl: clausal modifier of noun (名词的从句修饰语)
      • 2.3.5 amod: adjectival modifier(形容词修饰语)
      • 2.3.6 det: determiner(限定词)
      • 2.3.7 clf: classifier(分类词)
      • 2.3.8 case: case marking(格位标记)
    • 2.4 广义依存关系
      • 2.4.1 conj: conjunct(连词)
      • 2.4.2 cc: coordinating conjunction(协调连词)
      • 2.4.3 fixed: fixed multiword expression(固定多字表达式)
      • 2.4.4 flat: flat multiword expression(扁平多字表达式)
      • 2.4.5 compound: compound(复合表达式)
      • 2.4.6 list: list(列表关系)
      • 2.4.7 parataxis: parataxis(无连词并列)
      • 2.4.8 orphan: orphan(孤立词)
      • 2.4.9 goeswith: goes with(配合词)
      • 2.4.10 reparandum: overridden disfluency(重复非流畅)
      • 2.4.11 other(其他)
  • 3. 速查表

1. 概要

stanza工具是一个基于python的NLP工具,这篇博客主要介绍依存关系中各种关系的含义,如果要了解这个工具的话可以参考其他文章,比如我朋友的这一篇:
https://blog.csdn.net/GodDavide/article/details/105539730

但是我发现他博客中对句法结构关系的介绍是coreNLP的,而非stanza的,所以写这篇博客纠正一下。原网站还挺难找的,并不是在stanza的官网上介绍的,而是引用了另一个工具的帮助文档。

想迅速查找某个依存关系含义的同学可以直接看本文的第三部分,或点击目录快速跳转。


我把这个帮助文档的相关链接也贴出来,中文不好的同学可以直接去看原文档:
https://universaldependencies.org/u/dep/index.html

2. 详细介绍

所有的依存关系可以分为狭义依存和广义依存关系,其中,广义依存关系又可以分为核心论元(Core arguments),非核心依存(Non-core dependents)以及名义依存(Nominal dependents)。

下图中,上半部分是狭义依存关系,下半部分是不包含在狭义概念中的依存关系。


上半表中,纵列为依存的目录分类,依次为名词性(Nominals)、从句(Clauses)、修饰词(Modifier words),以及虚词(Function Words)。下面将对上半表的内容进行详细介绍。

2.1 核心论元

2.1.1 nsubj: nominal subject(名词主语)

名词主语(nsubj)是一个名词,它是句法结构主语,是从句的原型节点(这里的描述均为机翻+人工纠正)。被动语态下的特殊名词主语,被记作 nsubj:pass。直接看文档中给出的例子:

2.1.2 obj: object(宾语)

动词的宾语是动词中仅次于主语的第二大核心论元。

2.1.3 iobj: indirect object(间接宾语)

动词的间接宾语是任何作为动词核心论元的名词短语,但不是其主语或(直接)宾语。

但是,如果只有一个宾语存在,则不论语义分析的结果如何,都会被标记为obj,而非iobj。

2.1.4 csubj: clausal subject(从句主语)

从句主语是一个从句的从句句法主语,即主语本身就是一个从句。

2.1.5 ccomp: clausal complement(从句补足语)

动词或形容词的从句补语是一个从属从句,它是一个核心论元。

2.1.6 xcomp: open clausal complement(开放从句补足语)

动词或形容词的开放从句补足语(xcomp)是没有主语的谓语或从句补足语。

关于ccomp和xcomp的区别,可以看下图,主要在于是否可以将主句和从句完全切分开,前句的boss不一定执行了digging,而后句的we必然是digging的执行者。

2.2 非核心依存

2.2.1 obl: oblique nominal(间接名词)

obl是作为名词(名词、代词、名词短语)非核心的论元附属结构。


当指向被动语态的agent时,记作obl:agent:

2.2.2 vocative: vocative(呼格词)

称呼关系用于标记语篇中的对话参与者。

2.2.3 expl: expletive(感叹词)

不知道怎么翻译合适。看例子:

2.2.4 dislocated: dislocated elements(错位元素)

错位关系用于不符合句子通常核心语法关系的前置或后置元素。

2.2.5 advcl: adverbial clause modifier(状语从句修饰语)

状语从句修饰语是修饰动词或其他谓语(形容词等)的从句,作为修饰语而不是核心补语。

2.2.6 advmod: adverbial modifier(状语修饰语)

一个词的状语修饰语是修饰谓语或修饰词的非从句状语或状语短语。

2.2.7 discourse: discourse element(语素)

这用于感叹词和其他话语粒子和元素(除了表达方式外,与句子结构没有明确联系)。

2.2.8 aux: auxiliary(辅助词)

从句的辅助词是一个虚词,与表示时态、语气、语态或证据性等类别的动词谓词有关。

2.2.9 cop: copula(连接词)

连接词是一个虚词与非言语谓词之间的关系,包括身份谓词的表达(例如,“Kim是总统”之类的句子)。

2.2.10 mark: marker(标记词)

标记词是将一个从句标记为从属于另一个从句的词。

2.3 名义依存

2.3.1 nmod: nominal modifier(名词修饰语)

nmod关系用于另一个名词或名词短语的名词性从属词,在功能上对应于属性或属格补语。

2.3.2 appos: appositional modifier(同位语修饰语)

名词的同位语修饰语是紧跟在第一个名词之后的名词,用来定义、修饰、命名或描述该名词。

2.3.3 nummod: numeric modifier(数字修饰语)

名词的数字修饰语是用数量修饰名词含义的任何数字短语。

但是如果不是确定的数字,则会被标记为det:

2.3.4 acl: clausal modifier of noun (名词的从句修饰语)

acl表示一个名词的从句修饰语。

2.3.5 amod: adjectival modifier(形容词修饰语)

名词(或代词)的形容词修饰语是用来修饰名词(或代词)的任何形容词组。

2.3.6 det: determiner(限定词)

关系限定词(det)在名词与其限定词之间起作用。

2.3.7 clf: classifier(分类词)

英语中不会出现这类词。

2.3.8 case: case marking(格位标记)

2.4 广义依存关系

2.4.1 conj: conjunct(连词)

连词可以用来连接并列的名词,或并列的动词:


2.4.2 cc: coordinating conjunction(协调连词)

cc是连接词和前面的协调连接词之间的关系。
例子见2.4.1中第2个例子,也就是and。

2.4.3 fixed: fixed multiword expression(固定多字表达式)

固定关系是多词表达式(MWE)的三种关系之一(其他两种是扁平和复合关系)。

2.4.4 flat: flat multiword expression(扁平多字表达式)

是多词表达式的一种。
用于名称:



用于复杂数字和日期:


用于外来词汇:

2.4.5 compound: compound(复合表达式)

2.4.6 list: list(列表关系)

列表关系用于可比较项目的链。

2.4.7 parataxis: parataxis(无连词并列)

意合关系(源自希腊语的“并排放置”)是一个词(通常是句子的主要谓语)与其他元素之间的关系,如句子插入语或“:”或“;”后的从句,并排放置,与主词没有任何明确的协调、从属或论证关系。

这个有些复杂没太搞明白,建议看原文档的介绍。

2.4.8 orphan: orphan(孤立词)

孤立关系用于头部省略的情况。如下例子中,Peter和bronze之间的won省略了。

2.4.9 goeswith: goes with(配合词)

这种关系将单词的两个或多个部分链接在未经过良好编辑的文本中。

这个像是把分开了的子词纠正回一个完整的词。

2.4.10 reparandum: overridden disfluency(重复非流畅)

2.4.11 other(其他)

root(根节点):

punctuation(标点):

unspecified dependency(非确定依存):

3. 速查表

所有依存关系按照英文字母排序如下:

简写 全称 中文含义(部分机翻)
acl clausal modifier of noun (adnominal clause) 名词的从句修饰语
acl:relcl relative clause modifier 关系从句修饰语
advcl adverbial clause modifier 状语从句修饰语
advmod adverbial modifier 状语修饰语
advmod:emph emphasizing word, intensifier 强调词、加强词
advmod:lmod locative adverbial modifier 位置状语修饰语
amod adjectival modifier 形容词修饰语
appos appositional modifier 同位语修饰语
aux auxiliary 辅助词
aux:pass passive auxiliary 被动助词
case case marking 格位标记
cc coordinating conjunction 协调连词
cc:preconj preconjunct 前连词
ccomp clausal complement 从句补足语
clf classifier 分类词
compound compound 复合表达式
compound:lvc light verb construction 轻动词结构
compound:prt phrasal verb particle 短语动词助词
compound:redup reduplicated compounds 重叠复合词
compound:svc serial verb compounds 连动复合词
conj conjunct 连词
cop copula 系动词
csubj clausal subject 从句主语
csubj:pass clausal passive subject 从句被动主语
dep unspecified dependency 非确定依存
det determiner 限定词
det:numgov pronominal quantifier governing the case of the noun 支配名词格的代词量词
det:nummod pronominal quantifier agreeing in case with the noun 与名词一致的代词量词
det:poss possessive determiner 物主限定词
discourse discourse element 语素
dislocated dislocated elements 错位元素
expl expletive 感叹词
expl:impers impersonal expletive 非人称感叹词
expl:pass reflexive pronoun used in reflexive passive 反身被动语态中的反身代词
expl:pv reflexive clitic with an inherently reflexive verb 带有固有反身动词的反身代词
fixed fixed multiword expression 固定多字表达式
flat flat multiword expression 扁平多字表达式
flat:foreign foreign words 外来词扁平多字表达式
flat:name names 名称扁平多字表达式
goeswith goes with 配合词
iobj indirect object 间接宾语
list list 列表关系
mark marker 标记
nmod nominal modifier 名词修饰语
nmod:poss possessive nominal modifier 所有格名词修饰语
nmod:tmod temporal modifier 时间修饰
nsubj nominal subject 名词主语
nsubj:pass passive nominal subject 被动名词主语
nummod numeric modifier 数字修饰符
nummod:gov numeric modifier governing the case of the noun 控制名词大小写的数字修饰语
obj object 宾语
obl oblique nominal 间接名词
obl:agent agent modifier 间接名词,被动语态的发出者
obl:arg oblique argument 间接名词论元
obl:lmod locative modifier 间接名词,位置修饰语
obl:tmod temporal modifier 间接名词,时间修饰语
orphan orphan 孤立词
parataxis parataxis 无连词并列
punct punctuation 标点
reparandum overridden disfluency 重复非流畅
root root 根节点
vocative vocative 呼格词
xcomp open clausal complement 开放从句补足语

整理不易,如果对你有所帮助,记得点赞支持。如果有不准确的地方,还请在评论区指出纠正。

NLP工具——Stanza依存关系含义详解相关推荐

  1. [Python从零到壹] 十五.文本挖掘之数据预处理、Jieba工具和文本聚类万字详解

    欢迎大家来到"Python从零到壹",在这里我将分享约200篇Python系列文章,带大家一起去学习和玩耍,看看Python这个有趣的世界.所有文章都将结合案例.代码和作者的经验讲 ...

  2. Gavin老师Transformer直播课感悟 - NLP信息提取中的CRF Modeling详解

    一.概述 CRF的能力在于信息的依赖性和状态转移处理,它可以表达任意的状态转移和依赖关系.而信息表达能力不足则可以依靠Transformer来处理.在论文中的这幅图展示了各种模型之间是如何进行转换的, ...

  3. VS自带工具:dumpbin的参数详解

    VS自带工具:dumpbin的参数详解 参考链接: 1.微软技术文档 2.微软官方文档描述](https://docs.microsoft.com/zh-cn/cpp/build/reference/ ...

  4. python中的打印是什么意思_对python:print打印时加u的含义详解

    对python:print打印时加u的含义详解 u:表示unicode字符串 不是仅仅是针对中文, 可以针对任何的字符串,代表是对字符串进行unicode编码. 一般英文字符在使用各种编码下, 基本都 ...

  5. echart的关系图高亮_echarts鼠标覆盖高亮显示节点及关系名称详解

    js代码,使用了jquery和echarts.js,用的是源代码那版,因为待会要进源代码里修改-- 其实js代码和echart官网demo的代码完全没区别-- 普通的力图设置,只要加上focusNod ...

  6. Python中的__name__和__main__含义详解

    背景 在写Python代码和看Python代码时,我们常常可以看到这样的代码: ? 1 2 3 4 5 def main():     ...... if __name__ == "__ma ...

  7. 给Clouderamanager集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解)...

    不多说,直接上干货! 这个很简单,在集群机器里,选择就是了,本来自带就有Impala的. 扩展博客 给Ambari集群里安装基于Hive的大数据实时分析查询引擎工具Impala步骤(图文详解) 欢迎大 ...

  8. mysql relay bin 主库_MySQL主库binlog(master-log)与从库relay-log关系代码详解

    主库binlog: # at 2420 #170809 17:16:20 server id 1882073306 end_log_pos 2451 CRC32 0x58f2db87 Xid = 32 ...

  9. mysql 从库relay_MySQL主库binlog(master-log)与从库relay-log关系代码详解

    主库binlog: # at 2420 #170809 17:16:20 server id 1882073306 end_log_pos 2451 CRC32 0x58f2db87 Xid = 32 ...

  10. python中类的构成_Python中类型关系和继承关系实例详解

    本文详细介绍了Python中类型关系和继承关系.分享给大家供大家参考.具体分析如下: 如果一个对象A持有另一个对象B的ID,那么检索到A之后就可以检索到B,我们就说存在一个A到B的导航.这种导航关系使 ...

最新文章

  1. [Hive]Union使用指南
  2. int main( int argc , char *argv[] , char *envp[] )中参数解说
  3. LCD驱动 15-1
  4. Qt4_组装丰富的积木
  5. Cisco协议学习笔记(VTP)
  6. theano学习——内置数据类型
  7. Graduation Speech 毕业典礼致辞__转载
  8. 操作系统——相关面试考点
  9. html2cavans
  10. 华为云各行业数据库服务整体解决方案、数据库迁移上云解决方案
  11. SonarQube代码审查工具
  12. RocketMQ Remoting模块源码功能分析
  13. 删除注册表里没用的服务
  14. 计算机组成原理 模拟机,面向计算机组成原理数学的MML模拟器
  15. angular使用@angular/material 出现export 'ɵɵinject' was not found in '@angular/core'
  16. 深度学习常用的数据集,包括各种数据跟图像数据。
  17. tomcat使用详解(week4_day2)--技术流ken
  18. Altiverb混响试听:让你的声音置身于传奇环境中
  19. 2019华为笔试 找终点
  20. 13.分组曲线拟合与置信条带

热门文章

  1. 23种设计模式归纳总结——结构型
  2. 压缩卷时可压缩空间远小于实际剩余空间解决方法
  3. 小米mix2android o升级,小米MIX2升级Android 8.0 全面屏手势操作将一同推送
  4. 华为手机刷微博体验更好?技术角度的分析和思考
  5. [转载]三小时学会Kubernetes:容器编排详细指南
  6. css方位,CSS 世界中的方位与顺序
  7. 22478计算机代码,数字2247代表啥意思 2247数字意思
  8. SV806 QT UI开发
  9. H3C交换机级联式堆叠配置方式
  10. teredo是什么意思_microsoft teredo tunnelingadapter是什么意思 前面有个黄色感叹号