北大标注集

词性编码 词性名称 注解
词性编码 词性名称 注解
Ag 形语素 形容词语素。形容词代码为a,语素代码为g前面置以A
a 形容词 取英语形容词adjective的第1个字母
ad 副形词 直接作状语的形容词。形容词代码a和副词代码d并在一起
an 名形词 具有名词功能的形容词。形容词代码a和名词代码n一起
b 区别词 取汉字“别”的声母
c 连词 去英语连词conjunction的第1个字母
Dg 副语素 副词性语素。副词代码为d,语素代码g前面置以D
d 副词 取adverb的第2个字母,因其第1个字母已用于形容词
e 叹词 取英语叹词exclamation的第1个字母。
f 方位词 取汉字“方”
g 语素 绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母
h 前接成分 取英语head的第1个字母
i 成语 取英语成语idiom的第1个字母
j 简称略语 取汉字“简”的声母
k 后接成分
l 习用语 习用语尚未成为成语,有点“临时性”,取“临”的声母
m 数词 取英语numeral的第3个字母,n,u已有他用
Ng 名语素 名词性语素。名词代码为n,语素代码g前面置以N
n 名词 取英语名词noun的第1个字母
nr 人名 名词代码n和“人(ren)”的声母并在一起
ns 地名 名词代码n和处所词代码s并在一起
nt 机构团体 “团”的声母为t,名词代码n和t并在一起
nz 其他专名 “专”的声母的第1个字母为z,名词代码n和z并在一起
o 拟声词 取英语拟声词onomatopoeia的第1个字母。
p 介词 取英语介词prepositional的第1个字母
q 量词 取英语quantity的第1个字母
r 代词 取英语代词pronoun的第2个字母,因p以用于介词
s 处所词 取英语space的第1个字母
Tg 时语素 时间词性语素。时间词代码为t,在语素的代码g前面置以T
t 时间词 取英语time的第1个字母
u 助词 取英语助词auxiliary
Vg 动语素 动词性语素。动词代码为v。在语素代码g前面置以V
v 动词 取英语动词verb的第1个字母。
vd 副动词 直接作状语的动词。动词和副词的代码并在一起。
vn 名动词 指具有名词功能的动词。动词和名词的代码放在一起。
w 标点符号
x 非语素字 非语素字只是一个符号,字母x通常用于代表未知数、符号
y 语气词 取汉字“语”的声母
z 状态词 取汉字“状”的声母的前一个字母。
un 未知词 不可识别词及用户自定义词组。取英文Unknown首两个字母。
(非北大标准,CSW分词中定义)

宾州中文树库标记及其解释

Part-Of-Speech tags:33tags

标记 英语解释 中文解释
AD adverbs 副词
AS Aspect marker 体态词,体标记(例如:了,在,着,过)
BA 把 in ba-const “把”,“将”的词性标记
CC Coordinating conjunction 并列连词,“和”
CD Cardinal numbers 数字,“一百”
CS Subordinating conj 从属连词(例子:若,如果,如…)
DEC 的 for relative-clause etc “的”词性标记
DEG Associative 联结词“的”
DER in V-de construction, and V-de-R “得”
DEV before VP
DT Determiner 限定词,“这”
ETC Tag for words, in coordination phrase 等,等等
FW Foreign words 例子:ISO
IJ interjetion 感叹词
JJ Noun-modifier other than nouns
LB in long bei-construction 例子:被,给
LC Localizer 定位词,例子:“里”
M Measure word(including classifiers) 量词,例子:“个”
MSP Some particles 例子:“所”
NN Common nouns 普通名词
NR Proper nouns 专有名词
NT Temporal nouns 时序词,表示时间的名词
OD Ordinal numbers 序数词,“第一”
ON Onomatopoeia 拟声词,“哈哈”
P Preposition (excluding 把 and 被)
PN pronouns 代词
PU Punctuations 标点
SB in long bei-construction 例子:“被,给”
SP Sentence-final particle 句尾小品词,“吗”
VA Predicative adjective 表语形容词,“红”
VC Copula 系动词,“是”
VE 有 as the main verb “有”
VV Other verbs 其他动词

Syntactic tags:23 tags 句法标记

Tags for phrase: 17 tags 短语句法标记

Tags for verb compounds: 6 tags 动词复合6个标记

Functional tags: 26 tags 功能标记26个

Empty categories (null elements): 7 tags 空范畴标记

了解路径 – neuTblue

补充:

  • 【Common Noun——NN】:列举多种情况下一个汉字串是否定为1个word
  • CD+N

    “CD”和“N”的含义在 APPENDIX B 中查阅,“CD”为量词,“N”为名词

    判断准则:如果在CD+N的结构中,可以插入一个单位在CD和N之间,并且意思不变,则判定为2个词:CD+N,例如:

    如果在CD和N之间插入一个单位后意思改变了,则将CD+N判定为一个NN

  • 【Proper Noun——NR,专有名词】

  • 【Temporal Noun——NT,时间名词】

  • 【Localizer——LC,定位词】如“内”,“左右”

  • 【Pronoun——PN,代词】

  • 【Determiner——DT,限定词】如“这”,“全体”

  • 【Cardinal Number——CD,量词】

  • 【Ordinal Number——OD,次序词】如“第三十一”

  • 【Measure word——M,单位词】如“杯”

  • 【Verb:VA,VC,VE,VV,动词】

  • 【Adverb:AD,副词】如“近”,“极大”

  • 【Preposition:P,介词】如“随着”

  • 【Subordinating conjunctions:CS,从属连词】

  • 【Conjuctions:CC,连词】如“和”

  • 【Particle:DEC,DEG,DEV,DER,AS,SP,ETC,MSP,小品词】如“的话”

  • 【Interjections:IJ,感叹词】如“哈”

  • 【onomatopoeia:ON,拟声词】如“哗啦啦”

  • 【Other Noun-modifier:JJ】如“发稿/JJ 时间/NN”

  • 【Punctuation:PU,标点符号】

  • 【Foreign word:FW,外国词语】如“OK”

  • 【Others】包括idioms(习语),telescopic string(没明白什么意思),short form(缩写)

【中文树库标记---CTB】相关推荐

  1. 中文树库-CTB短语结构标记

    中文树库-CTB短语结构标记 词类标记-33类 Tag Eecription AD 副词 AS 体态词,体标记 BA "把""将"的词性标记 CC 并列连词,& ...

  2. 中文宾州树库标记含义

    来源:http://blog.csdn.net/neutblue/article/details/7375085 1        Part-Of-Speech tags: 33 tags 标记 英语 ...

  3. 【宾州中文树库CTB】数据读取

    CTB8.0 共有如下类型文件: Newswire: [0001-0325, 0400-0454, 0500-0540, 0600-0885, 0900-0931, 4000-4050]--后缀.nw ...

  4. 汉语树库/CoNLL格式,依存句法分析语料

    转载自码农场,原文链接:http://www.hankcs.com/nlp/corpus/chinese-treebank.html 本文旨在介绍CoNLL格式的中文依存语料库(汉语依存树库).CoN ...

  5. 【论文解读】从可扩展的远程情感监督构建的附有结构和主次标记的MEGA RST 篇章树库

    前言 本文是EMNLP 2020年的论文<MEGA RST Discourse Treebanks with Structure and Nuclearity from Scalable Dis ...

  6. 独家 | 综述:情感树库上语义组合的递归深层模型

    作者:Talha Chafekar翻译:顾伟嵩校对:阿笛本文约1400字,建议阅读5分钟本文探讨了单词和n-grams的不同组合方法,以及如何借助基于树的表示法,以自底向上的方式预测短语或单词的二元或 ...

  7. 【Rust日报】2021-10-19 rs-merkle:一个用Rust编写的高级散列树库

    rs-merkle:一个用Rust编写的高级散列树库 rs_merkle: an advanced hash tree library for Rust rs-merkle是一个高级的Rust mer ...

  8. AWS SAA 题库 中文题库 英文题库

    AWS 的SAA认证考试题库,与考试时题目一致,英文题库与考试时题目一致,中文题库与考试题目有翻译文字的差异,考试题目类型有单选和多选两种. AWS SAA题库 中文题库https://www.zai ...

  9. 句法分析语料:哈尔滨工业大学SemEval、清华大学树库

    句法分析语料:哈尔滨工业大学SemEval.清华大学树库 目录 句法分析语料:哈尔滨工业大学SemEval.清华大学树库 哈尔滨工业大学SemEval

最新文章

  1. 【转】每天一个linux命令(34):du 命令
  2. FPGA/CPLD按键硬件延时消除抖动的思路
  3. s3c6410_u-boot-2010.03移植
  4. 《HTML5 界面设计与开发》 读书笔记
  5. ABAP:参数输入屏幕SELECTION-SCREEN中的事件
  6. css 查看更多_在Scrapy中如何利用CSS选择器从网页中采集目标数据——详细教程(上篇)...
  7. 机票预定系统类图_出行干货|在法国,廉价机票攻略
  8. sql添加约束相关示例
  9. Android跑马灯的效果
  10. FreeCAD快速开始
  11. 《原则》瑞达利欧_epub+mobi+azw3
  12. C语言实现扫雷游戏(详解)
  13. 大数据入门书籍推荐以及Hive学习资料
  14. Sklearn 划分训练集和测试集
  15. winrar压缩软件免费版
  16. iGoogle创新设计大赛
  17. 游戏更新-拖拉机升级 Android
  18. 985本科,自学JAVA四个月,我用二年时间从银行外包跳进了阿里!
  19. 打游戏哪种蓝牙耳机比较好?适合玩游戏的无线蓝牙耳机
  20. MATLAB二维绘图(二)向图中添加标题,坐标轴,图标和文字信息

热门文章

  1. android sdk所有版本下载,android sdk全平台版本集成
  2. win10资源管理器无法最小化,无法移动
  3. 2.10 zio入门——总结
  4. dimm和udimm_服务器内存类型UDIMM、RDIMM和LRDIMM比较
  5. python简单抽奖系统_python实现的简单抽奖系统实例
  6. 给所有的Control加两个属性,实现回车键自动跳转到下一个控件
  7. Windows IIS IUSR IWAM 帐户密码同步
  8. 大数据破危险品物流难题 危化品污染有望“圈治”
  9. sqlite设密工具如何使用(本人资源)
  10. wordpress插件_如何使用适用于WordPress的长格式Storybuilder插件