汉语词性对照表[北大标准/中科院标准]

词性编码 词性名称 注 解

Ag

形语素

形容词性语素。形容词代码为 a,语素代码g前面置以A。

a

形容词

取英语形容词 adjective的第1个字母。

ad

副形词

直接作状语的形容词。形容词代码 a和副词代码d并在一起。

an

名形词

具有名词功能的形容词。形容词代码 a和名词代码n并在一起。

b

区别词

取汉字“别”的声母。

c

连词

取英语连词 conjunction的第1个字母。
dg

副语素

副词性语素。副词代码为 d,语素代码g前面置以D。

d

副词

取 adverb的第2个字母,因其第1个字母已用于形容词。

e

叹词

取英语叹词 exclamation的第1个字母。

f

方位词

取汉字“方”

g

语素

绝大多数语素都能作为合成词的“词根”,取汉字“根”的声母。

h

前接成分

取英语 head的第1个字母。

i

成语

取英语成语 idiom的第1个字母。

j

简称略语

取汉字“简”的声母。

k

后接成分

 

l

习用语

习用语尚未成为成语,有点“临时性”,取“临”的声母。

m

数词

取英语 numeral的第3个字母,n,u已有他用。

Ng

名语素

名词性语素。名词代码为 n,语素代码g前面置以N。

n

名词

取英语名词 noun的第1个字母。

nr

人名

名词代码 n和“人(ren)”的声母并在一起。

ns

地名

名词代码 n和处所词代码s并在一起。

nt

机构团体

“团”的声母为 t,名词代码n和t并在一起。

nz

其他专名

“专”的声母的第 1个字母为z,名词代码n和z并在一起。

o

拟声词

取英语拟声词 onomatopoeia的第1个字母。

p

介词

取英语介词 prepositional的第1个字母。

q

量词

取英语 quantity的第1个字母。

r

代词

取英语代词 pronoun的第2个字母,因p已用于介词。

s

处所词

取英语 space的第1个字母。

tg

时语素

时间词性语素。时间词代码为 t,在语素的代码g前面置以T。

t

时间词

取英语 time的第1个字母。

u

助词

取英语助词 auxiliary

vg

动语素

动词性语素。动词代码为 v。在语素的代码g前面置以V。

v

动词

取英语动词 verb的第一个字母。

vd

副动词

直接作状语的动词。动词和副词的代码并在一起。

vn

名动词

指具有名词功能的动词。动词和名词的代码并在一起。

w

标点符号

 

x

非语素字

非语素字只是一个符号,字母 x通常用于代表未知数、符号。

y

语气词

取汉字“语”的声母。

z

状态词

取汉字“状”的声母的前一个字母。

un

未知词

不可识别词及用户自定义词组。取英文Unkonwn首两个字母。(非北大标准,CSW分词中定义)

转载于:https://www.cnblogs.com/goldenstones/p/4424108.html

中文分词词性对照表(转)相关推荐

  1. 基于python的几种中文分词-词性获取

    基于python的几种中文分词-词性获取 1.测试环境 2.安装与使用 2.1 jieba分词 2.2 清华大学的THULAC 2.3 HanLP 2.4 pynlpir 基于python的几种中文分 ...

  2. python中文文本分词_SnowNLP:?中文分词?词性标准?提取文本摘要,?提取文本关键词,?转换成拼音?繁体转简体的 处理中文文本的Python3 类库...

    SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和Te ...

  3. jieba分词词性说明

    jieba(结巴)是一个强大的分词库,完美支持中文分词,本文对其基本用法做一个简要总结. 安装jieba pip install jieba 简单用法 结巴分词分为三种模式:精确模式(默认).全模式和 ...

  4. Ansj中文分词使用教程

    摘要: ansj是一个基于n-Gram+CRF+HMM的中文分词的java实现. ansj分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上 Ansj目前实现了.中文 ...

  5. jieba分词 词性表

    jieba分词词性对照表 标注 解释 标注 解释 标注 解释 a 形容词 mq 数量词 tg 时语素 ad 副形词 n 名词 u 助词 ag 形语素 ng 例:义 乳 亭 ud 例:得 an 名形词 ...

  6. 中文分词-jieba

    支持三种分词模式: 精确模式,试图将句子最精确地切开,适合文本分析: 全模式,把句子中所有的可以成词的词语都扫描出来, 速度非常快,但是不能解决歧义: 搜索引擎模式,在精确模式的基础上,对长词再次切分 ...

  7. Ansj中文分词Java开发词性分类

    用ansj分词后,只提取满足提交的词性的单词. Ansj下载地址:http://maven.ansj.org/org/ansj/ansj_seg/ 辅助包NLP下载地址:http://maven.an ...

  8. 使用NLPIR 进行中文分词并标注词性

    背景 在许多时候为了更好的解析文本,我们不仅仅需要将文本分词,去停这么简单,除了获取关键词与新词汇以外,我们还需要对获取每个粒度的其他信息,比如词性标注,在python中NLPIR就可以很好的完成这个 ...

  9. 自然语言处理(NLP)学习笔记——分词工具词性对照表

    jieba词性对照表: - a 形容词 - ad 副形词 - ag 形容词性语素 - an 名形词 - b 区别词 - c 连词 - d 副词 - df - dg 副语素 - e 叹词 - f 方位词 ...

最新文章

  1. 【C++】STL队列和栈的使用
  2. 【ACM】杭电OJ 1009 (FatMouse' Trade)。
  3. SCLS:巴斯德所崔杰组揭示海洋无脊椎动物RNA病毒的遗传多样
  4. Microbiome:芝麻菜中肠杆菌科主导核心微生物组并贡献抗生素抗性组(简单套路16S+meta+培养组发高分文章)
  5. Leaflet中使用awesome-markers插件显示带图标的marker
  6. 春风十里不如春城一聚:华平解决方案巡展走进昆明
  7. André Weil | 数学史:为什么,怎么看
  8. TabLayout+Fragment+ViewPager+FragmentStatePagerAdapter实现Tab标签
  9. 高考还没结束,这份试卷已经流出,你能拿多少分?
  10. 使用Redis和Apache Kafka处理时间序列数据
  11. [PetShop]园子里petshop的几篇文章,先来个了解吧
  12. 投递简历总是石沉大海?HR表现的机会都不给你?【Python爬虫实战:简历模板采集】
  13. MSVCRTD.lib(crtexe.obj) : error LNK2019: 无法解析的外部符号 _main,该符号在函数 ___tmainCRTStart...
  14. linux查看行数命令 set,Linux显示文件行数之nl命令详解
  15. centerOS 安装redis
  16. AI读书笔记:《剑桥五重奏—机器能思考吗?》
  17. 怎么更改计算机用户为管理员账户,Win10如何更改为管理员账户,教您如何更改
  18. 二值化最佳阈值选取方法以及matlab实现
  19. AD学习记录03-规则
  20. MyEclipse 注册码分享

热门文章

  1. Spring MVC 接收请求参数所有方式总结!
  2. 小米自动化运维平台演进设计思路
  3. 数据库性能优化的误区!
  4. 【分享】怎样学习一门新技术?
  5. 2019年Vue学习路线图
  6. 提升用户体验的必杀器——A/B实验统计方法解密
  7. css动画-animation各个属性详解(通俗易懂)
  8. mysql注入绕过单引号_SQL注入-绕过过滤规则
  9. 关于无管网气体消防系统之你不知道的事
  10. 提高数据中心空间使用率,助力数字新基建