HanLP官方定义词性标注集(也可以自定义,比如在txt文件中写好名词,逐行读入,加上词性,写入词典)

1    Are
a    形容词
ad    副形词
ag    形容词性语素
al    形容词性惯用语
an    名形词
b    区别词
begin
bg    区别语素
bl    区别词性惯用语
c    连词
cc    并列连词
d    副词
dg    辄,俱,复之类的副词
dl    连语
e    叹词
end    仅用于终##终
f    方位词
g    学术词汇
gb    生物相关词汇
gbc    生物类别
gc    化学相关词汇
gg    地理地质相关词汇
gi    计算机相关词汇
gm    数学相关词汇
gp    物理相关词汇
h    前缀
i    成语
j    简称略语
k    后缀
l    习用语
m    数词
mg    数语素
Mg    甲乙丙丁之类的数词
mq    数量词
n    名词
nb    生物名
nba    动物名
nbc    动物纲目
nbp    植物名
nf    食品,比如“薯片”
ng    名词性语素
nh    医药疾病等健康相关名词
nhd    疾病
nhm    药品
ni    机构相关(不是独立机构名)
nic    下属机构
nis    机构后缀
nit    教育相关机构
nl    名词性惯用语
nm    物品名
nmc    化学品名
nn    工作相关名词
nnd    职业
nnt    职务职称
nr    人名
nr1    复姓
nr2    蒙古姓名
nrf    音译人名
nrj    日语人名
ns    地名
nsf    音译地名
nt    机构团体名
ntc    公司名
ntcb    银行
ntcf    工厂
ntch    酒店宾馆
nth    医院
nto    政府机构
nts    中小学
ntu    大学
nx    字母专名
nz    其他专名
o    拟声词
p    介词
pba    介词“把”
pbei    介词“被”
q    量词
qg    量词语素
qt    时量词
qv    动量词
r    代词
rg    代词性语素
Rg    古汉语代词性语素
rr    人称代词
ry    疑问代词
rys    处所疑问代词
ryt    时间疑问代词
ryv    谓词性疑问代词
rz    指示代词
rzs    处所指示代词
rzt    时间指示代词
rzv    谓词性指示代词
s    处所词
t    时间词
tg    时间词性语素
u    助词
ud    助词
ude1    的 底
ude2    地
ude3    得
udeng    等 等等 云云
udh    的话
ug    过
uguo    过
uj    助词
ul    连词
ule    了 喽
ulian    连 (“连小学生都会”)
uls    来讲 来说 而言 说来
usuo    所
uv    连词
uyy    一样 一般 似的 般
uz    着
uzhe    着
uzhi    之
v    动词
vd    副动词
vf    趋向动词
vg    动词性语素
vi    不及物动词(内动词)
vl    动词性惯用语
vn    名动词
vshi    动词“是”
vx    形式动词
vyou    动词“有”
w    标点符号
wb    百分号千分号,全角:% ‰ 半角:%
wd    逗号,全角:, 半角:,
wf    分号,全角:; 半角: ;
wh    单位符号,全角:¥ $ £ ° ℃ 半角:$
wj    句号,全角:。
wky    右括号,全角:) 〕 ] } 》 】 〗 〉 半角: ) ] { >
wkz    左括号,全角:( 〔 [ { 《 【 〖 〈 半角:( [ { <
wm    冒号,全角:: 半角: :
wn    顿号,全角:、
wp    破折号,全角:—— -- ——- 半角:— —-
ws    省略号,全角:…… …
wt    叹号,全角:!
ww    问号,全角:?
wyy    右引号,全角:” ’ 』
wyz    左引号,全角:“ ‘ 『
x    字符串
xu    网址URL
xx    非语素字
y    语气词(delete yg)
yg    语气语素
z    状态词
zg    状态词

参考https://blog.csdn.net/u014258362/article/details/81044286

中文语句分词 -- HanLP词性相关推荐

  1. Java代码工具之中英文语句分词

    在自然语言处理中比较热门的操作就是中文或英文语句分词了,分词就是按照不同的算法和参数将语句分成若干词汇.拆分后的关键词可以进行词频统计或者词云图片生成等,能够快速方便的找到语句的核心主题热点. 在ja ...

  2. java 城市分词_Java中文分词hanlp使用

    原标题:Java中文分词hanlp使用 HanLP介绍:http://hanlp.linrunsoft.com/ github地址:https://github.com/hankcs/HanLP 说明 ...

  3. 第14章 用BERT实现中文语句分类

    BERT以Transformer的Encoder为架构,已MLM为模型,在很多领域取得历史性的的突破.这里以Transformers上基于中文语料库上训练的预训练模型bert-base-chinese ...

  4. Solr配置中文的分词器-简单配置

    Solr配置中文的分词器 文章目录 Solr配置中文的分词器 英文分词 中文的查询 Solr需要配置中文分词器(重要) 配置中文分词后,再分析一次   这篇文章,主要是讲解Solr如何配置中文分词器, ...

  5. Java中文语言处理HanLP

    官网:http://hanlp.linrunsoft.com/ 1.中文分词:http://hanlp.linrunsoft.com/doc/_build/html/segment.html 2.摘要 ...

  6. 【MySQL全文检索教程2】中文语义分词检索,配置ngram解析器ngram_token_size,innodb_ft_min_token_size,innodb_ft_min_token_size

    MySQL全文索引:中文语义分词检索(相似度匹配) 原文链接:https://blog.csdn.net/qq_39702981/article/details/125141024 通常情况下,全文检 ...

  7. C语言 输入中文语句并按倒叙将它输出

    2019独角兽企业重金招聘Python工程师标准>>> 在Dev C++里按ctrl+空格键就可以输入中文汉字. #include<stdio.h> #include&l ...

  8. python词频统计完整步骤_Python中文文本分词、词频统计、词云绘制

    本文主要从中文文本分词.词频统计.词云绘制方面介绍Python中文文本分词的使用.会使用到的中文文本处理包包括:wordcloud,jieba,re(正则表达式),collections. 1 准备工 ...

  9. Lucene实现自定义中文同义词分词器

    ---------------------------------------------------------- lucene的分词_中文分词介绍 ------------------------ ...

  10. 基于Lucene的中文文本分词

    王继明,杨国林 (内蒙古工业大学信息工程学院,呼和浩特010051) 摘要:中文文本分词技术是文本挖掘领域的一个重要分支,在中国仍然处于发展阶段.Apache Jakarta的开源工程Lucene是一 ...

最新文章

  1. Druid 连接泄漏监测
  2. python向端口发出数据_Python写的简单的端口监听,显示端口上收到的数据,TCP的...
  3. iptables for循环
  4. QWaiteCondition思考3
  5. 前端学习(2587):权限控制的分类和意义
  6. 黑马day16 jqueryamp;属性过滤选择器
  7. Android中MediaRecorder.stop()报错 java.lang.RuntimeException: stop failed.
  8. html object标签与java,html之object标签的classid收集
  9. USACO / Mother's Milk (DFS)
  10. 创业日记:进入电子商务领域,需未雨绸缪,更要步步谨慎
  11. Haar特征与积分图
  12. eyoucms破解授权
  13. ConstraintLayout约束布局
  14. 【ONES 校招前端笔试+一面】
  15. 基于vlan 无线用户隔离
  16. 欧几里得几何(1)Alpha
  17. 将一个数的每一位都正序输出——简单算法
  18. js中appendChild()用法
  19. 淘宝小程序(商家应用)开发提前需要了解的一些概念
  20. 素数筛选法,快速获取素数序列

热门文章

  1. Cassandra安装和初次使用
  2. springmvc中@PathVariable和@RequestParam的区别(百度收集)
  3. TCP/IP长连接和短连接
  4. SQL SERVER 2005 使用订阅发布同步数据库
  5. 【GDB调试学习笔记】利用core文件调试程序
  6. 【ARM】【NEON加速介绍】
  7. Unable to allocate bufptr memory (errval = -1)(CRLF与LF格式转换)问题的解决
  8. 关于项目部署到外网后,访问域名失败的原因之一
  9. 实习踩坑之路:快速失败:使用stream流便利集合的时候删除了对象,导致抛错Null
  10. Retrofit工作原理总结