功能

  • 中文分词
  • 词性标注
  • 关键词提取
  • 文本摘要
  • 依存句法分析
  • 短语提取

安装

pip install pyhanlp

离线安装

pyhanlp所依赖的包:data和jar包

将下载的data和jar放入Lib\site-packages\pyhanlp-0.1.78\pyhanlp\static下

将hanlp.properties中root的路径改为离线安装包路径D:xxxLib\site-packages\pyhanlp-0.1.78\pyhanlp\static

github

https://github.com/hankcs/HanLP/releases

可以使用南大NLP实验室开发的可视化工具

http://nlp.nju.edu.cn/tanggc/tools/DependencyViewer.exe

使用方法

from pyhanlp import *
sentence = "异地贷款需要具备哪些条件"# 返回一个列表,可以获取分词和它的词性
words = HanLP.segment(sentence)
for term in words:print(term.word,term.nature)

返回值解释

a       形容词
ad     副形词
ag     形容词性语素
al     形容词性惯用语
an     名形词
b     区别词
    begin
bg     区别语素
bl     区别词性惯用语
c     连词
cc     并列连词
d     副词
dg     辄,俱,复之类的副词
dl     连语
e     叹词
end     仅用于终##终
f     方位词
g     学术词汇
gb     生物相关词汇
gbc     生物类别
gc     化学相关词汇
gg     地理地质相关词汇
gi     计算机相关词汇
gm     数学相关词汇
gp     物理相关词汇
h     前缀
i     成语
j     简称略语
k     后缀
l     习用语
m     数词
mg     数语素
Mg     甲乙丙丁之类的数词
mq     数量词
n     名词
nb     生物名
nba     动物名
nbc     动物纲目
nbp     植物名
nf     食品,比如“薯片”
ng     名词性语素
nh     医药疾病等健康相关名词
nhd     疾病
nhm     药品
ni     机构相关(不是独立机构名)
nic     下属机构
nis     机构后缀
nit     教育相关机构
nl     名词性惯用语
nm     物品名
nmc     化学品名
nn     工作相关名词
nnd     职业
nnt     职务职称
nr     人名
nr1     复姓
nr2     蒙古姓名
nrf     音译人名
nrj     日语人名

ns     地名
nsf     音译地名
nt     机构团体名
ntc     公司名
ntcb     银行
ntcf     工厂
ntch     酒店宾馆
nth     医院
nto     政府机构
nts     中小学
ntu     大学
nx     字母专名
nz     其他专名
o     拟声词
p     介词
pba     介词“把”
pbei     介词“被”
q     量词
qg     量词语素
qt     时量词
qv     动量词
r     代词
rg     代词性语素
Rg     古汉语代词性语素
rr     人称代词
ry     疑问代词
rys     处所疑问代词
ryt     时间疑问代词
ryv     谓词性疑问代词
rz     指示代词
rzs     处所指示代词
rzt     时间指示代词
rzv     谓词性指示代词
s     处所词
t     时间词
tg     时间词性语素
u     助词
ud     助词
ude1     的 底
ude2     地
ude3     得
udeng     等 等等 云云
udh     的话
ug     过
uguo     过
uj     助词
ul     连词
ule     了 喽
ulian     连 (“连小学生都会”)
uls     来讲 来说 而言 说来
usuo     所
uv     连词
uyy     一样 一般 似的 般
uz       着
uzhe     着
uzhi     之
v          动词
vd        副动词
vf        趋向动词
vg        动词性语素
vi         不及物动词(内动词)
vl         动词性惯用语
vn       名动词
vshi     动词“是”
vx        形式动词
vyou    动词“有”
w         标点符号
wb       百分号千分号,全角:% ‰ 半角:%
wd       逗号,全角:, 半角:,
wf        分号,全角:; 半角: ;
wh       单位符号,全角:¥ $ £ ° ℃ 半角:$
wj        句号,全角:。
wky      右括号,全角:) 〕 ] } 》 】 〗 〉 半角: ) ] { >
wkz      左括号,全角:( 〔 [ { 《 【 〖 〈 半角:( [ { <
wm      冒号,全角:: 半角: :
wn       顿号,全角:、
wp       破折号,全角:—— -- ——- 半角:— —-
ws       省略号,全角:…… …
wt        叹号,全角:!
ww      问号,全角:?
wyy     右引号,全角:” ’ 』
wyz     左引号,全角:“ ‘ 『
x         字符串
xu       网址URL
xx       非语素字
y        语气词(delete yg)
yg       语气语素
z         状态词
zg       状态词

关键词提取

from pyhanlp import *text = "3月4日,在北京2022年冬残奥会开幕式上,一本精致美观的手册出现在每位观众和嘉宾的手中,\这是由北京印刷学院教授夏小奇带领团队设计的《北京2022年冬残奥会开幕式》手册,\在色彩氛围、页码设计、纸张选用等方面都做了暖心设计。"# 提取文本的两个关键词,返回列表
print(HanLP.extractKeyword(text, 2))[设计, 手册]

文本摘要

from pyhanlp import *text = "3月4日,在北京2022年冬残奥会开幕式上,一本精致美观的手册出现在每位观众和嘉宾的手中,\这是由北京印刷学院教授夏小奇带领团队设计的《北京2022年冬残奥会开幕式》手册,\在色彩氛围、页码设计、纸张选用等方面都做了暖心设计。"# 提取文本中的2个关键句作为摘要,返回列表
print(HanLP.extractSummary(document,2))[这是由北京印刷学院教授夏小奇带领团队设计的《北京2022年冬残奥会开幕式》手册, 在北京2022年冬残奥会开幕式上]

依存语法分析

from pyhanlp import *
print(HanLP.parseDependency("AA在会谈中强调,俄方将全面完成在BBB的行动。"))1  普京  普京  nh  nrf _   3   主谓关系    _   _
2   在会谈中    在会谈中    i   l   _   3   状中结构    _   _
3   强调  强调  v   v   _   0   核心关系    _   _
4   ,    ,    wp  w   _   3   标点符号    _   _
5   俄方  俄方  n   n   _   11  主谓关系    _   _
6   将   将   d   d   _   11  状中结构    _   _
7   全面完成    全面完成    i   l   _   11  定中关系    _   _
8   在   在   p   p   _   11  定中关系    _   _
9   乌克兰 乌克兰 ns  ns  _   8   介宾关系    _   _
10  的   的   u   u   _   8   右附加关系   _   _
11  行动  行动  v   vn  _   3   动宾关系    _   _
12  。   。   wp  w   _   3   标点符号    _   _

短语提取

from pyhanlp import *text = "全国上下共同努力,统筹疫情防控和经济社会发展,全年主要目标任务较好完成"
#抽取5个短语
phraseList = HanLP.extractPhrase(text, 5)
print(phraseList);[全国上下共同努力, 疫情防控, 经济社会发展, 防控经济社会, 统筹疫情]

Python的pyhanlp库使用(自然语言识别、姓名)相关推荐

  1. Python的pyhanlp库使用(一)

    该库是自然处理处理的库,有如下功能: 中文分词 词性标注 关键词提取 文本摘要 依存句法分析 短语提取 1 安装 直接使用pip install pyhanlp进行安装,安装后在第一次使用时,当运行f ...

  2. python的第三方库汇总

    Python 资源大全中文版 环境管理 管理 Python 版本和环境的工具 p:非常简单的交互式 python 版本管理工具.官网 pyenv:简单的 Python 版本管理工具.官网 Vex:可以 ...

  3. python web 常用库

    # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列的资源整理.[awesome-python](https://github.com/v ...

  4. Python优秀函数库集锦(二)

    源地址:https://github.com/jobbole/awesome-python-cn 伯乐在线地址:http://python.jobbole.com/84464/ 环境管理 管理 Pyt ...

  5. Python的常用库

    读者您好.今天我将介绍20个属于我常用工具的Python库,我相信你看完之后也会觉得离不开它们.他们是: Requests.Kenneth Reitz写的最富盛名的http库.每个Python程序员都 ...

  6. python常用函数库-Python常用库大全及简要说明

    环境管理 管理 Python 版本和环境的工具 p:非常简单的交互式 python 版本管理工具.官网 pyenv:简单的 Python 版本管理工具.官网 Vex:可以在虚拟环境中执行命令.官网 v ...

  7. Python 工具和库整理

    管理 Python 版本和环境的工具 p – 非常简单的交互式 python 版本管理工具. pyenv – 简单的 Python 版本管理工具. Vex – 可以在虚拟环境中执行命令. virtua ...

  8. Python 常用第三方库及介绍

    环境管理 管理 Python 版本和环境的工具 p:非常简单的交互式 python 版本管理工具.官网 pyenv:简单的 Python 版本管理工具.官网 Vex:可以在虚拟环境中执行命令.官网 v ...

  9. python常用标准库有哪些-Python开发中常用的标准库

    大多数基于 Python 开发的应用程序都会用到本地标准库和三方库,这样不仅能让我们把时间去关注真正的业务开发,也能学习到更多价值含量高的程序设计和开发思想.程序开发中有一句著名的话叫做: Don't ...

  10. python拼音怎么写-Python 中拼音库 PyPinyin 的用法

    [摘要] 最近碰到了一个问题,项目中很多文件都是接手过来的中文命名的一些素材,结果在部署的时候文件名全都乱码了,导致项目无法正常运行. 后来请教了一位大佬怎么解决文件名乱码的问题,他说这个需要正面解决 ...

最新文章

  1. apue学习之文件IO第二部分
  2. Docker1.12让容器使用和宿主机同一个网段
  3. Science评论|只需加一种菌,番茄不仅抗盐胁迫还提高65%产量!
  4. python面向对象之方法
  5. 用掘金-Markdown 编辑器写文章
  6. 我的Go+语言初体验--Go+之环境安装与程序编码初体验
  7. jvmti_拥有您的堆:使用JVMTI迭代类实例
  8. SPOJ HIGH Highways ——Matrix-Tree定理 高斯消元
  9. POJ 3087 Shuffle'm Up (模拟+map)
  10. 我的第一个项目----Java图书管理系统
  11. PHP获取当前页面的完整URL
  12. 2020 第十一届蓝桥杯大赛软件赛省赛(第一场),C/C++大学B组题解
  13. 开发板与虚拟机tftp服务器安装与使用
  14. Shell /dev/null 文件的含义
  15. 飞秋在同一局域网内刷新不到好友
  16. LaTeX | LaTeX:写大论文时同时使用“\uline”和“\textbf”
  17. 2022CCPC广州 CM
  18. 10100cpu支持Linux,i3-10100 cpu能装win7吗?i3-10100 装win7详细教程(完美支持)
  19. python做flash帧动画_[练习]利用CSS steps 实现逐帧动画
  20. 蜂窝移动的架构 以及省电的方法

热门文章

  1. java文字淡入淡出显示特效,jQuery超酷文字淡入淡出显示特效
  2. bootstrap框架中的分割线
  3. “三次握手,四次挥手”你真的懂吗? 1
  4. c++Windows怎样关机【详解】
  5. ansys2020视频教程
  6. 手机游戏公司设定的客户群体是大学生和农民工
  7. 学习C语言 - 推荐书籍
  8. [Unity] material was not upgraded. There‘s no upgrader to convert {1} shader to selected pipeline报错
  9. vs code 关闭右下角弹窗方法
  10. 计算机视觉论文-2021-11-03