StanfordCoreNLP 是基于java版的,python封装也只是请求java接口,不是很方便。

这个效果可以使用官网测试地址:http://corenlp.run/

stanza是纯Python版的coreNLP,更方便

1、安装

pip install stanza

2、下载模型 stanza_resources

文章末尾有中英文的模型资源百度网盘链接地址及目录结构

链接: https://pan.baidu.com/s/1doWw-WaJr6e9wC_Pfvj5Gw  密码:x46s

import stanza
stanza.download('en') # download English model
stanza.download('zh') # download chinese model

注意:在jupyter中下载如果有问题,可在终端中,python交互界面中下载,也可复制链接后使用下载工具下载,然后按照目录结构解压即可

目录结构:

3、使用

import stanza
# 可写配置文件,或单独传入
# lang 指定语言,
config = {'dir':'./stanza_resources/', # 如未使用 stanza.download() 下载模型;必须指定模型文件路径
#     'processors': 'tokenize,mwt,pos,ner', # Comma-separated list of processors to use'lang': 'zh' #'en', # Language code for the language to build the Pipeline in
#     'tokenize_model_path': './fr_gsd_models/fr_gsd_tokenizer.pt', # Processor-specific arguments are set with keys "{processor_name}_{argument_name}"
#     'mwt_model_path': './fr_gsd_models/fr_gsd_mwt_expander.pt',
#     'pos_model_path': './fr_gsd_models/fr_gsd_tagger.pt',
#     'pos_pretrain_path': './fr_gsd_models/fr_gsd.pretrain.pt',
#     'tokenize_pretokenized': True # Use pretokenized text as input and disable tokenization
}
nlp = stanza.Pipeline(**config)
#输出:
2020-04-15 16:58:35 INFO: Loading these models for language: en (English):
=========================
| Processor | Package   |
-------------------------
| tokenize  | ewt       |
| pos       | ewt       |
| lemma     | ewt       |
| depparse  | ewt       |
| ner       | ontonotes |
=========================2020-04-15 16:58:35 INFO: Use device: gpu
2020-04-15 16:58:35 INFO: Loading: tokenize
2020-04-15 16:58:40 INFO: Loading: pos
2020-04-15 16:58:41 INFO: Loading: lemma
2020-04-15 16:58:41 INFO: Loading: depparse
2020-04-15 16:58:42 INFO: Loading: ner
2020-04-15 16:58:42 INFO: Done loading processors!doc = nlp('快速的棕色狐狸跳过了懒惰的狗')doc.sentences
# 输出:
[[{"id": "1","text": "快速","lemma": "快速","upos": "ADJ","xpos": "JJ","head": 4,"deprel": "amod","misc": "start_char=0|end_char=2"},{"id": "2","text": "的","lemma": "的","upos": "PART","xpos": "DEC","head": 1,"deprel": "mark:relcl","misc": "start_char=2|end_char=3"},{"id": "3","text": "棕色","lemma": "棕色","upos": "NOUN","xpos": "NN","head": 4,"deprel": "nmod","misc": "start_char=3|end_char=5"},{"id": "4","text": "狐狸","lemma": "狐狸","upos": "NOUN","xpos": "NN","head": 5,"deprel": "nsubj","misc": "start_char=5|end_char=7"},{"id": "5","text": "跳过","lemma": "跳过","upos": "VERB","xpos": "VV","head": 0,"deprel": "root","misc": "start_char=7|end_char=9"},{"id": "6","text": "了","lemma": "了","upos": "PART","xpos": "AS","feats": "Aspect=Perf","head": 5,"deprel": "case:aspect","misc": "start_char=9|end_char=10"},{"id": "7","text": "懒惰","lemma": "懒惰","upos": "ADJ","xpos": "JJ","head": 9,"deprel": "amod","misc": "start_char=10|end_char=12"},{"id": "8","text": "的","lemma": "的","upos": "PART","xpos": "DEC","head": 7,"deprel": "mark:relcl","misc": "start_char=12|end_char=13"},{"id": "9","text": "狗","lemma": "狗","upos": "NOUN","xpos": "NN","head": 5,"deprel": "obj","misc": "start_char=13|end_char=14"}]]doc.sentences[0].print_dependencies()
输出:
('快速', '4', 'amod')
('的', '1', 'mark:relcl')
('棕色', '4', 'nmod')
('狐狸', '5', 'nsubj')
('跳过', '0', 'root')
('了', '5', 'case:aspect')
('懒惰', '9', 'amod')
('的', '7', 'mark:relcl')
('狗', '5', 'obj')doc.sentences[0].print_tokens()
输出:
<Token id=1;words=[<Word id=1;text=快速;lemma=快速;upos=ADJ;xpos=JJ;head=4;deprel=amod>]>
<Token id=2;words=[<Word id=2;text=的;lemma=的;upos=PART;xpos=DEC;head=1;deprel=mark:relcl>]>
<Token id=3;words=[<Word id=3;text=棕色;lemma=棕色;upos=NOUN;xpos=NN;head=4;deprel=nmod>]>
<Token id=4;words=[<Word id=4;text=狐狸;lemma=狐狸;upos=NOUN;xpos=NN;head=5;deprel=nsubj>]>
<Token id=5;words=[<Word id=5;text=跳过;lemma=跳过;upos=VERB;xpos=VV;head=0;deprel=root>]>
<Token id=6;words=[<Word id=6;text=了;lemma=了;upos=PART;xpos=AS;feats=Aspect=Perf;head=5;deprel=case:aspect>]>
<Token id=7;words=[<Word id=7;text=懒惰;lemma=懒惰;upos=ADJ;xpos=JJ;head=9;deprel=amod>]>
<Token id=8;words=[<Word id=8;text=的;lemma=的;upos=PART;xpos=DEC;head=7;deprel=mark:relcl>]>
<Token id=9;words=[<Word id=9;text=狗;lemma=狗;upos=NOUN;xpos=NN;head=5;deprel=obj>]>doc.sentences[0].print_words()
输出:
<Word id=1;text=快速;lemma=快速;upos=ADJ;xpos=JJ;head=4;deprel=amod>
<Word id=2;text=的;lemma=的;upos=PART;xpos=DEC;head=1;deprel=mark:relcl>
<Word id=3;text=棕色;lemma=棕色;upos=NOUN;xpos=NN;head=4;deprel=nmod>
<Word id=4;text=狐狸;lemma=狐狸;upos=NOUN;xpos=NN;head=5;deprel=nsubj>
<Word id=5;text=跳过;lemma=跳过;upos=VERB;xpos=VV;head=0;deprel=root>
<Word id=6;text=了;lemma=了;upos=PART;xpos=AS;feats=Aspect=Perf;head=5;deprel=case:aspect>
<Word id=7;text=懒惰;lemma=懒惰;upos=ADJ;xpos=JJ;head=9;deprel=amod>
<Word id=8;text=的;lemma=的;upos=PART;xpos=DEC;head=7;deprel=mark:relcl>
<Word id=9;text=狗;lemma=狗;upos=NOUN;xpos=NN;head=5;deprel=obj>doc = nlp('新冠病毒在美国情况恶劣。')doc.ents,doc.entities
输出:
[{"text": "美国","type": "GPE","start_char": 5,"end_char": 7}]

以下为标注解释:来源网络,侵权删

词性和实体标注解释

https://www.cnblogs.com/gaofighting/p/9768023.html

句法关系标注解释:

来源:https://blog.csdn.net/l919898756/article/details/81670228

ROOT:要处理文本的语句
IP:简单从句
NP:名词短语
VP:动词短语
PU:断句符,通常是句号、问号、感叹号等标点符号
LCP:方位词短语
PP:介词短语
CP:由‘的’构成的表示修饰性关系的短语
DNP:由‘的’构成的表示所属关系的短语
ADVP:副词短语
ADJP:形容词短语
DP:限定词短语
QP:量词短语
NN:常用名词
NR:固有名词
NT:时间名词
PN:代词
VV:动词
VC:是
CC:表示连词
VE:有
VA:表语形容词
AS:内容标记(如:了)
VRD:动补复合词
CD: 表示基数词
DT: determiner 表示限定词
EX: existential there 存在句
FW: foreign word 外来词
IN: preposition or conjunction, subordinating 介词或从属连词
JJ: adjective or numeral, ordinal 形容词或序数词
JJR: adjective, comparative 形容词比较级
JJS: adjective, superlative 形容词最高级
LS: list item marker 列表标识
MD: modal auxiliary 情态助动词
PDT: pre-determiner 前位限定词
POS: genitive marker 所有格标记
PRP: pronoun, personal 人称代词
RB: adverb 副词
RBR: adverb, comparative 副词比较级
RBS: adverb, superlative 副词最高级
RP: particle 小品词
SYM: symbol 符号
TO:”to” as preposition or infinitive marker 作为介词或不定式标记
WDT: WH-determiner WH限定词
WP: WH-pronoun WH代词
WP$: WH-pronoun, possessive WH所有格代词
WRB:Wh-adverb WH副词关系表示
abbrev: abbreviation modifier,缩写
acomp: adjectival complement,形容词的补充;
advcl : adverbial clause modifier,状语从句修饰词
advmod: adverbial modifier状语
agent: agent,代理,一般有by的时候会出现这个
amod: adjectival modifier形容词
appos: appositional modifier,同位词
attr: attributive,属性
aux: auxiliary,非主要动词和助词,如BE,HAVE SHOULD/COULD等到
auxpass: passive auxiliary 被动词
cc: coordination,并列关系,一般取第一个词
ccomp: clausal complement从句补充
complm: complementizer,引导从句的词好重聚中的主要动词
conj : conjunct,连接两个并列的词。
cop: copula。系动词(如be,seem,appear等),(命题主词与谓词间的)连系
csubj : clausal subject,从主关系
csubjpass: clausal passive subject 主从被动关系
dep: dependent依赖关系
det: determiner决定词,如冠词等
dobj : direct object直接宾语
expl: expletive,主要是抓取there
infmod: infinitival modifier,动词不定式
iobj : indirect object,非直接宾语,也就是所以的间接宾语;
mark: marker,主要出现在有“that” or “whether”“because”, “when”,
mwe: multi-word expression,多个词的表示
neg: negation modifier否定词
nn: noun compound modifier名词组合形式
npadvmod: noun phrase as adverbial modifier名词作状语
nsubj : nominal subject,名词主语
nsubjpass: passive nominal subject,被动的名词主语
num: numeric modifier,数值修饰
number: element of compound number,组合数字
parataxis: parataxis: parataxis,并列关系
partmod: participial modifier动词形式的修饰
pcomp: prepositional complement,介词补充
pobj : object of a preposition,介词的宾语
poss: possession modifier,所有形式,所有格,所属
possessive: possessive modifier,这个表示所有者和那个’S的关系
preconj : preconjunct,常常是出现在 “either”, “both”, “neither”的情况下
predet: predeterminer,前缀决定,常常是表示所有
prep: prepositional modifier
prepc: prepositional clausal modifier
prt: phrasal verb particle,动词短语
punct: punctuation,这个很少见,但是保留下来了,结果当中不会出现这个
purpcl : purpose clause modifier,目的从句
quantmod: quantifier phrase modifier,数量短语
rcmod: relative clause modifier相关关系
ref : referent,指示物,指代
rel : relative
root: root,最重要的词,从它开始,根节点
tmod: temporal modifier
xcomp: open clausal complement
xsubj : controlling subject 掌控者
中心语为谓词subj — 主语nsubj — 名词性主语(nominal subject) (同步,建设)top — 主题(topic) (是,建筑)
npsubj — 被动型主语(nominal passive subject),专指由“被”引导的被动句中的主语,一般是谓词语义上的受事 (称作,镍)csubj — 从句主语(clausal subject),中文不存在xsubj — x主语,一般是一个主语下面含多个从句 (完善,有些)
中心语为谓词或介词   obj — 宾语dobj — 直接宾语 (颁布,文件)iobj — 间接宾语(indirect object),基本不存在range — 间接宾语为数量词,又称为与格 (成交,元)pobj — 介词宾语 (根据,要求)lobj — 时间介词 (来,近年)
中心语为谓词comp — 补语ccomp — 从句补语,一般由两个动词构成,中心语引导后一个动词所在的从句(IP) (出现,纳入)xcomp — x从句补语(xclausal complement),不存在   acomp — 形容词补语(adjectival complement)tcomp — 时间补语(temporal complement) (遇到,以前)
lccomp — 位置补语(localizer complement) (占,以上)— 结果补语(resultative complement)
中心语为名词mod — 修饰语(modifier)pass — 被动修饰(passive)tmod — 时间修饰(temporal modifier)rcmod — 关系从句修饰(relative clause modifier) (问题,遇到)numod — 数量修饰(numeric modifier) (规定,若干)
ornmod — 序数修饰(numeric modifier)clf — 类别修饰(classifier modifier) (文件,件)nmod — 复合名词修饰(noun compound modifier) (浦东,上海)amod — 形容词修饰(adjetive modifier) (情况,新)
advmod — 副词修饰(adverbial modifier) (做到,基本)vmod — 动词修饰(verb modifier,participle modifier)
prnmod — 插入词修饰(parenthetical modifier)neg — 不定修饰(negative modifier) (遇到,不)det — 限定词修饰(determiner modifier) (活动,这些)possm — 所属标记(possessive marker),NPposs — 所属修饰(possessive modifier),NPdvpm — DVP标记(dvp marker),DVP (简单,的)
dvpmod — DVP修饰(dvp modifier),DVP (采取,简单)assm — 关联标记(associative marker),DNP (开发,的)
assmod — 关联修饰(associative modifier),NP|QP (教训,特区)prep — 介词修饰(prepositional modifier) NP|VP|IP(采取,对)clmod — 从句修饰(clause modifier) (因为,开始)plmod — 介词性地点修饰(prepositional localizer modifier) (在,上)asp — 时态标词(aspect marker) (做到,了)
partmod– 分词修饰(participial modifier) 不存在etc — 等关系(etc) (办法,等)
中心语为实词conj — 联合(conjunct)cop — 系动(copula) 双指助动词????cc — 连接(coordination),指中心词与连词 (开发,与)
其它attr — 属性关系 (是,工程)
cordmod– 并列联合动词(coordinated verb compound) (颁布,实行)mmod — 情态动词(modal verb) (得到,能)ba — 把字关系
tclaus — 时间从句 (以后,积累)— semantic dependentcpm — 补语化成分(complementizer),一般指“的”引导的CP (振兴,的)

参考网址:

stanf官网:https://stanfordnlp.github.io/CoreNLP/index.html#human-languages-supported

stanza官网:https://stanfordnlp.github.io/stanza/index.html

网络资源:http://www.52nlp.cn/tag/corenlp

资源下载:包含中英文模型:

链接: https://pan.baidu.com/s/1doWw-WaJr6e9wC_Pfvj5Gw  密码:x46s

链接目录:

Stanford CoreNLP 纯Python版本的深度学习NLP工具包 stanza 使用笔记相关推荐

  1. Python机器学习、深度学习库总结(内含大量示例,建议收藏)

    Python机器学习.深度学习库总结(内含大量示例,建议收藏) 前言 python常用机器学习及深度学习库介绍 总结与分类 python 常用机器学习及深度学习库总结 分类 更多 前言 目前,随着人工 ...

  2. Python机器学习、深度学习库总结

    Python机器学习.深度学习库总结(内含大量示例,建议收藏) 前言 python常用机器学习及深度学习库介绍 总结与分类 python 常用机器学习及深度学习库总结 分类 更多 前言 为了大家能够对 ...

  3. NLP工具——Stanford CoreNLP的python封装包 处理中文

    文章目录 1.StanfordCoreNLP是什么? 2.StanfordNLP是什么? 3.StanfordNLP的使用 3.1 安装 3.2 运行 3.3 如何处理中文? 3.4 demo 4.第 ...

  4. python调用c++深度学习模型生成的dll(传入图片,返回多个结果)

    这里主要通过python调用c++深度学习模型,传入图片,c++处理,并返回结果,python接收结果,这个过程的接口如何设计转换. python端代码接口 # 定义dll返回的结果类型,这里应该和c ...

  5. 【深度学习 功法篇】win10操作系统PC端环境的部署(如何并存 不同的、多种版本的深度学习框架)

    [深度学习 功法篇]win10操作系统 PC端深度学习框架的搭建 摘要 1.1 Win10环境+ CUDA9.0 +CUDNN7.0+Python3.7.4+PaddlePaddle 1.6.3 1. ...

  6. 【RTX3060(暗夜精灵)等系列显卡正确配置Pytorch及其对于cuda和cudann版本的深度学习环境(避免由于版本不适应导致重装)】

    提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 RTX3060(暗夜精灵)等系列显卡正确配置Pytorch及其对于cuda和cudann版本的深度学习环境(避免由于版本不适应导致重装 ...

  7. Python深度学习-NLP实战:字向量的训练与生成

    系列文章目录 Python深度学习-NLP实战:深度学习系列培训教程 Linux服务器软件的简单使用 Linux命令的简单使用 训练集.测试集.验证集的介绍及制作 字向量的训练与生成 文本分类之SVM ...

  8. 如何用 Python 进行基于深度学习的计算机视觉项目开发?

    令人惊喜的"智能"年代 深度学习有着广阔的前景 我们正处在一个"智能"的年代,比如智能手机中的语音助手.机器翻译和人脸识别:战胜过日本将棋冠军.国际象棋冠军, ...

  9. 30个顶级Python库 | 用于深度学习、自然语言处理和计算机视觉

    CDA数据分析师 出品 作者:Matthew Mayo 编译:Mika 今天我们来盘点一下有哪些用于深度学习.自然语言处理和计算机视觉的顶级Python库. 我们尽力将每个库按预期的使用情况进行归类, ...

  10. Python实现的深度学习技术在水文水质领域应用

    当前,深度学习作为人工智能的热门技术发展迅速,以其强大的非线性和不确定性处理能力在图像识别.语音识别.自然语言处理等领域取得了显著的成效.它是一种端到端的处理方法,在训练算法的指导下,深层神经网络自发 ...

最新文章

  1. pandas使用read_csv函数读取文件时指定数据列的数据类型、pandas使用read_csv函数读取文件时通过keep_default_na参数设置缺失值替换为空字符串
  2. python装饰器-python中的装饰器常用于哪些应用场景
  3. php cms 插件开发,phpcms编辑器插件最新版——ckeditor4.5
  4. Linux 内核抓包功能实现基础(三) 抓包服务器的实现
  5. android bench内存测试,华为p10内存测试软件(androbench) v5.0.1 免费版
  6. react学习(69)--置空操作
  7. vantUI组件:van-card 自定义内容 - 踩坑篇
  8. 企业级整站集群数据备份项目方案详解
  9. 如何从零设计一款牛逼的高并发架构(建议收藏)
  10. tensorflow一维卷积输入_深度学习中的反卷积(Transposed Convolution)
  11. php网页登录制作,thinkphp5 系统登录的实现
  12. 39. 二叉树的深度(C++版本)
  13. delphi7 获取计算机名,远程控制篇:获得网络邻居所有机器名_delphi教程
  14. ZPLII 指令参考
  15. 烽火通信实习应聘经验
  16. python中输入字符串_python如何输入字符串
  17. Linux进阶_加密和安全
  18. Android 打开相册选择图片(史上最简单)
  19. 送给 xdm 的 10 个 web 在线前端资源,优雅永不过时~
  20. 不需要密码卸载Symantec Endpoint Protection

热门文章

  1. 用python完成一个数独小游戏
  2. Android之sdcard保存数据
  3. nodejs websocket 并发调试笔记
  4. opencv中 画六边形
  5. 华为移动应用引擎安装第三方apk教程
  6. HDU Today-SPEA
  7. MFC SDL FFmpeg视频播放器开发教程(一)
  8. 13.2-“制作一款私有IAP串口下载小工具”之串口IAP的通信协议设计
  9. ZZNU2141: 2333
  10. linux gcc配置安装文件失败,安装一些环境时提示安装不成功帮一下看看什么情况(apt-get install gcc g++ ssh...