stanza和DBPedia的安装与使用
1. Stanza
项目中需要通过Stanford的CoreNLP提取一些linguistic features。
在官网的介绍中提到,用python语言来调用CoreNLP的best practice是使用他们开发的stanza
库。
We are actively developing a Python package called Stanza, with state-of-the-art NLP performance enabled by deep learning. Besides, this package also includes an API for starting and making requests to a Stanford CoreNLP server. It is the recommended way to use Stanford CoreNLP in Python.
Stanza: Official Stanford NLP Python package, covering 70+ human languages, as well as biomedical English text.
1.1 安装
使用pip安装
pip install stanza
使用conda安装
conda install -c stanfordnlp stanza
从源码安装
git clone https://github.com/stanfordnlp/stanza.git
cd stanza
pip install -e .
注意:如果你的python版本是3.9,那么用conda是装不上的,会提示你的版本太新,如下面的报错所示。而用pip安装则不会有这个问题。
UnsatisfiableError: The following specifications were found
to be incompatible with the existing python installation in your environment:Specifications:- stanza -> python[version='>=3.6,<3.7.0a0|>=3.7,<3.8.0a0']Your python: python=3.9
1.2 使用
Getting Start可以参考官方提供的notebook
还有官方提供的一些demo:https://stanfordnlp.github.io/stanza/pipeline.html。在这里,可以看到使用stanza可以得到pos,依赖关系等特征。
2. DBPedia
DBPedia可以直接使用docker镜像:https://hub.docker.com/r/dbpedia/dbpedia-spotlight
先pull,然后再启动镜像。
用python的requests库请求下面的链接,即可得到相应的标注结果:
curl http://localhost:2222/rest/annotate \--data-urlencode "text=President Obama called Wednesday on Congress to extend a tax break for students included in last year's economic stimulus package, arguing that the policy provides more generous assistance." \--data "confidence=0.35" \-H "Accept: text/turtle"
stanza和DBPedia的安装与使用相关推荐
- 关于Stanza工具包的使用
目录 一.Stanza简要介绍 二.Stanza使用 2.1 安装方法 2.2 使用说明 2.2.1 以英文文本说明: 2.2.2 以中文文本说明: 一.Stanza简要介绍 Stanza是一个Pyt ...
- NLP工具——自制zero-shot事件抽取器
NLP工具--自制zero-shot事件抽取器 0. 简介 1. 抽取全部潜在的事件 2. 抽取特定类型的事件 3. 结语 0. 简介 在事件抽取任务中,数据的获取是一件非常关键工作,由于数据标注的成 ...
- win10安装stanza及简单使用
官方stanza使用文档: https://stanfordnlp.github.io/stanza/installation_usage.html 安装tourch1.4 pip install t ...
- 安装Stanza(处理Stanza无法下载语言模型的错误:ConnectionError)
安装Stanza (Debug记录)处理Stanza无法下载语言模型的错误:ConnectionError 根据官方文档进行stanza初始安装 pip install stantza >> ...
- 轻量级NLP工具Trankit开源,中文处理更精准,超越斯坦福Stanza,内存占用小45%
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最新轻量 ...
- Manning大神牵头,斯坦福开源Python版NLP库Stanza:涵盖66种语言
点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 转自:机器之心 对于斯坦福 NLP 库,我们一定不会陌生,但是这一库主要基于 Java ...
- 【重磅来袭】斯坦福开源Python版NLP库Stanza:涵盖66种语言!
关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 对于斯坦福 NLP 库,我们一定不会陌生,但是这一库主要基于 Java.近日,Ch ...
- 轻量级NLP工具开源,中文处理更精准,超越斯坦福Stanza
2021-04-02 12:51:35 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最新轻量级多语言NLP工具集Trankit发布1.0版本,来自俄勒冈大学. 基于Transforme ...
- 斯坦福python中文分词stanza
斯坦福python中文分词stanza 1 下载 Stanford CoreNLP相关文件 下载完整的组件 https://stanfordnlp.github.io/CoreNLP/index.ht ...
最新文章
- 三维点云分割综述(上)
- gz文件解压命令 linux_linux常用命令和文件上传(FZ)、解压、配置环境变量(JDK)
- FreeMaker导出word
- REMOTE_ADDR,HTTP_CLIENT_IP,HTTP_X_FORWARDED
- WEB安全_csrf攻击
- 题解 T28305 【yizimi的旅游景点】
- webpart template
- 再谈strncpy函数--值得一看的好文章
- linux下maxwell安装教程,完美起航-Maxwell采集binlog系列(二)-Linux系统安装MySQL
- 今晚直播:WLS/WAS故障基本分析介绍
- 关于vs2015各版本的卸载
- SAAS--01HRM系统概述与搭建环境
- samba服务设置与访问共享文件夹
- 虚拟大师怎么修改手机_怎么修改手机应用名称
- 第一章 嵌入式系统概述——ARM
- java生成点阵图_点阵字库在JAVA中的实现
- 设置360极速浏览器的模式默认为极速模式
- 2020年最好用的离线下载网盘,不限速度和空间
- Python学习之道-串口Modbus开发
- 编写两个过滤器,一个过滤器在 web 服务时,起用 UTF-8 编码,以处理 web 服务时的乱码问题。 另一个过滤器用来判断用户是否登录,只有登录用户方可访问/view 子目录。
热门文章
- 干货|23种最好用的3D打印软件工具
- Access、Foxpro、Foxbase,2023年找到完美代替,有Excel基础即可
- 干货 | 京东云托管Kubernetes集成镜像仓库并部署原生DashBoard
- PySide2学习总结(三)QtWidgets和QML
- 简信CRM:超实用的移动CRM选型参考指南
- 青岛VR全景制作免费方法教程
- 【NOIP2015】洛谷2668 斗地主
- office 2007 word空格消失的问题
- 利用Python(pyserial、minimalmodbus、modbus_tk)进行单片机通信
- Codeforces Round #766 (Div. 2)C. Not Assigning