1. Stanza

项目中需要通过Stanford的CoreNLP提取一些linguistic features。

在官网的介绍中提到,用python语言来调用CoreNLP的best practice是使用他们开发的stanza 库。

We are actively developing a Python package called Stanza, with state-of-the-art NLP performance enabled by deep learning. Besides, this package also includes an API for starting and making requests to a Stanford CoreNLP server. It is the recommended way to use Stanford CoreNLP in Python.

Stanza: Official Stanford NLP Python package, covering 70+ human languages, as well as biomedical English text.

1.1 安装

使用pip安装

pip install stanza

使用conda安装

conda install -c stanfordnlp stanza

从源码安装

git clone https://github.com/stanfordnlp/stanza.git
cd stanza
pip install -e .

注意:如果你的python版本是3.9,那么用conda是装不上的,会提示你的版本太新,如下面的报错所示。而用pip安装则不会有这个问题。

UnsatisfiableError: The following specifications were found
to be incompatible with the existing python installation in your environment:Specifications:- stanza -> python[version='>=3.6,<3.7.0a0|>=3.7,<3.8.0a0']Your python: python=3.9

1.2 使用

Getting Start可以参考官方提供的notebook

还有官方提供的一些demo:https://stanfordnlp.github.io/stanza/pipeline.html。在这里,可以看到使用stanza可以得到pos,依赖关系等特征。

2. DBPedia

DBPedia可以直接使用docker镜像:https://hub.docker.com/r/dbpedia/dbpedia-spotlight

先pull,然后再启动镜像。

用python的requests库请求下面的链接,即可得到相应的标注结果:

curl http://localhost:2222/rest/annotate \--data-urlencode "text=President Obama called Wednesday on Congress to extend a tax break for students included in last year's economic stimulus package, arguing that the policy provides more generous assistance." \--data "confidence=0.35" \-H "Accept: text/turtle"

stanza和DBPedia的安装与使用相关推荐

  1. 关于Stanza工具包的使用

    目录 一.Stanza简要介绍 二.Stanza使用 2.1 安装方法 2.2 使用说明 2.2.1 以英文文本说明: 2.2.2 以中文文本说明: 一.Stanza简要介绍 Stanza是一个Pyt ...

  2. NLP工具——自制zero-shot事件抽取器

    NLP工具--自制zero-shot事件抽取器 0. 简介 1. 抽取全部潜在的事件 2. 抽取特定类型的事件 3. 结语 0. 简介 在事件抽取任务中,数据的获取是一件非常关键工作,由于数据标注的成 ...

  3. win10安装stanza及简单使用

    官方stanza使用文档: https://stanfordnlp.github.io/stanza/installation_usage.html 安装tourch1.4 pip install t ...

  4. 安装Stanza(处理Stanza无法下载语言模型的错误:ConnectionError)

    安装Stanza (Debug记录)处理Stanza无法下载语言模型的错误:ConnectionError 根据官方文档进行stanza初始安装 pip install stantza >> ...

  5. 轻量级NLP工具Trankit开源,中文处理更精准,超越斯坦福Stanza,内存占用小45%

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最新轻量 ...

  6. Manning大神牵头,斯坦福开源Python版NLP库Stanza:涵盖66种语言

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 转自:机器之心 对于斯坦福 NLP 库,我们一定不会陌生,但是这一库主要基于 Java ...

  7. 【重磅来袭】斯坦福开源Python版NLP库Stanza:涵盖66种语言!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 对于斯坦福 NLP 库,我们一定不会陌生,但是这一库主要基于 Java.近日,Ch ...

  8. 轻量级NLP工具开源,中文处理更精准,超越斯坦福Stanza

    2021-04-02 12:51:35 梦晨 发自 凹非寺 量子位 报道 | 公众号 QbitAI 最新轻量级多语言NLP工具集Trankit发布1.0版本,来自俄勒冈大学. 基于Transforme ...

  9. 斯坦福python中文分词stanza

    斯坦福python中文分词stanza 1 下载 Stanford CoreNLP相关文件 下载完整的组件 https://stanfordnlp.github.io/CoreNLP/index.ht ...

最新文章

  1. 三维点云分割综述(上)
  2. gz文件解压命令 linux_linux常用命令和文件上传(FZ)、解压、配置环境变量(JDK)
  3. FreeMaker导出word
  4. REMOTE_ADDR,HTTP_CLIENT_IP,HTTP_X_FORWARDED
  5. WEB安全_csrf攻击
  6. 题解 T28305 【yizimi的旅游景点】
  7. webpart template
  8. 再谈strncpy函数--值得一看的好文章
  9. linux下maxwell安装教程,完美起航-Maxwell采集binlog系列(二)-Linux系统安装MySQL
  10. 今晚直播:WLS/WAS故障基本分析介绍
  11. 关于vs2015各版本的卸载
  12. SAAS--01HRM系统概述与搭建环境
  13. samba服务设置与访问共享文件夹
  14. 虚拟大师怎么修改手机_怎么修改手机应用名称
  15. 第一章 嵌入式系统概述——ARM
  16. java生成点阵图_点阵字库在JAVA中的实现
  17. 设置360极速浏览器的模式默认为极速模式
  18. 2020年最好用的离线下载网盘,不限速度和空间
  19. Python学习之道-串口Modbus开发
  20. 编写两个过滤器,一个过滤器在 web 服务时,起用 UTF-8 编码,以处理 web 服务时的乱码问题。 另一个过滤器用来判断用户是否登录,只有登录用户方可访问/view 子目录。

热门文章

  1. 干货|23种最好用的3D打印软件工具
  2. Access、Foxpro、Foxbase,2023年找到完美代替,有Excel基础即可
  3. 干货 | 京东云托管Kubernetes集成镜像仓库并部署原生DashBoard
  4. PySide2学习总结(三)QtWidgets和QML
  5. 简信CRM:超实用的移动CRM选型参考指南
  6. 青岛VR全景制作免费方法教程
  7. 【NOIP2015】洛谷2668 斗地主
  8. office 2007 word空格消失的问题
  9. 利用Python(pyserial、minimalmodbus、modbus_tk)进行单片机通信
  10. Codeforces Round #766 (Div. 2)C. Not Assigning