最近要使用一下 spacy 库,安装版本为 spacy 3.0.6。
其他环境版本为, torch 版本为 1.8.1+cu111,torchtext 0.9.1.

但是,装完 spacy库后却一直无法安装 en_core_web_sm,一开始使用的以下官方给的安装命令

python -m spacy download en_core_web_sm

但是却半天没有反应,可能是网络问题?不清楚到底什么原因。

后来,看到 这篇博客 后改为使用本地安装:

  1. 先去官网下载 en_core_web_sm-3.0.0 ; (其他版本同理)
  2. 然后,将下载好的文件通过 xftp 上传到服务器;
  3. 最后,在指定虚拟环境下执行命令:
    pip install 存放位置/en_core_web_sm-2.1.0.tar.gz

终于安装成功啦!

到这里,en_core_web_sm-3.0.0 安装是完成了,但是使用 torchtext 下载 IMDB 数据集时又出现错误:

from torchtext.legacy import datasetstrain_data, test_data = datasets.IMDB.splits(TEXT, LABEL) # 使用 torchtext 下载 IMDB 数据集

第一次运行报错如下:

应该是网络的问题?英语不好也没看太懂。

第二次再运行,虽然没报错了,但是数据集没下载下载,加载数据集为空,如下图:

然后参考这位dalao的博客 torchtext-IMDB数据集下载过慢解决了。

思路还是同上安装 en_core_web_sm-3.0.0 一样,先去官网下载文件(IMDB 数据集),然后上传到服务器并解压。

安装 IMDB 数据集,两点注意:

  1. 先运行代码,程序会在当前目录下生成一个 .data/imdb 的隐藏文件夹;
  2. 然后将下载的 aclImdb_v1.tar.gz 文件,放到(mv)隐藏文件夹 .data/imdb中,不是自己新建 data/imdb
    (一开始我就是傻乎乎的这样,后来还是torchtext-IMDB数据集下载过慢博主dalao帮忙解决的),万分感谢。
  3. 使用 ls -a 可以查看当前目录所有文件(包括隐藏文件夹 .data)
  • linux 解压 "*.tar.gz"文件 命令 : tar -zxvf 压缩文件名.tar.gz

安装 en_core_web_sm-3.0.0相关推荐

  1. mysql8.0.12最小化安装_简述MySql8.0编译安装过程

    [[email protected] ~]# cat /etc/redhat-release CentOS Linux release 8.0.1905 (Core) 注意:不要用8以下的系统编译My ...

  2. 在CentOS 6.6 64bit上安装Oracle VirtualBox 5.0.12

    VirtualBox是一款开源虚拟机软件(类似vmware).VirtualBox是由德国Innotek公司开发,由Sun Microsystems公司出品的软件,使用Qt编写,在Sun被Oracle ...

  3. 在Win 8.1上安装配置FlashDevelop5.0.0

    FlashDevelop是基于.NET框架的开源软件,只能在Windows环境下面运行,相较于Flash CS和FlexBuilder, 它非常轻量级.FlashDevelop只是一个代码编辑器,而不 ...

  4. Varnish Cache 3.0.0安装

    https://www.varnish-cache.org/installation/redhat Installation on RedHat 先按需要的模块 在安装软件包之前首先看看主机上的 au ...

  5. centos 6.8 源码安装 erlang/otp 19.0.2

    2019独角兽企业重金招聘Python工程师标准>>> 最近一直都是在debian jessie下开发erlang代码,但部署环境一直都是在centos 6上面,发现centos 6 ...

  6. windows 如何安装oracle 补丁包,Windows Server 2003 上安装 Oracle10g(10.2.0.1)并升级 至补丁(10.2.0.4) 图解...

    Windows Server 2003 上安装 Oracle10g(10.2.0.1)并升级 至补丁(10.2.0.4) 图解 第一部分:安装 Oracle 10.2.0.1 1.选择安装方法 2.选 ...

  7. 离线安装k8s 1.9.0

    说明 本文参考 https://segmentfault.com/a/1190000012755243.在前 文基础上整理.增加说明,避坑. 踩过的坑: 安装k8s 1.9.0 实践:问题集锦 环境说 ...

  8. Windows10安装Mysql5.7.19.0 msi 版本报错

    安装环境:Windows10 安装版本:MySql 5.7.19.0 msi 1.安装5.7.19.0 msi版本Mysql时报如下错误: 2.根据日志分析是缺少visual Studio 2013 ...

  9. CentOS7安装配置redis-3.0.0

    一.安装必要包 yum install gcc 二.linux下安装 #下载 wget http://download.redis.io/releases/redis-3.0.0.tar.gz tar ...

最新文章

  1. 美国动物园小鹿“撞脸”韩国艺人 粉丝众筹为其取名
  2. 销售员的四大重要素质
  3. Longest Substring Without Repeating Characters(最长不重复子序列求解)
  4. XML 和 HTML中常用的转义字符
  5. 增量调制原理matlab仿真,增量调制(DM  △M)
  6. Hive 大小表关联查询异常
  7. matlab计算频域动态性能指标,基于MATLAB自动控制系统时域频域分析与仿真.doc
  8. python核心编程五——映像和集合
  9. 全国人口净流入城市排名2020_从人口净流入量来看一线城市吸引力的对比分析...
  10. 中国移动开通eSIM 一号双终端将要取代传统SIM卡?
  11. 疫情期间,世界顶尖艺术学院-伦敦艺术大学开启教学新模式
  12. SQL server中表数据自动生成拼音码
  13. windows ip管理之netsetman
  14. 第三周作业-实现随机点名的签到程序
  15. 【STM32H7的DSP教程】第26章 FFT变换结果的物理意义
  16. 22 个最常用的Python包
  17. GitHub生成token
  18. 申请软件著作权步骤如下
  19. linux查看当前账号权限,Linux账号权限管理
  20. 图学习推荐系统综述| Graph Learning Approaches to Recommender Systems

热门文章

  1. 寻找客户的“痛点”---离岸开发的新视点
  2. 电子标签智能井盖有什么用
  3. 和平精英连接服务器未响应,和平精英卡顿怎么解决-和平精英卡顿问题解决方法_快吧手游...
  4. 贾诩 - 简明历史传记
  5. php开源商城 yii,Yii2开源电商商城Fecshop
  6. Linux图形图像处理软件
  7. C++11 新特性。
  8. 2. 嵌入式Linux系统移植 - 交叉编译工具集
  9. Tableau 错误代码: 6EA18A9E,导入自定义地理时发生意外错误,无法完成操作
  10. 【图像处理】基于MATLAB FCM(模糊聚类)的侧扫声呐图像分割