今天想学LSTM的情感分类,结果碰到了一系列问题,耽误了很多时间。特此记录!

一.项目来源

lesson53-情感分类实战
B站视频

二.碰到的问题

1.报错AttributeError: module ‘torchtext.data‘ has no attribute ‘Field‘

解决方法1(在这个方法中没啥用,但是记录一下)

  • 在2021年3月5日TorchText 0.9.0更新,一些API调用也发生变化

之前我们调用Field,TabularDataset,Iterator,BucketIterator是通过torchtext.data

import torch
import torchtext
from torchtext.data import Field,TabularDataset,Iterator,BucketIterator

在torchtext0.9环境下,会报AttributeError: module ‘torchtext.data’ has no attribute ‘Field’

  • 新的API调用代码如下(示例):
import torch
import torchtext
from torchtext.legacy.data import Field,TabularDataset,Iterator,BucketIterator

解决方法2(有用的)

因为这个项目是2020年,所以我把torchtext的版本往后退了。

  1. 先卸载原来的torchtext。
pip uninstall torchtext
  1. 下载0.6.0版本的
pip install torchtext==0.6.0

2.Can’t find model ‘en’

需要下载en_core_web_sm-3.0.0.tar.gz
在指定虚拟环境下执行命令:

pip install 存放位置/en_core_web_sm-3.0.0.tar.gz

同时需要下载spacy

pip install spacy==3.0.0

注意:spacy的版本要与en_core_web_sm版本要相同!!!spacy的版本要与en_core_web_sm版本要相同!!!spacy的版本要与en_core_web_sm版本要相同!!!重要的抒情说三遍!!!

3.torchtext 下载 IMDB 数据集时出现错误

import torch
from torch import nn, optim
from torchtext import data, datasetsTEXT = data.Field(tokenize='spacy',tokenizer_language='en_core_web_sm')
LABEL = data.LabelField(dtype=torch.float)
train_data, test_data = datasets.IMDB.splits(TEXT, LABEL)print('Number of training examples:', len(train_data))
print('Number of testing examples:', len(test_data))

虽然没报错了,但是数据集没下载下载,加载数据集为空,如下图:

这里的最后一行代码一般会自动下载imdb数据集,但是常常速度很慢很慢,而且如果没下载完成就退出的话,再运行就不会自动下载了。这里我发现下载的数据集会在project里面的.data\imdb\文件夹下。
解决方法是去
aclImdb_v1.tar.gz下载包,用浏览器下会稍微快点,主要是不会丢失连接。下载完成以后,把压缩包放到.data\imdb\文件夹下并且解压。之后再运行以上代码就不会报错了。

基于PyTorch的LSTM模型的IMBD情感分类遇到的问题相关推荐

  1. 基于Keras搭建LSTM网络实现文本情感分类

    基于Keras搭建LSTM网络实现文本情感分类 一.语料概况 1.1 数据统计 1.1.1 查看样本均衡情况,对label进行统计 1.1.2 计句子长度及长度出现的频数 1.1.3 绘制句子长度累积 ...

  2. 基于pytorch的LSTM模型构建

    上文我们利用pytorch构建了BP神经网络,LeNet,这次我们利用LSTM网络实现对MNIST数据集的分类,具体的数据获取方法本文不详细介绍,这里只要讲解搭建LSTM网络的方法以及参数设置. 这里 ...

  3. 【图像分类】基于PyTorch搭建LSTM实现MNIST手写数字体识别(双向LSTM,附完整代码和数据集)

    写在前面: 首先感谢兄弟们的关注和订阅,让我有创作的动力,在创作过程我会尽最大能力,保证作品的质量,如果有问题,可以私信我,让我们携手共进,共创辉煌. 在https://blog.csdn.net/A ...

  4. 基于Pytorch的LSTM实战160万条评论情感分类

    数据以及代码的github地址    说明:训练速度使用cpu会很慢 # 目标:情感分类 # 数据集 Sentiment140, Twitter上的内容 包含160万条记录,0 : 负面, 2 : 中 ...

  5. 基于神经网络算法LSTM模型对股票指数进行预测

    资源下载地址:https://download.csdn.net/download/sheziqiong/86813208 资源下载地址:https://download.csdn.net/downl ...

  6. Pytorch《LSTM模型》

    前面的博文我们讲了LSTM的原理与分析,这一篇我们用pytorch类LSTM做测试 完整测试代码如下,用于进行MNIST数据集测试,主要学习LSTM类的输入输出维度. 这里定义的LSTM模型是用了三层 ...

  7. 基于pytorch使用LSTM进行文本情感分析

    前言 大家好,我是阿光. 本专栏整理了<PyTorch深度学习项目实战100例>,内包含了各种不同的深度学习项目,包含项目原理以及源码,每一个项目实例都附带有完整的代码+数据集. 正在更新 ...

  8. 【图像分类】基于PyTorch搭建LSTM实现MNIST手写数字体识别(单向LSTM,附完整代码和数据集)

    写在前面: 首先感谢兄弟们的关注和订阅,让我有创作的动力,在创作过程我会尽最大能力,保证作品的质量,如果有问题,可以私信我,让我们携手共进,共创辉煌. 提起LSTM大家第一反应是在NLP的数据集上比较 ...

  9. 使用Google云平台实战基于PyTorch的yolo-v3模型

    对于计算机视觉爱好者来说,YOLO (You Only Look Once)是一个非常流行的实时目标检测算法,因为它非常快,同时性能非常好. 在本文中,我将共享一个视频处理的代码,以获取视频中每个对象 ...

最新文章

  1. MENUITEMINFO结构的翻译(转)
  2. angular2的模板语法
  3. 中职生转段计算机应用基础,吉林省2017年高等职业教育对口升学、中职—本科衔接试点转段考试安排通知...
  4. Docker 方式安装 RabbitMQ (ribbitmq linux 部署)
  5. Spark初识-Spark与Hadoop的比较
  6. vaex 处理海量数据_Vaex真香!几秒钟就能处理数十亿行数据,比Pandas、Dask更好用...
  7. Matlab与simulink中的数据类型
  8. 什么叫直播秒开?如何实现秒开?
  9. Atitit 代码的导航 1.1.代码的层次导航 语句 函数方法 类 包 1.2.4.4. 代码可视化 流程图 一个方法内,多个代码行的关系图 语句to方法 2 1.3.4.5. 类图 类结构
  10. Java课程设计之简易计算器:设计的计算器应用程序是基于AWT的,可以完成加法、减法、乘法、除法和取余运算。
  11. Win10 如何将40G大文件极致压缩
  12. 盒子模型(Box Model)
  13. MC皮肤站和外置登陆教程
  14. 【目标检测-YOLO】YOLOv5-yolov5s TensorRT部署准备之ONNX导出(第一篇)
  15. 编程之美 笔记之——24点游戏
  16. (附源码)springboor大学生防疫封校管理系统 毕业设计632124
  17. Spring3.1.0实现原理分析(七).填充Bean属性,初始化Bean,登记善后处理,注册单例Bean...
  18. AI坦克对战(实现人机)
  19. 电脑计算机里怎么找恢复出厂设置,Windows系统电脑如何恢复出厂设置?
  20. 基于白点检测的数码相机自动白平衡算法实现(Opencv+vs)

热门文章

  1. 20条关键的高可用性设计原则
  2. 杰奇CMS phpmyadmin清空数据库ID归零重新入库数据SQL语句教程
  3. Revit中记忆快速修改未识别的梁及“快速生成过梁”
  4. 智慧食堂真稳住了吗?你可千万别错过了
  5. 职工信息管理系统课设c语言
  6. android 8 多媒体,1-4月中控多媒体搭载率接近8成,安卓+大屏正成为主流
  7. mysql索引优化cbo
  8. 批处理操作系统与分时操作系统的工作方式
  9. tcpdump与Wireshark抓包分析
  10. 51驱动AS608光学指纹识别模块 12864显示