回顾以前的笔记

在keras中,内置了imdb电影评分数据集,来进行评价预测

安装keras

conda install keras

conda就帮依赖全部搞定,记得加源

导入imdb

from keras.datasets import imdb

数据集简要说明

  • 一个长长的英文句子,有的有几千单词,有的有几十,分类成好的评价和不好的评价

在数据中不是单词,而是单词的索引
一共就5万句子

import keras
from keras import layers
import matplotlib.pyplot as plt
%matplotlib inline
data = keras.datasets.imdb
max_word = 10000
# 加载前10000个单词 最大不超过10000
(x_train, y_train), (x_test, y_test) = data.load_data(num_words=max_word)

查看数据

x_train.shape, y_train.shape
OUT:
((25000,), (25000,))
x_train[0]
y_train[0]
OUT:
输出的是
词汇的index
输出的是
array([1, 0, 0, ..., 0, 1, 0], dtype=int64)
1 代表 正面评价 0 代表负面怕评价

加载index和词汇的对应关系

#加载词汇
word_index = data.get_word_index()
#将index和value 互换
index_word = dict((value, key) for key

影评情感分类(基于IMDB数据集)相关推荐

  1. 使用循环神经网络(RNN)实现影评情感分类

    最近由于做论文的补充实验,需要在rnn上做一下算法验证.找了一下这个博客写的挺好的,但是也有一些bug,暂时先记录一下. 使用循环神经网络(RNN)实现影评情感分类 作为对循环神经网络的实践,我用循环 ...

  2. 九、(1)情感分类——基于词典。评论。

    九.(1)情感分类--基于词典.评论. ----数据集留言邮箱发送 # -*- coding: utf-8 -*- """ Created on Thu Jun 13 2 ...

  3. 情感分类问题IMDB实战(SimpleRNN,LSTM,GRU)

    使用经典的 IMDB 影评数据集来完成情感分类任务. IMDB 影评数据集包含了50000 条用户评价,评价的标签分为消极和积极, 其中 IMDB 评级<5 的用户评价标注为0,即消极: IMD ...

  4. 【学习笔记】NLP之影评情感分类

    本文对影评数据进行NLP情感分类,数据分为标注数据(含sentiment)和非标注数据(不含sentiment),数据25000条,列出前五条如下: 自然语言处理和文本分析的问题中,词袋(Bag of ...

  5. 深度学习笔记(3)——pytorch+TextCNN实现情感分类(外卖数据集)

    文章目录 0 前言 1 数据准备 1.1 常量 1.2 加载数据集 2 数据预处理 3 文本表示 4 TextCNN模型 5 模型训练 6 模型评估 7 总览 8 完整代码 0 前言 使用数据集:某外 ...

  6. 学习笔记(05):自然语言处理Word2Vec视频学习教程-影评情感分类任务概述

    立即学习:https://edu.csdn.net/course/play/5226/106441?utm_source=blogtoedu pandas读入训练数据.

  7. 基于朴素贝叶斯和预训练Bert模型的中文句子情感分类实践

    基于朴素贝叶斯和预训练Bert模型的中文句子情感分类实践 1.任务介绍   本次实践选题为AI研习社2019年9月份举办的中文对话情感分析任务,并在原任务基础上进行了拓展.任务首先给定一中文语句数据集 ...

  8. python 多分类情感词典_基于情感词典的文本情感分类

    基于情感词典的文本情感分类 传统的基于情感词典的文本情感分类,是对人的记忆和判断思维的最简单的模拟,如上图.我们首先通过学习来记忆一些基本词汇,如否定词语有"不",积极词语有&qu ...

  9. 中文文本情感分类(基于LSTM和textCNN)

    中文新闻数据集 负面文本: 正面文本: 数据文本都是用爬虫从网络上爬取的,由人工进行分类,在使用这些数据之前,需要先对文本进行预处理,预处理包括去除标点符号,停用词过滤和分词等,由于篇幅有限,这里就不 ...

最新文章

  1. Tile Racer — 3D 赛车游戏
  2. Objective-C学习—UIWebView的使用
  3. java时间格式转换_Java中System.currentTimeMillis()计算方式与时间的单位转换
  4. 与优秀的人在一起进步:我发起的“乐学”分享活动
  5. 异常-异常捕获的完整语法
  6. 前端学习(2026)vue之电商管理系统电商系统之实现分页功能
  7. python函数实例解析_python支持返回函数的实例解析
  8. GridView类容器中的DropDownList联动
  9. SpringBoot中使用Hibernate Validator校验工具类
  10. qtableview删除选中行_如何批量删除PPT备注+如何修改模板信息
  11. 《深入理解 Spring Cloud 与微服务构建》第十五章 微服务监控 Spring Boot Admin
  12. [渝粤教育] 西南科技大学 现代企业管理 在线考试复习资料(2)
  13. java applet 教程_教你构建第一个Java Applet程序
  14. SpringBoot整合集成p6spy
  15. 图像常用的神经网络方法优缺点及应用总结
  16. Oracle的本地网络服务名配置
  17. vue中使用keep-alive无效以及include 和 exclude用法
  18. MATLAB中assignment模块,Simulink Matlab Function 模块使用问题求教
  19. java分哪几部分_Java体系主要分为三部分,下列哪个选项不是其中的一个组成部分?...
  20. VSLAM 相关知识点总结

热门文章

  1. Visual Studio Code / 开启自检文本编码方式的方法
  2. ESP32-S3芯片与ESP32及ESP32-S2比较好在哪里呢?官方到目前还没有任何信息发布,我们先来猜看都会有哪些性能的提升
  3. python子进程关闭fd_如果创建了multiprocessing.Pool,Python子进程wait()将失败
  4. 一个udp用户数据报的数据字段为8192_基于FPGA的千兆网UDP通信分析
  5. Android APP层 ShellUtils
  6. 想聊天?自己搭建个聊天机器人吧!
  7. php 时间操作归类
  8. LeetCode Subarray Sum Equals K
  9. Spring+SpringMVC +MyBatis整合配置文件案例66666
  10. NumPy-快速处理数据--ndarray对象--多维数组的存取、结构体数组存取、内存对齐、Numpy内存结构...