文章目录

一、前期工作

  1. 导入库包
  2. 导入数据
  3. 数据处理

二、神经网络模型构建
三、训练模型与测试

大家好,我是微学AI,今天给大家带来一个京东商品评论的情感分析与预测实战案例。
进几年网上购物越来越流行,在加上疫情的缘故,很多人足不出户,使得更多人选择网购。这让京东、淘宝、拼多多等电商平台得到了很大的发展机遇。但是,这种需求也引发了更多的店商平台的激列竞争。在这种电商平台激烈竞争的大背景下,除了提高商品质量、压低商品价格外。了解更多消费者的心声对干店商平台来说也变得越来越有必要,其中非常重要的方式就是对消费者的文本评论等非结构化的数据进行内在信息的数据挖掘和分析,有利于对应商品的生产厂家自身竞争力的提升。
对某商品的评论进行文本挖掘分析,目的是分析用户对某商品的情感倾向,从商品评论中挖掘产品的优点和缺点,提炼出不同品牌商品的卖点。

一、前期工作

1. 导入库包

import data_loader
from tensorflow.keras.preprocessing import sequence
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Embedding
from tensorflow.keras.layers import Flatten
from tensorflow.keras.utils import to_categorical
import numpy as np

代码中导入data_loader模型,做数据处理和导入,详细代码包和数据集:https://pan.baidu.com/s/14Do1RrZXOzZokNAcX4Yz2A
提取码:wxai

2. 导入数据

x_train,y_train,x_test,y_test =data_loader.load_data()

这里选取了某电商平台的各种商品的评论数据,数据样例:

3. 数据处理

#创建评论数据的词库索引
vocalen,word_index = data_loader.createWordIndex(x_train,x_test)
print(vocalen)#获取训练数据每个词的索引
x_train_index =data_loader.word2Index(x_train,word_index)
x_test_index=data_loader.word2Index(x_test,word_index)#最大长度的限制
maxlen =25
x_train_index =sequence.pad_sequences(x_train_index,maxlen=maxlen )
x_test_index =sequence.pad_sequences(x_test_index,maxlen=maxlen)
y_train= to_categorical(y_train)
y_test= to_categorical(y_test)

二、神经网络模型构建

model =Sequential()
model.add(Embedding(trainable=False, input_dim= vocalen+1, output_dim=300, input_length=maxlen))
model.add(Flatten())
model.add(Dense(256, activation='relu'))
model.add(Dense(256, activation= 'relu'))
model.add(Dense(256, activation='relu'))
model.add(Dense(1, activation= 'sigmoid'))
model.compile(loss='binary_crossentropy', optimizer='adam',metrics=['accuracy']) #二分类问题

三、训练模型与测试

model.fit(x_train_index, y_train,batch_size=512, epochs=200)
score, acc = model.evaluate(x_test_index, y_test)
print('Test score:', score)
print('test accuracy:',acc)test = np.array([x_test_index[1000]])
print(test)
print(test.shape)predict = model.predict(test)
print(predict)
print(np.argmax(predict,axis=1))

运行结果:
Test score: 1.740
test accuracy: 0.8563
在测试集的准确率为0.8563
机器借助模型可以对评论标注情感分析的标签,本文适合入门者阅读调试,后续将进行文本主题挖掘,分析商品的优点与缺点,提供需要改进的方向。

深度学习实战7-电商产品评论的情感分析相关推荐

  1. 数据分析与挖掘实战-电商产品评论数据情感分析

    电商产品评论数据情感分析 背景 随着网上购物越来越流行,人们对于网上购物的需求越来越高,这让京东.淘宝等电商平台得到了很大的发展机遇.但是,这种需求也推动了更多的电商平台的崛起,引发了激烈的竞争.在这 ...

  2. 数据挖掘实战—电商产品评论数据情感分析

    文章目录 引言 一.评论预处理 1.评论去重 2.数据清洗 二.评论分词 1.分词.词性标注.去除停用词 2.提取含名词的评论 3.绘制词云查看分词效果 三.构建模型 1.评论数据情感倾向分析 1.1 ...

  3. 数据挖掘作业学习学习笔记-电商产品评论数据情感分析

    使用的教材:<电商产品评论数据情感分析> 作业&学习笔记:数据挖掘第14周 说明:书本内容详实.此篇用于自己期末回顾知识的重点内容,故做出的学习笔记缺省了书本原本的其他精粹. 随着 ...

  4. 【项目实战】Python实现基于LDA主题模型进行电商产品评论数据情感分析

    说明:这是一个机器学习.数据挖掘实战项目(附带数据+代码+文档+视频讲解),如需数据+代码+文档+视频讲解可以直接到文章最后获取. 视频: Python实现基于LDA模型进行电商产品评论数据情感分析 ...

  5. 《Python数据分析与挖掘实战》第15章 ——电商产品评论数据情感分析(LED)

    文章目录 1.挖掘背景与目标 2.2 数据探索与预处理 2.1 数据筛选 2.2 数据去重 2.3 删除前缀评分 2.4 jieba分词 3 基于LDA 模型的主题分析 4.权重 5.如何在主题空间比 ...

  6. 毕业设计之 - 大数据分析:电商产品评论数据情感分析

    文章目录 1 简介 数据分析目的 数据预处理 评论去重 数据清洗 分词.词性标注.去除停用词 提取含名词的评论 绘制词云¶ 词典匹配 评论数据情感倾向分析 修正情感倾向 LinearSVC模型预测情感 ...

  7. 数据分析与挖掘:电商产品评论数据情感分析

    电商产品评论数据情感分析 1. 背景与挖掘目标 2. 分析方法与过程 2.1 数据抽取 2.2 评论预处理 2.3 LDA 主题分析 1. 背景与挖掘目标 项目为<Python 数据分析与挖掘实 ...

  8. 基于电商产品评论数据情感分析

    #!/usr/bin/env python # coding: utf-8# # -- 基于电商产品评论数据情感分析 --# ### 1.案例简介 # # 1.利用文本挖掘技术,对碎片化.非结构化的电 ...

  9. Python文本挖掘练习(五)// 电商产品评论数据情感分析

    第一部分 案例简介 本案例首先利用Python文本挖掘技术,对碎片化.非结构化的电商网站评论数据进行清洗与处理,转化为结构化数据.然后对文本数据进一步挖掘与分析,采用决策树算法构建情感分类模型,探索用 ...

  10. 基于python文本挖掘的电商产品评论数据情感分析报告

    背景 近年来,随着互联网的广泛应用和电子商务的迅速发展,网络文本及用户评论分析意义日益凸显,因此网络文本挖掘及网络文本情感分析技术应运而生,通过对文本或者用户评论的情感分析,企业能够进行更有效的管理等 ...

最新文章

  1. Scala特质(类似Java中的接口)
  2. mybatis没有clob类型_mybatis将Oracle的Clob类型转成String的方法
  3. unity实用技术:色盲玩家也能享受好的游戏体验
  4. 前端学习(1543):MVC的组成部分
  5. 微课|中学生可以这样学Python(7.3.3节):成员方法、类方法、静态方法
  6. linux消息队列编程实例
  7. 移动机器人参数校准的原由
  8. VBScript基础
  9. Java实验14 计算多个二维图形的面积之和
  10. 一流程序员靠数学,二流程序员靠算法,低端看高端就是黑魔法!网友:我是七流靠复制
  11. 【Web动画】SVG 线条动画入门
  12. 微观经济学第七周作业(生产函数,规模报酬,投入产出)
  13. hbuilderx ios自定义基座真机测试
  14. ctfshow刷题日记sql注入篇
  15. 组建一个计算机网络系统有,组建一个计算机网络一般需要哪些部件
  16. CodeBlocks最全官方配色方案
  17. 列举5种以上表单元素中input的type类型
  18. 谷粒学院-阿里云短信服务
  19. 华为HCNA实验19-21
  20. OPNET Modeler 软件编辑器的简单介绍

热门文章

  1. 罗技键盘+android风格,Logitech 罗技 K480 蓝牙键盘,IOS、OSX 和安卓三大系统使用体验...
  2. R|广义线性模型知识点归纳
  3. 【原创】MapGIS K9 三维二次开发入门
  4. 如何进行音频合并?很简单,只需三步骤
  5. CentOS7(Linux)详细安装教程
  6. vega56刷64_AMD Vega 56显卡能刷成Vega 64真相了
  7. 前段时间的学习小结——体脂率的计算
  8. dex2jar源码解析----smail转dex
  9. Unity快速入门教程-手机游戏开发前的准备(手机模拟器Simulator)
  10. 2020电脑服务器cpu性能天梯图,CPU天梯图2020年最新版 最新电脑CPU性能排行榜