Word2Vec-sentiment

基于Word2Vec+SVM对电商的评论数据进行情感分析

首先是利用word2vec对正负评论数据进行词向量训练,然后利用SVM分类器对语料进行分类,具体的过程如下:

第一步:加载数据、进行jieba分词、对数据进行随机切分,生成训练集和测试集(对应的代码部分为data_seal.py)

pos = pd.read_table('E:/NLP/chinese-w2v-sentiment/data/pos.csv',header=None,index_col=None)

neg = pd.read_table('E:/NLP/chinese-w2v-sentiment/data/neg.csv',header=None,index_col=None)

导入数据,然后利用jieba对数组进行分词,将分词结果与生成的相同维度的标签table数组进行合并,合并的方式有很多种:这里我用的是np.append(a,b,axis=0) 的方式。数据准备好了之后就是对数据进行切分,随机生成测试数据集和训练集,这里的比例test_size可以根据数据的实际大小进行设置,正常设置成0.2和0.3。

为了后面的运算方便,对切分的数据进行保存。分别为data文件下的x_train_data、x_test_data、y_train_data、y_test_data。

第二步:计算每段话的向量(代码对应的是word_vec.py和model.py)

通过遍历每句话中每个词的词向量,然后求均值,将均值表示为这一句话对应的向量,当然这里只是简单初级的处理,也可以参考doc2vec的方法对 句子进行向量化,但是工程应用上的效果不是特别好,大家也可尝试一下看看,这里毕竟只是初级的教程。

第三步:训练SVM模型(代码对应的是train_model.py)

第四步:对单个句子进行分类,情感判断(对应的代码为model_test.py)

利用python分析电商_基于Word2Vec+SVM对电商的评论数据进行情感分析相关推荐

  1. python画哪吒_用Python爬取暑期档大火的《哪吒》,20W+评论数据,我们分析一波...

    原标题:用Python爬取暑期档大火的<哪吒>,20W+评论数据,我们分析一波 说起这个暑期档的动画片,非<哪吒之魔童降世>莫属了! 上映第 1 天:89分钟,中国动画最快破 ...

  2. 基于出行住宿评论数据的情感分析研究(酒店篇,含python代码)

    携程酒店评论数据: 链接:https://pan.baidu.com/s/1zUtfc6Ku6W2sx99XdqeWcA  提取码:vkzs 停用词汇总: 链接:百度网盘 请输入提取码  提取码:02 ...

  3. snownlp对天猫商品评论数据进行情感分析(附源码)

    snowNLP介绍 SnowNLP是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中 ...

  4. 第四章:用Python对用户的评论数据进行情感倾向分析

    文章目录 项目背景 获取数据 情感倾向 senta_bilstm 模型 情感划分 数据描述 数据分析 总体评论倾向 评论分布 各分布的情感倾向 评论分词 去除停用词 绘制词云图 结论 本文可以学习到以 ...

  5. python酒店评论分析_GitHub - huangpd/senti_analysis: 利用Python实现酒店评论的中文情感分析...

    利用Python实现酒店评论的情感分析 情感极性分析,即情感分类,对带有主观情感色彩的文本进行分析.归纳.情感极性分析主要有两种分类方法:基于情感知识的方法和基于机器学习的方法.基于情感知识的方法通过 ...

  6. python酒店评论分析_GitHub - yikedouer/senti_analysis: 利用Python实现酒店评论的中文情感分析...

    利用Python实现酒店评论的情感分析 情感极性分析,即情感分类,对带有主观情感色彩的文本进行分析.归纳.情感极性分析主要有两种分类方法:基于情感知识的方法和基于机器学习的方法.基于情感知识的方法通过 ...

  7. 利用Python实现酒店评论的中文情感分析,含数据集

    利用Python实现酒店评论的情感分析 完整代码下载地址:利用Python实现酒店评论的中文情感分析 情感极性分析,即情感分类,对带有主观情感色彩的文本进行分析.归纳.情感极性分析主要有两种分类方法: ...

  8. python酒店评论分析_GitHub - jiahuiiii/senti_analysis: 利用Python实现酒店评论的中文情感分析...

    利用Python实现酒店评论的情感分析 情感极性分析,即情感分类,对带有主观情感色彩的文本进行分析.归纳.情感极性分析主要有两种分类方法:基于情感知识的方法和基于机器学习的方法.基于情感知识的方法通过 ...

  9. [Python人工智能] 三十四.Bert模型 (3)keras-bert库构建Bert模型实现微博情感分析

    从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章开启了新的内容--Bert,首先介绍Keras-bert库安装及基础用法及文本分类工作.这篇文章将通过keras- ...

最新文章

  1. 【CVPR 2021】首次实现将GAN压缩22倍,性能比原始模型还高!
  2. 解决由于DNS解析导致Emacs启动巨慢的问题
  3. python http服务器_超简单的Python HTTP服务
  4. Oracle 中UNDO与REDO的差别具体解释
  5. vue获取DOM元素并设置属性
  6. 程序员面试金典 - 面试题 17.14. 最小K个数(快排划分O(n))
  7. Android RecyclerView使用详解(一)
  8. 人工智能python基础知识_AI 人工智能基础知识-习题
  9. 关于学习Python的一些心得
  10. 【数据库系统设计】数据库安全性
  11. matlab 标准色度图,采用Matlab图像进行有色溶液样液浓度测试
  12. coreldraw怎样定数等分_CorelDRAW基础教程,教你cdr如何等分分割图片
  13. 知道一点怎么设直线方程_已知两点坐标怎样求直线方程
  14. 软件工程实训项目(一)——IDEA连接Mysql数据库
  15. 前端面试题之 对Promise的理解
  16. VPS与云主机指南:了解五个主要区别
  17. arduino使用oled代码_Arduino提高篇04—U8g2库驱动OLED
  18. Windos10使用手册
  19. 金融科技之:农业供应链金融系统平台建设方案分享
  20. OSTEP-MLFQ(多级反馈队列)-HOMEWORK(simulation)

热门文章

  1. ipad协议835最新版
  2. VS2017登陆失败:我们无法刷新此账户的凭证、我们无法添加此账户发送请求时出错、评估期已结束,请登录以解除产品锁定
  3. IMP遇到IMP-00009错误
  4. Python 自动化:根据模板批量生成含指定数据的 word 文档
  5. 快速实现抖音的分享登录(android)
  6. JDK8——IntStream
  7. 2019校园招聘深信服数组翻转题
  8. 《C语言程序设计》江宝钏主编-习题3-7-交换变量
  9. @loj - 2478@「九省联考 2018」林克卡特树
  10. C语言贪吃蛇游戏主要功能,C语言游戏-贪吃蛇