分词–list of list格式

(df2的来源请看上一篇博客https://blog.csdn.net/dongzixian/article/details/103474094)

import jieba
df2['cut'] = df2[0].apply(jieba.lcut)
df2.head()

from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test = train_test_split(df2['cut'],df2['class'],test_size=0.3)
x_train

from gensim.models.word2vec import Word2Vec
model = Word2Vec(size=400,min_count=5)
model.build_vocab(x_train)
model.build_vocab(x_train)

model.wv.most_similar("好",topn=100)

model.wv.most_similar("不好",topn=100)

model.wv["不好"]

生成句向量
print(df2.cut[0])#(第一条)
print("第一条评论分词后词个数为:",len(df2.cut[0]))

将第一条评论转成word2vec矩阵
pd.DataFrame([model.wv[i] for i in df2.cut[0] if i in model.wv])

将第一条评论转成向量
vec1 = pd.DataFrame([model.wv[i] for i in df2.cut[0] if i in model.wv]).mean()
print(vec1)


生成word2vec句向量

def sen2vec(words):return  pd.DataFrame([model.wv[i] for i in df2.cut[0] if i in model.wv]).mean()
train_vec =  pd.DataFrame([sen2vec(s) for s in x_train])
train_vec

分类模型–支持向量机

from sklearn.svm import SVC
clf2 = SVC()
clf2.fit(train_vec,y_train)

clf2.score(train_vec,y_train)

SVM

from sklearn.metrics import classification_report
print(classification_report(y_train,clf2.predict(train_vec)))

生成测试集word2vec句向量

def sen2vec(words):return  pd.DataFrame([model.wv[i] for i in words if i in model.wv]).mean()
test_vec =  pd.DataFrame([sen2vec(s) for s in x_test])
test_vec
clf2.score(test_vec,y_test)

from sklearn.metrics import classification_report
print(classification_report(y_test,clf2.predict(test_vec)))

预测新评论

s = """...新评论..."""
s_seg1 = jieba.lcut(s)
s_word2vec = pd.DataFrame([model.wv[i] for i in s_seg1 if i in model.wv])
s_word2vec
s_vec = s_word2vec.mean()
s_vec
import numpy as np
s_vec = np.array(s_vec)
s_vec = s_vec.reshape(1,-1)
result_svm = clf2.predict(s_vec)
result_sum

情感分析--word2vec相关推荐

  1. python word2vector_python使用Word2Vec进行情感分析解析

    python实现情感分析(Word2Vec) ** 前几天跟着老师做了几个项目,老师写的时候劈里啪啦一顿敲,写了个啥咱也布吉岛,线下自己就瞎琢磨,终于实现了一个最简单的项目.输入文本,然后分析情感,判 ...

  2. 情感分析的描述、基于词袋模型和word2vec模型的情感分析实现

    情感分析的描述.基于词袋模型和word2vec模型的情感分析实现 以购物评论为例: # 读入原始数据集 import pandas as pddfpos = pd.read_excel('../dat ...

  3. Pytorch+Text-CNN+Word2vec+电影评论情感分析实战

    文章目录 0.前言 1.电影评论数据集 2.数据读取 3.数据预处理 4.准备训练和测试集 5.加载词向量模型Word2vec 6.定义网络 7.训练网络 8.测试网络和可视化 9.总结 0.前言 很 ...

  4. 情感分析的现代方法(包含word2vec Doc2Vec)

    英文原文地址:https://districtdatalabs.silvrback.com/modern-methods-for-sentiment-analysis 转载文章地址:http://da ...

  5. html标签 对word2vec,自然语言学习——使用word2vec对文本进行情感分析

    本文主要讲述了如何对影评数据做情感分析,就是如何判断这条评论是好评还是差评.对文本处理的方法是word2vec,然后用随机森林的方法构建模型,最后训练模型进行预测.前面一.二部分主要是讲述如何处理文档 ...

  6. Python自然语言处理相,新词发现,主题模型,隐马尔模型词性标注,Word2Vec,情感分析...

    向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程   公众号:datayx 代码环境:python --version 3.5.2 tensorflow keras 代码 ...

  7. 利用python分析电商_基于Word2Vec+SVM对电商的评论数据进行情感分析

    Word2Vec-sentiment 基于Word2Vec+SVM对电商的评论数据进行情感分析 首先是利用word2vec对正负评论数据进行词向量训练,然后利用SVM分类器对语料进行分类,具体的过程如 ...

  8. 使用word2vec对微博进行情感分析和分类

    Word2vec可以将词语转换为高维向量空间中的向量表示,它能揭示上下文关系.首先使用word2vec,将其训练得到词向量作为特征权重,然后根据情感词典和词性的两种特征选择方法筛选出有价值的特征,最后 ...

  9. 情感分析的新方法,使用word2vec对微博文本进行情感分析和分类

    向AI转型的程序员都关注了这个号??? 大数据挖掘DT数据分析  公众号: datadw 情感分析是一种常见的自然语言处理(NLP)方法的应用,特别是在以提取文本的情感内容为目标的分类方法中.通过这种 ...

最新文章

  1. tomcat限速_WEB服务的下载限速(二)(限速模块安装与配置)
  2. excel表格制作计算机一级,计算机一级OFFICE辅导:给Excel表格添加背景音乐
  3. .NET Core 2.1预览分层编译特性
  4. Hadoop MapReduce程序的模板框架
  5. 算法优化:动态规划加速,货物运输问题,四边形不等式, 从O(n^2)到O(n^3)
  6. python爬虫企业级技术点_Python爬虫必备技术点(一)
  7. python和sql_Python和SQL 2017的强大功能
  8. Java基础---匿名对象的理解和使用
  9. 瑞信中国前CEO唐臻怡加盟商汤科技出任副总裁
  10. 柔性太阳能电池pdf_电子科大刘明侦教授团队钙钛矿太阳能电池研究取得重要进展...
  11. 设计程序时,注意和外系统连携相关的处理
  12. testNg官方文档
  13. 【学习笔记】《Web安全深度剖析》整理
  14. 如何从Apple电子钱包中删除旧登机牌
  15. 量子计算基础(学习笔记)
  16. VUE学习(六) 高德地图常用功能总结
  17. 如何在抖音官网链接中一键复制微信号跳转微信
  18. 2019HDU多校第七场 HDU6656 Kejin Player H 【期望递归】
  19. Linux进程调度 - CFS调度器 LoyenWang
  20. json对象,java对象,json字符串,java字符串转换方式,没写的自己去看源码!

热门文章

  1. HTTPS和HTTPS证书
  2. Nginx——反向代理路径重写重定向实践示例
  3. 小米(红米)手机查看生产日期和启用日期
  4. 斐波那契数列(Fibonacci Sequence)
  5. 使用Xcode 4编译器设定Release/Debug教程
  6. IOS 开发一些常用的地址
  7. A Faster Volatile
  8. 查找两个已经排好序的数组的第k大的元素
  9. c++ using 前置声明_C++ 类声明 类前置声明范例
  10. Linux学习之系统编程篇:单个线程的退出函数