-- coding: utf-8 --

“”"
@Time : 19-9-26 下午2:39
@Author : lei
@Site :
@File : 情感分析.py
@Software: PyCharm
“”"

情感分析

from sklearn.model_selection import train_test_split
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.naive_bayes import MultinomialNB
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import classification_report
import jieba
import pandas as pd
import numpy as np

data = pd.read_csv("./Train.csv", error_bad_lines=False, names=[“label”])

data.drop(0, axis=0, inplace=True)
data = np.array(data).tolist()

print(data)

data_list = [temp[0].split(’\t’) for temp in data]

print(data_list)

将得到的数据进行遍历得到目标值和特征值 并将数据进行转置

data = np.array([temp[1] for temp in data_list]).T
label = np.array([temp[0] for temp in data_list]).T

print(y_test.shape)

将字符串转换成Tf可识别的字符加空格形式

data = [" ".join(list(jieba.cut(temp))) for temp in data]

x_train, x_test, y_train, y_test = train_test_split(data, label, test_size=0.25)

print(x_train)

tf = TfidfVectorizer()
x_train = tf.fit_transform(x_train).toarray()
x_test = tf.transform(x_test).toarray()

mt = MultinomialNB(alpha=0.1)

mt.fit(x_train, y_train)
predict = mt.predict(x_test)
score = mt.score(x_test, y_test)
print(predict)
print(score)
print(classification_report(y_test, predict, target_names=[“1”, “2”, “0”, “4”, “5”]))

sklearn进行情感分析相关推荐

  1. 自然语言处理(NLP)之使用LSTM进行文本情感分析

    情感分析简介 文本情感分析(Sentiment Analysis)是自然语言处理(NLP)方法中常见的应用,也是一个有趣的基本任务,尤其是以提炼文本情绪内容为目的的分类.它是对带有情感色彩的主观性文本 ...

  2. 情感分析的描述、基于词袋模型和word2vec模型的情感分析实现

    情感分析的描述.基于词袋模型和word2vec模型的情感分析实现 以购物评论为例: # 读入原始数据集 import pandas as pddfpos = pd.read_excel('../dat ...

  3. 机器学习-情感分析-入门实战案例

    前言 情感分析属于自然语言处理的一部分,其任务是,给定一个文本,判断这个文本所表达的情感是正面的,中立的,还是负面的.这被广泛用于: 1. 商品好评度自动检测. 2. 微博推特等平台用户发言是开心赞美 ...

  4. python 文本分析库_Python有趣|中文文本情感分析

    前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...

  5. ML之NB、LoR:基于NB和LoR算法对Kaggle IMDB影评数据集(国外类似豆瓣电影)情感分析进行分类

    ML之NB.LoR:基于NB和LoR算法对Kaggle IMDB影评数据集(国外类似豆瓣电影)情感分析进行分类 注:LoR code waiting 目录 输出结果 核心代码 输出结果 数据集:Dat ...

  6. 情感分析的现代方法(包含word2vec Doc2Vec)

    英文原文地址:https://districtdatalabs.silvrback.com/modern-methods-for-sentiment-analysis 转载文章地址:http://da ...

  7. [Python人工智能] 三十四.Bert模型 (3)keras-bert库构建Bert模型实现微博情感分析

    从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章开启了新的内容--Bert,首先介绍Keras-bert库安装及基础用法及文本分类工作.这篇文章将通过keras- ...

  8. wordcloud里面设置mask加载不出来词频_一条龙搞定情感分析:文本预处理、加载词向量、搭建RNN

    IMDB Sentiment Classification from scratch Author: Beyond Time: 2019.04.26 情感分析是上手NLP的最简单的任务之一,它就是一个 ...

  9. [NLP]基于IMDB影评情感分析之BERT实战-测试集上92.24%

    系列文章目录 深度学习NLP(一)之Attention Model; 深度学习NLP(二)之Self-attention, Muti-attention和Transformer; 深度学习NLP(三) ...

最新文章

  1. 一级计算机考试题库25套答案,全国计算机等级考试一级试题及答案(25套)..doc
  2. [转]Javascript的IE和Firefox(火狐)兼容性
  3. 上传文件显示进度条_文件上传带进度条进阶-断点续传
  4. Python+Appium实现APP自动化测试
  5. MvcMusicStore学习中常出现的一个BUG
  6. SSH整合(1)异常
  7. office commmunication server 2007企业版关于通讯簿共享权限问题(无法同步)
  8. 27. netstat
  9. 数据结构考研:随机存取、顺序存取、随机存储和顺序存储的区别/详细解释(计算机/软件工程/王道论坛)
  10. AI、Big Data、Cloud学习路线之百度智能云ABC初级认证(百度云智学院学习笔记)
  11. struct构造函数 c++
  12. Nik Collection 5 Mac,最新PS滤镜插件套装
  13. Java Blend_Expression Blend的替代品[关闭]
  14. python基于requests库实现12306火车票余票信息以及票价信息查询
  15. 1442. 单词处理器 Java题解
  16. 石子合并问题(no circle)
  17. android模拟器如何输入中文,不能输入中文
  18. 短租民宿多平台房态同步管理系统
  19. 数据挖掘思维和实战06 数据建模:该如何选择一个适合我需求的算法?
  20. mac电脑循环次数多少算新_关于 MacBook 的电池问题,你了解多少

热门文章

  1. 学习-Java类和对象之static关键字之求圆环面积和周长
  2. 企业直播MR虚拟直播实例(混合现实直播)
  3. 瑞盟运算放大器MS8552 ,MS8551 MS8554
  4. 苹果服务器维护2月25日,梦幻西游2口袋版2月25日定期维护公告
  5. gittee添加公钥
  6. C盘扩展卷是灰色的扩容方法
  7. 单片机利用bootloader阶段对app进行升级的方案
  8. [电脑小白] 重装系统 ——笔记本/台式win7/8/10系统下载网站
  9. ppt转换器免费的下载
  10. linux mrtg 安装,Linux系统mrtg详细安装、设置说明