python做文本情感分析——某APP内评论内容作样本
之前试着做了这个文本情感分析,百度过一些方法,通过实际操作,本文记录的是正确率比较高且不繁琐的一种方法,现在也记录一下吧,希望以后能养成这个习惯,一些小tips要记录好。
随机抽取的某APP内2000条评论内容(中文形式)作为样本,目的是得出每条评论为正向评论的概率,打分范围是[0-1],此次定义[0,0.5]为负向评论,(0.5,1]为正向评论,观察其分布。
步骤一:
安装snownlp包和pandas包
原因:由于snownlp是使用淘宝评论语料,利用贝叶斯机器学习方法训练出来的模型,所以应用于本次分析比较合适。当然还是使用自己打标的样本训练出的模型正确率会更高啦~
步骤二:
下面是运行的python程序:
from snownlp import SnowNLP
import pandas as pd#读取2000条评论内容的.txt文件
txt = open('C:/Users/admin/Desktop/评论内容.txt')
text = txt.readlines()
print(text)#确认读取文件成功,并关闭文件节省资源
print('读入成功')
txt.close()#遍历每一条评论,得到每条评论是positive文本的概率,每条评论计算完成后输出ok确认执行成功
comments = []
comments_score = []
for i in text:a1 = SnowNLP(i)a2 = a1.sentimentscomments.append(i) comments_score.append(a2)print('ok')#将结果数据框存为.xlsx表格,查看结果及分布
table = pd.DataFrame(comments, comments_score)
print(table)
table.to_excel('C:/Users/admin/Desktop/emotion_analyse.xlsx', sheet_name='result')
步骤三:
展示部分结果
(“炒鸡nice”都识别出来了,maya)
结论:
正向评论占了60%以上,说明此APP的评论趋势还是偏积极的,跟预期的分布结果一致,但还是需要调优了。
python做文本情感分析——某APP内评论内容作样本相关推荐
- python中文文本情感分析
目录 python中文文本情感分析 导语 训练模型保存并测试正确率 使用保存的模型 python中文文本情感分析 导语 要做一个项目要用到中文文本情感分析,查找了多种资料,在网上看了很多博客后,终于完 ...
- python程序写诗_万能的 LSTM:可以写代码可以写诗还能做文本情感分析
LSTM,全称为「长短期记忆」,是一种「时间递归神经网络」(RNN).LSTM 适合于处理和预测时间序列中间隔和延迟非常长的重要事件. 通俗来讲,LSTM 非常适合用来预测与时间相关的数据,在文本处理 ...
- python snownlp情感分析_白杨数说 | 不会做文本情感分析?试试这两个Python包
情感分析是自然语言处理(NLP)领域的一类任务,又称倾向性分析,意见抽取,意见挖掘,情感挖掘,主观分析等,它是对带有情感色彩的主观性文本进行分析.处理.归纳和推理的过程.具体到数据新闻领域,文本情感分 ...
- 【Python】文本情感分析及绘制词云
码字不易,喜欢请点赞!!! 这篇文章主要分享了使用Python来对文本数据进行情感分析以及绘制词云. 主要步骤包括: 1.文本预处理 2.文本分词 3.去除停用词(这里设置为单个词和一些常见的停用词) ...
- python实现文本情感分析_用python实现简单的文本情感分析
很久没在公众号发布新内容,在这段时间内没想到有这么多python爱好者关注了我,港真的,心里很兴奋激动. 今天给大家带来我刚刚实现了的简单多文本情感分析代码,代码环境python3.5 原理 比如这么 ...
- python英文文本情感分析_sentimentpy模块进行中文文本情感分类
sentimentpy是我根据R语言的一个文本情感分析包sentiment进行开发的, 开发的初衷有: R的sentiment已经被弃坑, 没人维护 Python比R更擅长文本处理 sentiment ...
- python 文本分析库_快速使用Python进行文本情感分析
文本情感分析是自然语言处理的一个重要部分,与语音情感分析类似,通过处理提取给定文本中的信息来衡量说话者/作者的态度和情绪,主要用于电影.商品以及社交媒体的用户评论分析等. VADER是一个基于词典和规 ...
- python英文文本情感分析_舆情信息浩如烟海?看看如何用Python进行英文文本的情感分析...
市场每天都在生成海量的舆情信息,这些信息可以帮助我们识别市场情绪的转变.如果只是人工地去跟踪大量的舆论和研报显然缺乏效率.我们可以试试让机器来完成这个工作. 数据科学在数值领域中很常见,但这个不断壮大 ...
- 大数据分析 | 用 Python 做文本词频分析
老师教给我,要学骆驼,沉得住气的动物.看它从不着急,慢慢地走,慢慢地嚼,总会走到的,总会吃饱的. ---<城南旧事> 目录 一.前言 Python 简介 Python 特点 二.基本环境配 ...
- python中英文文本情感分析
英文文本: from textblob import TextBlobdef getText():txt = open('comment.text','r',encoding='utf-8').rea ...
最新文章
- cookie JS验证码
- 别忘了,明天是BCH的压力测试日
- Java实战应用50篇(一)-Java并发编程:volatile关键字解析
- mysql创建数据库并且指定utf-8编码
- 腾讯----小Q的歌单
- HDU 1003 Maxsum
- CompletableFuture详解~CompletionStage
- 语音识别现在发展到什么阶段了?
- PHP面向对象之方法重写
- 微信小程序图片四个API用法
- Mac 清理垃圾工具 Clean My Mac破解版
- C语言冒泡排序(起泡法)
- method属性值为get提交表单信息,为什么在地址栏不会显示呢。
- 设备树学习(二、设备树dts/dtsi格式)
- 定积分的计算(换元法)习题
- c 打开静态html文件,静态网页可以直接被浏览器解析显示,下面
- WDS+MDT使用记录---客户机UEFI模式启动报错
- DEX的文件简略介绍
- 让人费解的统计(股票、幸福指数等)
- OpenAI掌门人Sam Altman:DALL·E 2 教会我的三件事!
热门文章
- 实习之路0--设计模式之策略模式的理解(鸭子类例子)
- html适配手机 响应式,移动端适配(响应式)
- Android后端工程师的要求,后端工程师的岗位职责和能力
- pip 生成 requirement.txt 文件
- eclipse如何查看错误信息
- thinkphp Malformed UTF-8 characters, possibly incorrectly encoded报错解决方案
- VueCLI和Vite
- Adversarial Logit Pairing_CSDN
- hdu 1705[皮克定理]
- python stdin stdout_Python子进程:给出stdin,读取stdout,然后给出更多stdin