python + snownlp 正负面分析
正负面分析
背景: 需要对新闻,评论做正负面分析
步骤:
1.安装snownlp
pip install snownlp
2. 训练或导入模型
- 训练
from snownlp import SnowNLP # 加载情感分析模块 from snownlp import sentiment text = '大麦多开一个口ok????正在现场俩口闲死 ' # 文本 s = SnowNLP(text)# todo snownlp常用方法 print(s.keywords(10)) # 提取 10个关键词 数字代表提取数量 print('/'.join(s.words)) #分词 print(s.sentences) # 断句# s.sentiments 会对文本进行评分f1 = open('./pos.txt', 'a+') # 存放正面 名字也可自定义哦 f2 = open('./neg.txt', 'a+') # 存放负面 if s.sentiments < 0.3: # 可以自定义范围print('这是一个负面评价')# 这段文本写入neg文件中f2.write(text)f2.write('\n')elif s.sentiments > 0.8: # 可以自定义范围print('这是一个正面评价')# 这段文本写入pos文件中f1.write(text)f1.write('\n') else:print('这是一个中性评价')# 保存此次的训练模型 sentiment.train('neg.txt', 'pos.txt') # 生成新的训练模型 sentiment.save('sentiment.marshal')
- 导入
读取数据,或导入csv文件 (前提是已经做好正负面分析的数据), 安装正负面导入 nrg.txt 和 pos.txt文件,并保存训练模型
训练完模型之后, 会在当前目录下生成 sentiment.marshal.3 文件
3. 加载新的训练模型
错误的示范:
from snownlp import SnowNLP
# 加载情感分析模块
from snownlp import sentiment
text = '大麦多开一个口ok????正在现场俩口闲死 ' # 文本
s = SnowNLP(text)print( s.sentiments) # 打印正负面属性值
这样是错误的,这样使用的依然是原有的 训练模型,并没有使用新的
正确步骤:
- 从引入 from snownlp import sentiment 进入 sentiment文件, 进而修改data_path 方法
# -*- coding: utf-8 -*-
from __future__ import unicode_literalsimport os
import codecsfrom .. import normal
from .. import seg
from ..classification.bayes import Bayes# 加载原来的数据模型
# data_path = os.path.join(os.path.dirname(os.path.abspath(__file__)),
# 'sentiment.marshal')# 加载本地新训练的模型 本地路径
data_path = 'C:/Users/**/Desktop/python文件/自然语言处理/语言处理/sentiment.marshal'class Sentiment(object):pass
- 用新模型判断数据的正负面
当初我走了太多的弯路,还一直以为自己是对的,,, 想想都泪流满面
python + snownlp 正负面分析相关推荐
- 爬取网易,搜狐,凤凰和澎湃网站评论数据,正负面情感分析
向AI转型的程序员都关注了这个号???????????? 机器学习AI算法工程 公众号:datayx Scrapy爬虫项目 基于Scrapy框架的Python新闻爬虫,能够爬取网易,搜狐,凤凰和澎 ...
- python情感分析:基于jieba的分词及snownlp的情感分析!
情感分析(sentiment analysis)是2018年公布的计算机科学技术名词. 它可以根据文本内容判断出所代表的含义是积极的还是负面的,也可以用来分析文本中的意思是褒义还是贬义. 一般应用场景 ...
- 基于python的情感分析案例-python snownlp情感分析简易demo(分享)
SnowNLP是国人开发的python类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和T ...
- Python爬取《你好李焕英》豆瓣短评并基于SnowNLP做情感分析
爬取过程在这里: Python爬取你好李焕英豆瓣短评并利用stylecloud制作更酷炫的词云图 本文基于前文爬取生成的douban.txt,基于SnowNLP做情感分析. 依赖库: 豆瓣镜像比较快: ...
- 用python做一个舆情分析系统_如何用Python做舆情时间序列可视化?
如何批量处理评论信息情感分析,并且在时间轴上可视化呈现?舆情分析并不难,让我们用Python来实现它吧. 痛点 你是一家连锁火锅店的区域经理,很注重顾客对餐厅的评价.从前,你苦恼的是顾客不爱写评价.最 ...
- python爬虫自学笔记分析解密_python爬虫学习笔记——1 各种文本分析工具简介之汇总...
此处只简单汇总一下各种文本工具名目,他们的详细使用参见具体帖子.本文主要参考<8种目前Python使用率最高的文本处理工具>一文0.SnowNLP包 用于中文文本的处理 1.Jieba 2 ...
- 基于python的情感分析案例-python自然语言处理情感分析案例
产品价值 自然语言处理是为各类企业及开发者提供的用于文本分析及挖掘的核心工具,已经广泛应用在电商.文化娱乐.金融.物流等行业客户的多项业务中.自然语言处理API可帮助用户搭建内容搜索.内容推荐.舆情识 ...
- python中文文本情感分析
目录 python中文文本情感分析 导语 训练模型保存并测试正确率 使用保存的模型 python中文文本情感分析 导语 要做一个项目要用到中文文本情感分析,查找了多种资料,在网上看了很多博客后,终于完 ...
- python微博评论情感分析_基于Python的微博情感分析系统设计
2019 年第 6 期 信息与电脑 China Computer & Communication 软件开发与应用 基于 Python 的微博情感分析系统设计 王 欣 周文龙 (武汉工程大学邮电 ...
最新文章
- VisualSVN-5.1.5补丁原创发布
- Microsoft Exchange Server 2010测试四成员DAG
- python3扫雷代码_GitHub - pantaduce/minesweeper: Python代码编写的扫雷游戏
- 第五天学习Java的笔记(if,switch顺序结构)
- boost::hana::while_用法的测试程序
- python生成器、迭代器、__call__、闭包简单说明
- BZOJ3038 上帝造题的七分钟
- [C/CPP系列知识] C++中extern “C” name mangling -- Name Mangling and extern “C” in C++
- 11.程序员的自我修养---运行库
- 硬盘安装Linux系统的最简单方法
- unity安装后续添加模块
- 饭客网络(基础教程)
- CC2420芯片手册核心知识点
- 2021中国科学院文献情报中心期刊分区表 计算机
- eureka 自我保护机制
- c语言编程情话,c语言浪漫情话
- 关于电梯运行逻辑原理的思路分析
- 配置Oracle到MySQL透明网关
- 解决minicom串口被锁Device /dev/ttyS? is locked
- 文章阅读统计php,WordPress博客统计文章阅读次数及访客数并刷访问数
热门文章
- date 显示日期月份用英文缩写表示
- CentOS安装XenServer Tools
- HTML简单的个人博客网站 DIV学生网页设计作品 dreamweaver作业静态HTML网页设计模板 个人网页作业制作
- OpenCV边缘检测(一)——Roberts边缘检测
- 关于dijkstra算法的个人总结
- windows 组策略
- import pyrender找不到指定模块
- 伦敦经济学院开设加密货币相关课程
- 伯克利『全栈深度学习』2022最新课程;谷歌『基于Transformers的通用超参数优化』经验分享;动图编辑器;前沿论文 | ShowMeAI资讯日报
- 硬件系统工程师宝典(3)-----信号完整性分析是个啥?