尝试采用Snow NLP进行情感分析

写在前面

之前用ROST CM6软件大致做了一个情感分析,但是还是觉得存在2方面的问题:①是ROST CM6自带的情感分析过于简单,②是ROST CM6情感分析打分的效果并不好(这样看来ROST CM6好像除了搞个语义网络有点特色其他真是干啥啥不行 )总而言之,还是得考虑把目光转向其他情感分析手段了。

SnowNLP情感分析也是基于情感词典实现的,其简单的将文本分为两类,积极和消极,返回值为情绪的概率,越接近1为积极,接近0为消极

正餐开始

SnowNLP自带了一个训练集,但是这个包原来是用来做购物评价分析的,直接用来做毕设关于景区的情感分析,得到的答案不是很准确,打开SnowNLP安装所在目录,可以看到中文本积极评论pos.txt和消极评论neg.txt所在的位置,打开这两个文件夹可以看到里面很多中文。


现在就需要将我们自定义的pos(积极)和neg(消极)训练集加载进去,把标记好的两个素材文件pos.txt,neg.txt放到原包的位置。

接下来就是训练的过程,直接运行情感分析训练程序的时候出现报错:
FileNotFoundError: [Errno 2] No such file or directory: ‘pos.txt’

解决办法:建立绝对路径,‘ (pos文件所在位置,将\换成/) /pos.txt’,pos.txt 和neg.txt同样建立绝对路径。

开始训练

重新训练情感分析的代码如下所示:

#coding:UTF-8
from snownlp import sentiment
if __name__ == "__main__":# 重新训练模型sentiment.train('./neg.txt', './pos.txt')# 保存好新训练的模型sentiment.save('sentiment.marshal')

训练好后,调用SnowNLP库就可以完成本部分分析了。

顺带一提

本次使用SnowNLP中间还有三个小插曲:

一是在SnowNLP自带的数据集情感分析结果并不好,需要进行训练,但是作为一个Python小白,这个下载的SnowNLP库在哪我都找不到,后来参考了某篇大神的博文才知道原来鼠标悬停就可以看到对应库所在位置了…

二是在第一次执行命令的时候,出现了这个错误:
ImportError: cannot import name ‘SnowNLP’ from partially initialized module ‘snownlp’ (most likely due to a circular import) (I:\Python study\2级Python\snownlp.py)
也是参考了某篇大神的博文,原来是因为导入的snownlp包和新建的snownlp.py文件重名了。

将snownlp.py文件名称改一下即可正常运行。

三是测试data数据集是出现了这个错误:
UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xcc in position 0: invalid continuation byte
这是因为data.txt文件采用ANSI进行编码,修改另存为utf-8模式即可正常运行。

# 一点毕设小感悟(SnowNLP+可视化分析)相关推荐

  1. 计算机毕设 评论数据获取及可视化分析系统

    1 简介 今天向大家介绍一个帮助往届学生完成的毕业设计项目,评论数据获取及可视化分析系统. 计算机毕业生设计,课程设计需要帮助的可以找我 2 设计概要 21世纪是信息化时代,随着信息技术和网络技术的发 ...

  2. 关于怎么做创新、发paper,自己的一点小感悟

    如何做创新 关于怎么做创新.发paper,自己的一点小感悟 关于怎么做创新.发paper,自己的一点小感悟 初做科研时,听着师兄一个又一个idea,很是佩服,也百思不得其解不知道师兄怎么那么多idea ...

  3. SIEM和XDR下的安全分析小感悟

    谈不上小感悟,就是记录一下体会吧,现在是2022年,在SIEM领域已经摸爬滚打了3年,现在突然冒出来一个XDR,说是有SOAR响应编排.动作剧本,便高级一点了,但还是在初期,有些甲方客户觉得,乙方动了 ...

  4. python可视化文本分析(2)—snownlp jieba分析QQ群成员发言情况

    公众号文章链接 第二个情感分析,主要通过python实现qq群消息分析,分析群成员发言总次数,群成员情绪对比,单个群成员的发言词云状况以及单个同学的发言情感走势. 用到一下库: re正则,matplo ...

  5. 小福利,运用python里面的talib模块和cufflinks模块实现stock可视化分析

    小福利,运用python里面的talib模块和cufflinks模块实现stock可视化分析 import pandas as pd from sqlalchemy import create_eng ...

  6. 【计算机专业毕设之基于python猫咪网爬虫大数据可视化分析系统-哔哩哔哩】 https://b23.tv/jRN6MVh

    [计算机专业毕设之基于python猫咪网爬虫大数据可视化分析系统-哔哩哔哩] https://b23.tv/jRN6MVh https://b23.tv/jRN6MVh

  7. 对于感情的一点小感悟

    对于感情的一点小感悟 我谈不上是一个成人,因为我连女孩都没正常的追过. 所以我一直认为,我是个孩子. 嗯,顿时年轻了不少. 一切因为我喜欢上了一个女孩 爱和喜欢我觉得是不一样的. 喜欢是一次,爱是一辈 ...

  8. 【大数据分析专业毕设之基于python爬虫的电影票房大数据预测分析+大屏可视化分析

    [大数据分析专业毕设之基于python爬虫的电影票房大数据预测分析+大屏可视化分析-哔哩哔哩https://b23.tv/saIKtBH flask web框架,数据使用requests模块爬取数据, ...

  9. 基于flask徐州市天气信息可视化分析系统 毕设源码04600

    摘 要 信息化社会内需要与之针对性的信息获取途径,但是途径的扩展基本上为人们所努力的方向,由于站在的角度存在偏差,人们经常能够获得不同类型信息,这也是技术最为难以攻克的课题.针对天气信息等问题,对天气 ...

  10. 【计算机专业毕设之基于机器学习的大葱价格预测可视化分析-哔哩哔哩】 https://b23.tv/GLkWcjb

    [计算机专业毕设之基于机器学习的大葱价格预测可视化分析-哔哩哔哩] https://b23.tv/GLkWcjb https://b23.tv/GLkWcjb

最新文章

  1. mysql 存储过程支持传入数组参数_问个小问题,关于存储过程传递数组参数
  2. python文件读写r+_python文件读写操作(r/r+/rb/w/w+/wb/a/a+/ab)
  3. python语言的官方网站地址-字符串中的街道地址搜索-Python或Ruby
  4. Mac 技术篇-多个python版本环境下Geany编辑器指定python版本运行
  5. 1、虚拟机内存管理、运行时数据区、线程共享区、Java堆、新生代、老年代、Eden区域分配、方法区、线程独占区、虚拟机栈
  6. 英特尔、联发科、展讯等开始支持开源的物联网轻量化操作系统AliOS Lite
  7. win7/8/10安装过程中将动态磁盘转为basic
  8. layui如何存在多个弹窗_layer重复弹出(layui弹层同时存在多个)的解决方法_心善_前端开发者...
  9. mysql使用中文报错,hibernate mysql 插入中文错误
  10. 接口 java性能_MyPerf4J 一个极快的Java接口性能监控和统计工具
  11. Android NDK开发如何解决logcat日志打印不全
  12. iOS面试题与核心基础之性能优化
  13. 新世纪电影城热闹的三月 好片连连看 图
  14. MYS-6ULX-IOT 开发板测评——使用 Yocto 添加软件包
  15. ubuntu16.04 运行SVO
  16. power automate desktop字符串处理
  17. 数字证书认证机构(摘录自wiki百科)
  18. freemarker模板生成word文档踩坑记录
  19. vue-cli自动化测试karma + mocha + chai
  20. java-求矩形(长方形)的周长和面积案例

热门文章

  1. C语言学生管理系统源代码
  2. CSDN下载频道2014年11月4日-5日维护公告
  3. NI VISION视觉安装
  4. FANUC NC GUIDE PRO 17.1虚拟机(XP系统)
  5. 梯度下降算法总结 (FG,SG,SAG,mini-batch,Momentum等等)
  6. 交叉火力dsp手机调音软件_汽车DSP手机调音软件下载
  7. 谈谈可视化编程 (转)
  8. linux的视频格式转换软件,工具盘点:必备的Linux视频转换工具(1)
  9. 博客首页全新改版;博客代码片支持折叠;原创博文新增打赏功能……【2022.1.17】
  10. 安卓ViewFlipper跑马灯效果