中文文本情感分析-python包SnowNLP入门
目录
1.情感分析是什么?
2.情感分析有什么用?
3.情感分析实战-SnowNLP
SnowNLP官方参考资料:
SnowNLP两个坑:
自己用snownlp训练模型:
1.情感分析是什么?
极性:观点正负性的程度,0-1,0为负,1为正
持有者:提取出观点的持有者是谁
日常分析中使用频率:极性>观点>持有者
程度词设置不同的权重
从例子可以看出,基于情感词典的分析是有误差的
文本向量化:文本变为数值
2.情感分析有什么用?
3.情感分析实战-SnowNLP
SnowNLP官方参考资料:
https://pypi.org/project/snownlp/
https://github.com/isnowfy/snownlp
SnowNLP介绍:是一个python写的类库,可以方便的处理中文文本内容,是受到了TextBlob的启发而写的,由于现在大部分的自然语言处理库基本都是针对英文的,于是写了一个方便处理中文的类库,并且和TextBlob不同的是,这里没有用NLTK,所有的算法都是自己实现的,并且自带了一些训练好的字典。注意本程序都是处理的unicode编码,所以使用时请自行decode成unicode。
SnowNLP两个坑:
SnowNLP已经训练好的模型不支持中文繁体字和英文,因为训练好的模型是用中文简体训练的
Snownlp模型训练精度不高,比如:
自己用snownlp训练模型:
官网中关于训练的说明
现在提供训练的包括分词,词性标注,情感分析,而且都提供了我用来训练的原始文件 以分词为例 分词在snownlp/seg目录下
from snownlp import seg
seg.train('data.txt')
seg.save('seg.marshal')
# from snownlp import tag
# tag.train('199801.txt')
# tag.save('tag.marshal')
# from snownlp import sentiment
# sentiment.train('neg.txt', 'pos.txt')
# sentiment.save('sentiment.marshal')
这样训练好的文件就存储为seg.marshal了,之后修改snownlp/seg/__init__.py里的data_path指向刚训练好的文件即可
中文文本情感分析-python包SnowNLP入门相关推荐
- Python:snownlp中文文本情感分析
hello,大家好,我是wangzirui32,今天来教大家如何使用snownlp的中文文本情感分析功能,开始学习吧! 1. pip 安装 命令: pip install snownlp -i htt ...
- python 文本分析库_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- python情感分析模型_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- python情感分析中文_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- python中文文本情感分析
目录 python中文文本情感分析 导语 训练模型保存并测试正确率 使用保存的模型 python中文文本情感分析 导语 要做一个项目要用到中文文本情感分析,查找了多种资料,在网上看了很多博客后,终于完 ...
- python中文文本分析_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码
NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之情感分析:基于python编程(jieba库)实现中文文本情 ...
- snownlp中文文本情感分析详细教程
hello,大家好,我是wangzirui32,今天来教大家如何使用snownlp的中文文本情感分析功能,开始学习吧! 1. pip 安装 命令: pip install snownlp -i htt ...
- NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码
NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之TEA:基于python编程(jieba库)实现中文文本情感分 ...
最新文章
- MySQL—03—MySQL的查询
- linux查找influx的安装位置,InfluxDB学习之InfluxDB的安装和简介 | Linux大学
- 使用迭代器时如何避免ConcurrentModificationException
- 双水泵轮换工作原理图_一用一备式冷凝水泵应急电源的设计与实现
- 【算法学习】线性时间排序-计数排序、基数排序和桶排序详解与编程实现
- 安装官方 Synaptics 驱动,终于解决 HP Pavilion G4 笔记本 讨厌的触摸板锁定问题!...
- 解决mysql分页数据错乱问题
- windows下测试flask的例子tuorial报错flask KeyError: 'DATABASE'
- 蓝桥杯省赛2018年Java组B组
- 生成小程序二维码传参scene的问题
- sqlserver 2012 MSSQLSERVER服务显示正在挂起更改且无法启动
- win7备份工具_调解 win7系统一键还原精灵使用的具体方法 -win7系统使用教程
- Excel十字象限图
- canvas画布上的文字随窗口大小变形
- stream_kws_cnn
- Houdini使用Mantra渲染景深通过Nuke合成
- 取球游戏(C++)[堆]
- vs2017 15.5.x dll调试不成功问题
- Lingo 中的各种函数
- School English(转帖)
热门文章
- Leetcode155最小栈
- 小而美的个人博客——前端——about
- 计算机游戏的作文,玩电脑游戏作文
- linux查看lvm命令,linux lvm常用命令总结
- 未来新一代计算机的发展方向,未来计算机的发展方向 (2)
- java 常量折叠_V8 使用“常量折叠”优化技巧,导致幂(**)运算有时候不等于 Math.pow()...
- python 合并 循环list_阿里巴巴鼎力推荐,Python入门至精通,24招加速你的Python
- python发挥程度_你为什么用 Python?
- win10 管理linux文件,Linux子系统文件可在未来的Win10发行版中通过资源管理器访问...
- pip安装更新、第三方库对应的python解释器版本、pip安装第三方库,压缩包离线安装,pycharm快捷安装及pycharm中terminal的使用,timeout超时报错