中文文本情感分析:基于机器学习方法的思路
1.常用步骤
2.中文分词
1)这是相对于英文文本情感分析,中文独有的预处理。
2)常用方法:基于词典、基于规则、基于统计、基于字标注、基于人工智能。
3)常用工具:哈工大—语言云、东北大学NiuTrans统计机器翻译系统、中科院张华平博士ICTCLAS、波森科技、结巴分词、Ansj分词,HanLP。
3.特征提取
1)文本中拿什么作为特征。
2)常用方法:根据词性(adj、adv、v)、单词进行组合(unigram、bigram)、位置。
3)使用词的组合表示文本,两种方式:词出现与否、词出现的次数。
4.特征选择
1)选择哪些特征,如果把所有的特征都作为特征计算,那计算量非常大,高维稀疏矩阵。
2)常用方法:去停用词,卡方,互信息。
3)常用工具:word2vector ,doc2vec
5.分类模型
1)训练、测试。
2) 常用方法:朴素贝叶斯、最大熵、svm。
6.评价指标
1)准确率
Accuracy = (TP + TN)/(TP + FN + FP + TN) 反映了分类器统对整个样本的判定能力——能将正的判定为正,负的判定为负 。
2)精确率
Precision = TP/(TP+FP) 反映了被分类器判定的正例中真正的正例样本的比重
3)召回率
Recall = TP/(TP+FN) 反映了被正确判定的正例占总的正例的比重
7.可参考资料
1)中文分词基本算法介绍
2)ICTCLAS 汉语词性标注集
3)文本分类技术
4)文本分类与SVM
5)基于贝叶斯算法的文本分类算法
6)基于libsvm的中文文本分类原型
7)LDA-math-文本建模
8)情感分析资源
9)面向情感分析的特征抽取技术研究
9.1)斯坦福大学自然语言处理第七课-情感分析
10)深度学习、自然语言处理和表征方法
11)Deep Learning in NLP (一)词向量和语言模型
中文文本情感分析:基于机器学习方法的思路相关推荐
- NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码
NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之情感分析:基于python编程(jieba库)实现中文文本情 ...
- NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码
NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之TEA:基于python编程(jieba库)实现中文文本情感分 ...
- NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)
NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分) 目录 输出结果 设计思路 相关资料 1.关于代码 2.关于数据集 关于留言 1.留言内容的注意事项 2.如 ...
- python 文本分析库_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- python情感分析模型_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- python情感分析中文_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- python中文文本分析_Python有趣|中文文本情感分析
前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...
- 结合语言知识和深度学习的中文文本情感分析方法
结合语言知识和深度学习的中文文本情感分析方法 徐康庭, 宋威 北方工业大学信息学院 摘要:在目前的中文文本情感分析研究中,基于语义规则和情感词典的方法通常需要人工设置情感阈值:而基于深度学习的方法由于 ...
- Python:snownlp中文文本情感分析
hello,大家好,我是wangzirui32,今天来教大家如何使用snownlp的中文文本情感分析功能,开始学习吧! 1. pip 安装 命令: pip install snownlp -i htt ...
- python中文文本情感分析
目录 python中文文本情感分析 导语 训练模型保存并测试正确率 使用保存的模型 python中文文本情感分析 导语 要做一个项目要用到中文文本情感分析,查找了多种资料,在网上看了很多博客后,终于完 ...
最新文章
- 吴恩达团队:神经网络如何正确初始化?
- 这次是真的!波士顿动力Atlas机器人又进化了,自主导航get新技能
- java---switch
- easyui打开新的选项卡_IntelliJ IDEA 2020.3 正式版发布,多项超酷新功能
- 设计模式:各个模式间的对比
- 2018世界幸福指数中国排第86,这种报告是怎样做出来的?
- tomcat报错“The specified JRE installation does not exist”
- 软考5个高级中哪个好考_请问:计算机软考中、高级,哪个好考些呢?
- C# 连接 Sqlserver2005 Analysis Service的总结
- Jenkins部署java项目实例
- java使用Redis(六个类型)
- 《HarmonyOS开发 - 小凌派-RK2206开发笔记》第2章 源码编译与固件下载
- 深入了解智能手机常见感应器
- python数据分析09_pandas数据聚合与分组运算
- (附源码)springboot金融新闻信息服务系统 毕业设计651450
- 請教阿泰一個有關水晶報表的問題
- 一文读懂人工智能产业链:基础技术、人工智能技术及人工智能应用
- matlab封装的模块,matlab模块封装
- 耿丹CS16-2班第六次作业汇总
- 最新ITIL考试题库(中英对照版初级)