1.常用步骤

2.中文分词

1)这是相对于英文文本情感分析,中文独有的预处理。

2)常用方法:基于词典、基于规则、基于统计、基于字标注、基于人工智能。

3)常用工具:哈工大—语言云、东北大学NiuTrans统计机器翻译系统、中科院张华平博士ICTCLAS、波森科技、结巴分词、Ansj分词,HanLP。

3.特征提取

1)文本中拿什么作为特征。

2)常用方法:根据词性(adj、adv、v)、单词进行组合(unigram、bigram)、位置。

3)使用词的组合表示文本,两种方式:词出现与否、词出现的次数。

4.特征选择

1)选择哪些特征,如果把所有的特征都作为特征计算,那计算量非常大,高维稀疏矩阵。

2)常用方法:去停用词,卡方,互信息。

3)常用工具:word2vector ,doc2vec

5.分类模型

1)训练、测试。

2) 常用方法:朴素贝叶斯、最大熵、svm。

6.评价指标

1)准确率

Accuracy = (TP + TN)/(TP + FN + FP + TN) 反映了分类器统对整个样本的判定能力——能将正的判定为正,负的判定为负 。

2)精确率

Precision = TP/(TP+FP) 反映了被分类器判定的正例中真正的正例样本的比重

3)召回率

Recall = TP/(TP+FN) 反映了被正确判定的正例占总的正例的比重

7.可参考资料

1)中文分词基本算法介绍

2)ICTCLAS 汉语词性标注集

3)文本分类技术

4)文本分类与SVM

5)基于贝叶斯算法的文本分类算法

6)基于libsvm的中文文本分类原型

7)LDA-math-文本建模

8)情感分析资源

9)面向情感分析的特征抽取技术研究

9.1)斯坦福大学自然语言处理第七课-情感分析

10)深度学习、自然语言处理和表征方法

11)Deep Learning in NLP (一)词向量和语言模型

中文文本情感分析:基于机器学习方法的思路相关推荐

  1. NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码

    NLP之情感分析:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之情感分析:基于python编程(jieba库)实现中文文本情 ...

  2. NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码

    NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)之全部代码 目录 全部代码 相关文章 NLP之TEA:基于python编程(jieba库)实现中文文本情感分 ...

  3. ​​​​​​​NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分)

    NLP之TEA:基于python编程(jieba库)实现中文文本情感分析(得到的是情感评分) 目录 输出结果 设计思路 相关资料 1.关于代码 2.关于数据集 关于留言 1.留言内容的注意事项 2.如 ...

  4. python 文本分析库_Python有趣|中文文本情感分析

    前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...

  5. python情感分析模型_Python有趣|中文文本情感分析

    前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...

  6. python情感分析中文_Python有趣|中文文本情感分析

    前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...

  7. python中文文本分析_Python有趣|中文文本情感分析

    前言 前文给大家说了python机器学习的路径,这光说不练假把式,这次,罗罗攀就带大家完成一个中文文本情感分析的机器学习项目,今天的流程如下: 数据情况和处理 数据情况 这里的数据为大众点评上的评论数 ...

  8. 结合语言知识和深度学习的中文文本情感分析方法

    结合语言知识和深度学习的中文文本情感分析方法 徐康庭, 宋威 北方工业大学信息学院 摘要:在目前的中文文本情感分析研究中,基于语义规则和情感词典的方法通常需要人工设置情感阈值:而基于深度学习的方法由于 ...

  9. Python:snownlp中文文本情感分析

    hello,大家好,我是wangzirui32,今天来教大家如何使用snownlp的中文文本情感分析功能,开始学习吧! 1. pip 安装 命令: pip install snownlp -i htt ...

  10. python中文文本情感分析

    目录 python中文文本情感分析 导语 训练模型保存并测试正确率 使用保存的模型 python中文文本情感分析 导语 要做一个项目要用到中文文本情感分析,查找了多种资料,在网上看了很多博客后,终于完 ...

最新文章

  1. 吴恩达团队:神经网络如何正确初始化?
  2. 这次是真的!波士顿动力Atlas机器人又进化了,自主导航get新技能
  3. java---switch
  4. easyui打开新的选项卡_IntelliJ IDEA 2020.3 正式版发布,多项超酷新功能
  5. 设计模式:各个模式间的对比
  6. 2018世界幸福指数中国排第86,这种报告是怎样做出来的?
  7. tomcat报错“The specified JRE installation does not exist”
  8. 软考5个高级中哪个好考_请问:计算机软考中、高级,哪个好考些呢?
  9. C# 连接 Sqlserver2005 Analysis Service的总结
  10. Jenkins部署java项目实例
  11. java使用Redis(六个类型)
  12. 《HarmonyOS开发 - 小凌派-RK2206开发笔记》第2章 源码编译与固件下载
  13. 深入了解智能手机常见感应器
  14. python数据分析09_pandas数据聚合与分组运算
  15. (附源码)springboot金融新闻信息服务系统 毕业设计651450
  16. 請教阿泰一個有關水晶報表的問題
  17. 一文读懂人工智能产业链:基础技术、人工智能技术及人工智能应用
  18. matlab封装的模块,matlab模块封装
  19. 耿丹CS16-2班第六次作业汇总
  20. 最新ITIL考试题库(中英对照版初级)

热门文章

  1. google bigquery数据下载
  2. h264html实时播放,H5播放H264之websocket
  3. Linux SD卡驱动开发
  4. 毕业论文用到的在线网站
  5. 蓝宝书优缺点之GRE词汇盘点
  6. pdf文件如何生成目录 wps_如何使用WPS把Word文档转换为PDF文档并生成目录?
  7. Rockchip平台cpu散热风扇随温度自动调速的配置方法
  8. java mp3剪切_mp3剪切器如何剪切mp3音频文件
  9. 计算机网络管理员四级理论知识试卷,2014计算机网络管理员模拟试题及答案
  10. 校园联通网使用沃派开wifi完美破解