• 按其分析的粒度可以分为篇章级,句子级,词或短语级
    文本级别:通过完整文档或段落来获取情绪;
    句子级别:获得单句的情绪。
    子句级别:获得句子中,子表达的情感。
基本流程图

情感分类

任务:给定文本,识别其主观性文本的倾向,肯定or否定?正面或负面?

网络中存在主观性文本\color{red}{主观性文本}客观性文本\color{red}{客观性文本},而情感分类的对象是带有情感倾向的主观性文本,因此首先要进行文本的主观性分类。有两种类别的观点:直接性和比较性,例如A真的好和A比B好。有明确的,也有含蓄的

主观性分类:以情感词识别为主,利用不同的文本特征表示方法和分类器进行识别分类。主要研究思路:

  1. 基于语义的情感词典方法
  2. 基于机器学习的方法
基于语义的情感词典方法

(1)构建词典
情感词典是情感分类的基础,有4类词语:通用情感词、程度副词、否定词和领域词。
构建方法:利用已有词典扩展生成
做法:利用语义相似度计算方法计算词语与基准情感词集的语义相似度

(2)构建倾向性计算算法
利用情感词典和分析文本语句的特殊结构以及情感倾向词,采用权值算法或利用简单统计方法进行情感分类。根据情感强度给情感词赋予不同权值,然后进行加权求和

(3)确定阈值来判断文本倾向性
一般情况下,加权计算结果为正是正面倾向,结果为负是负面倾向 ,得分为零无倾向。所得结果评价一般采用自然语言中经常使用的正确率、召回率和 F 值来评判算法效果。

优点:不依赖标注好的训练集,实现简单,快速有效
缺点:粗粒度的分析,对词典构建要求比较高

基于机器学习的情感分类方法

(1)人工标注文本倾向性作为训练集
(2)提取文本情感特征
(3)机器学习方法构造情感分类器
(4)待分类文本通过分类器进行倾向性分类

常用的情感分类特征包括情感词,词性,句法结构,否定表达模板,连接,语义话题等.

.常用特征提取方法:信息增益,文档频率
分类方法:KNN,Bayes,SVM,CRF,最大熵分类器等

深度学习方法

用word embedding + DNN或者 Language model + Decoder




情感分析的类型

  • 细粒度情感分析

了解评论的极性水平,例如5星评级

  • 情绪检测

旨在检测诸如快乐,沮丧,愤怒,悲伤等情绪,采用词典(即单词列表和它们传达的情感)或复杂的机器学习算法

  • 基于Aspect的情感分析

“相机的电池续航不行”,说相机不行,但是更注重的是电池方面的不行,针对产品的特定方面

  • 意图分析

检测人们通过文本做什么;“如何更换墨盒?”

实现情感分析

  • 基于规则(手动指定规则)
  • 自动系统(机器学习)
  • 混合系统(基于规则和自动方法)

情感分析评估标准:

精确度,召回率和准确度是用于评估分类器性能的标准度量

  • Precision 精确率:预测为1的样本中,多少被正确分类
  • Recall召回率:实际为1的样本中,多少被成功预测
  • Accuracy准确率:所有文本中,被预测正确的文本

情感分析的挑战

主观性和语气

事实上,所谓的客观文本不包含明确的情绪。分析以下两个文本的情绪:“包很好。”“包裹是红色的。”
所有谓词(形容词,动词和某些名词)在创造情绪方面不应该被视为相同。 在上面的例子中,nice比red更主观。

语境和极性
反讽和讽刺
比较
表情符号
定义中性

包括客观文本,无关信息,包含愿望的文本

【知识总结】情感分类相关推荐

  1. 打破情感分类准确率80分天花板!更充分的知识图谱结合范式

    来源:夕小瑶的卖萌屋本文约3600字,建议阅读7分钟 本文带你了解NLP的研究者们怎么让模型像人类一样,学会"知识". NLP的研究者们一直都在尝试,怎么样让模型像人类一样,学会& ...

  2. 打破情感分类准确率 80 分天花板!更加充分的知识图谱结合范式

    文 | Severus NLP的研究者们一直都在尝试,怎么样让模型像人类一样,学会"知识".而最直观的想法莫过于将人类已经总结出来供机器解读的"知识体系",及其 ...

  3. 【AI实战】大语言模型(LLM)有多强?还需要做传统NLP任务吗(分词、词性标注、NER、情感分类、知识图谱、多伦对话管理等)

    [AI实战]大语言模型(LLM)有多强?还需要做传统NLP任务吗(分词.词性标注.NER.情感分类.多伦对话管理等) 大语言模型 大语言模型有多强? 分词 词性标注 NER 情感分类 多伦对话管理 知 ...

  4. 2.9 情感分类-深度学习第五课《序列模型》-Stanford吴恩达教授

    情感分类 (Sentiment Classification) 情感分类任务就是看一段文本,然后分辨这个人是否喜欢他们在讨论的这个东西,这是NLP中最重要的模块之一,经常用在许多应用中.情感分类一个最 ...

  5. python 多分类情感_文本情感分类(一):传统模型

    前言:四五月份的时候,我参加了两个数据挖掘相关的竞赛,分别是物电学院举办的"亮剑杯",以及第三届 "泰迪杯"全国大学生数据挖掘竞赛.很碰巧的是,两个比赛中,都有 ...

  6. SIGIR 2021 | 基于不确定性正则化与迭代网络剪枝的终身情感分类方法

    导读 终身学习能力对于情感分类器处理网络上连续的意见信息流而言至关重要.然而,执行终身学习对于深度神经网络来说是困难的,因为持续地训练可用信息会不可避免地会导致灾难性遗忘.发表在信息检索领域顶会 SI ...

  7. [Python人工智能] 二十三.基于机器学习和TFIDF的情感分类(含详细的NLP数据清洗)

    从本专栏开始,作者正式研究Python深度学习.神经网络及人工智能相关知识.前一篇文章分享了自定义情感词典(大连理工词典)实现情感分析和情绪分类的过程.这篇文章将详细讲解自然语言处理过程,基于机器学习 ...

  8. python 多分类情感词典_基于情感词典的文本情感分类

    基于情感词典的文本情感分类 传统的基于情感词典的文本情感分类,是对人的记忆和判断思维的最简单的模拟,如上图.我们首先通过学习来记忆一些基本词汇,如否定词语有"不",积极词语有&qu ...

  9. 情感分类与朴素贝叶斯

    本文介绍一种机器学习分类算法--朴素贝叶斯算法及其在NLP中的应用.具体实现部分可参考朴素贝叶斯用于情感分类的实现 NLP中的分类 许多自然语言处理任务涉及分类,分类也是人类和机器智能的核心. 文本分 ...

  10. 传统情感分类方法与深度学习的情感分类方法对比

    标注:本博客是参考论文有<传统情感分类方法与机遇深度学习的情感分类方法对比分析>.<自然语言处理中的深度学习:方法及应用> 情感分类是自然语言处理的重要分支,传统情感分类主要有 ...

最新文章

  1. Elasticsearch的Shield插件
  2. 从零开始入门 | Kubernetes 中的服务发现与负载均衡
  3. 作者:张广艳,男,博士,清华大学计算机科学与技术系副教授,中国计算机学会会员。...
  4. 这个“十一”长假,你是背“锅”出行吗?
  5. 博客园-vb随笔列表
  6. 文本导入数据到oracle_教你如何把文本数据导入Oracle中
  7. 一测振系统包括微型计算机,实验六 拍振实验
  8. 用百度OCR识别URL图片中的文字
  9. matlab对xml文件操作,Matlab读写xml文件
  10. 3DMAX建模教程:给模型设计逼真的发型!
  11. python3.7 安装 scrapy, pip 升级
  12. 【经典算法】双指针(尺取法):爱,是双向奔赴,还是你追我赶?
  13. 谷歌浏览器:无法翻译此网页
  14. 函数式编程如何破坏了我
  15. VMware公司成为Linux基金会金牌会员
  16. excel 宏 汉子转拼音缩写
  17. 直销系统模式开发流程详解
  18. 在chrome下安装Proxy SwitchySharp插件
  19. S5PV210 PWM定时器
  20. 手把手讲解超详细python入门游戏项目‘打外星飞船’(一)

热门文章

  1. 光纤中传导模式matlab仿真,光纤通信实验指导书
  2. 计算机应用基础10000字论文,计算机(毕业论文)一万字.doc
  3. ApacheCN 翻译/校对/笔记整理活动进度公告 2019.9.13
  4. 学校机房中计算机软件安装,学校机房软件维护与安装快捷方法.doc
  5. MSProject的使用教程
  6. 发包Byte速率和发包个数速率和带宽的关系
  7. 英语学习之‘加减乘除’
  8. Win10 安装 Rational Rose 教程(带超详细图文)
  9. 什么是GRE词汇红宝书?
  10. 比较流行的日志分析软件