情感分析领域相关内容,非正式综述,仅供参考。有些链接在可能在微信文章失效,请点击阅读原文获取。

(https://blog.csdn.net/DoJintian/article/details/88356413)

简介

情感分析或观点挖掘是对人们对产品、服务、组织、个人、问题、事件、话题及其属性的观点、情感、情绪、评价和态度的计算研究。

现有研究已经产生了可用于情感分析多项任务的大量技术,包括监督和无监督方法。在监督方法中,早期论文使用所有监督机器学习方法(如支持向量机、最大熵、朴素贝叶斯等)和特征组合。无监督方法包括使用情感词典、语法分析和句法模式的不同方法。现有多本综述书籍和论文,广泛地涵盖了早期的方法和应用。

大约十年前,深度学习成为强大的机器学习技术,在很多应用领域产生了当前最优的结果,包括计算机视觉、语音识别、NLP 等。近期将深度学习应用到情感分析也逐渐变得流行。

情感分析的三种粒度

  • 文档粒度(document level):文档级情感分类是指为观点型文档标记整体的情感倾向/极性,即确定文档整体上传达的是积极的还是消极的观点。因此,这是一个二元分类任务,也可以形式化为回归任务,例如为文档按 1 到 5 星评级。一些研究者也将其看成一个五类分类任务。

  • 句子粒度(sentence level):语句级情感分类用来标定单句中的表达情感。正如之前所讨论的,句子的情感可以用主观性分类和极性分类来推断,前者将句子分为主观或客观的,而后者则判定主观句子表示消极或积极的情感。在现有的深度学习模型中,句子情感分类通常会形成一个联合的三类别分类问题,即预测句子为积极、中立或消极。

  • 短语粒度(aspect level):也称为主题粒度,每一个短语代表了一个主题。与文档级和语句级的情感分类不同,aspect level 情感分类同时考虑了情感信息和主题信息(情感一般都会有一个主题)。给定一个句子和主题特征,aspect level 情感分类可以推断出句子在主题特征的情感极性/倾向。例如,句子「the screen is very clear but the battery life is too short.」中,如果主题特征是「screen」,则情感是积极的,如果主题特征是「battery life」,则情感是消极的。

深度学习模型

  1. 文档/句子粒度:Kim等人(2013) 提出的CNN文本分类工作,成为句子级情感分类任务的重要baseline之一;

  2. 文档/句子粒度:基本的lstm模型加上pooling策略构成分类模型,是通常用来做情感分析的方法;

  3. 短语粒度:Tang等人(2015) 使用两种不同的rnn网络,结合文本和主题进行情感分析;

  4. 短语粒度:Tang等人(2016) 结合memory-network,解决target-dedependent问题,这里的target理解为前面提过的aspect;

  5. 短语粒度:Chen等人(2017) 分别使用位置权重记忆和层叠attention的复合机制,建模target词和文本间的相互交互关系,以解决短语级情感分类问题;

  6. 短语粒度:Schmitt1等人(2018) 将aspect和polarity结合在一起进行分类任务训练,得到情感分析的模型;

  7. 现在流行模型:大规模语料预训练(词向量/Elmo/GPT/Bert)+ 深度学习分类器(lstm/cnn/transformer),一个很好的示例见AI Challenger 2018:细粒度用户评论情感分类冠军思路总结。

相关数据

情感词典

  • 词性字典1   词性字典2

  • 大连理工大学中文情感词汇本体库

  • 清华大学李军中文褒贬义词典

  • 知网情感词典

情感数据集

  • 15 Free Sentiment Analysis Datasets for Machine Learning

  • 大众点评细粒度用户评论情感数据集

  • 汽车行业用户观点主题及情感识别

  • 电商评论情感数据

  • 酒店评论语料

  • SemEval-2014 Task 4数据集

  • Citysearch corpus 餐馆评论数据

  • NLPCC2014评估任务2_基于深度学习的情感分类

  • NLPCC2013评估任务_中文微博观点要素抽取

  • NLPCC2013评估任务_中文微博情绪识别

  • NLPCC2013评估任务_跨领域情感分类

  • NLPCC2012评估任务_面向中文微博的情感分析

  • 康奈尔大学影评数据集

其他资源

  • [Sentiment Analysis with LSTMs in Tensorflow](https://github.com/adeshpande3/LSTM-Sentiment-Analysis  )

  • Sentiment analysis on tweets using Naive Bayes, SVM, CNN, LSTM, etc.

  • Chinese Shopping Reviews sentiment analysis

  • AI Challenger 2018:细粒度用户评论情感分类冠军思路总结

文献资料

  • 文本情感分析综述(腾讯语义团队)

  • Deep learning for sentiment analysis: A survey

  • 情感分析资源大全

  • Tang D, Qin B, Liu T. Aspect level sentiment classification with deep memory network[J]. arXiv preprint arXiv:1605.08900, 2016.

  • Kim Y. Convolutional neural networks for sentence classification[J]. arXiv preprint arXiv:1408.5882, 2014.

  • https://blog.csdn.net/DoJintian/article/details/88356413

请关注和分享↓↓↓ 

机器学习初学者

QQ群:727137612

(注意:本站有7个qq群,加入过任何一个的不需要再加)

本站的知识星球ID:92416895

往期精彩回顾

  • 良心推荐:机器学习入门资料汇总及学习建议(2018版)

  • 黄海广博士的github镜像下载(机器学习及深度学习资源)

  • 吴恩达老师的机器学习和深度学习课程笔记打印版

  • 机器学习小抄-(像背托福单词一样理解机器学习)

  • 首发:深度学习入门宝典-《python深度学习》原文代码中文注释版及电子书

  • 科研工作者的神器-zotero论文管理工具

  • 机器学习的数学基础

  • 机器学习必备宝典-《统计学习方法》的python代码实现、电子书及课件

  • 吐血推荐收藏的学位论文排版教程(完整版)

  • 机器学习入门的百科全书-2018年“机器学习初学者”公众号文章汇总

NLP研究方向的「情感分析领域」的简单调研相关推荐

  1. NLP自然语言处理之情感分析分析讲解、知识构建

    !!!!!!不要急着代码,搞清楚原理知识结构才下手,以后还指着它吃饭呢,又不是水一篇论文当混子!!!!!!! !!!!!!书越读越薄,本文源自:https://blog.csdn.net/linxid ...

  2. 重磅发布!36氪中国新基建之王「大数据领域」TOP50企业揭晓

    后信息技术时代,谁是数据海里的小白条? 制榜 | 贺卓媛 制图 | 王茹 出品 | 36氪创投研究院 封面来源 | IC photo 全球逐步进入以"数字化"为代表的后信息技术时代 ...

  3. 【API进阶之路】帮公司省下20万调研费!如何巧用情感分析API实现用户偏好调研

    上次借着高考热点整出一个刷屏的互动游戏之后,我连续被各业务部门请了一周的午饭了,今天运营部,明天品牌部,后天市场部-心里暗搓搓地想,这业务部门的团建经费咋就这么多呢? (详情请查看上集:<高考要 ...

  4. AI学习笔记(十八)NLP常见场景之情感分析

    目录 情感分析 基于情感词典的传统算法 基于深度学习的算法 情感分析 情感分析是自然语言处理中常见的场景,对于指导产品更新迭代具有关键性的作用. 通过情感分析,可以挖掘产品在各个维度的优劣,从而明确如 ...

  5. Tensorflow 笔记 Ⅺ——NLP 实现电影评论情感分析

    文章目录 特别说明 数据集 IMDB 简介 IMDB 数据集 下载地址 目录结构 示例文本 自然语言处理基础 分词 词的数字化表示方法与词嵌入 循环神经网络 RNN与LSTM 数据的时序与含义 RNN ...

  6. 新手探索NLP(七)——情感分析

    简介 文本情感分析(sentiment analysis),又称为意见挖掘,是对带有情感色彩的主观性文本进行分析.处理.归纳和推理的过程.其中,主观情感可以是他们的判断或者评价,他们的情绪状态,或者有 ...

  7. [NLP]基于IMDB影评情感分析之BERT实战-测试集上92.24%

    系列文章目录 深度学习NLP(一)之Attention Model; 深度学习NLP(二)之Self-attention, Muti-attention和Transformer; 深度学习NLP(三) ...

  8. NLP自然语言处理-Pytorch情感分析简介

    一.概念简介 本质上是一个分类任务,其一般是指判断一段文本所表达的情绪状态.其中,一段文本可以是一个句子,一个段落或一个文档.情绪状态可以是两类,如(正面,负面),(高兴,悲伤):也可以是三类,如(积 ...

  9. 使用NLP库textblob进行情感分析-红楼梦评论

    最近做了一个分析国外读者对红楼梦评价的小项目.这部分是使用textblob库对评论进行情感分析,得到情感值,并且进行分类,生成词云. 生成直方图.条形图的数据分析过程见我的这篇文章 读入的数据是这样的 ...

最新文章

  1. 再见 Win10!下一代操作系统要来了!
  2. tf.metrics.accuracy
  3. 网络:TCP粘包问题?如何解决?
  4. 清理Win7系统的批处理
  5. linux vim配置怎么打开文件,Linux如何设置默认VIM打开文件
  6. three.js script vertex和fragment在react中使用/纯js写法
  7. Oracle/MySQL decimal/int/number 转字符串
  8. Highlighting高亮插件使用说明
  9. kettle-连接mysql数据库
  10. layui 导航栏设置无鼠标停留特效_五款最受欢迎的热门wordpress开源主题 - 博客、导航...
  11. 解决XP IIS连接访问人数限制的问题
  12. python 回溯法 01背包问题_Python基于回溯法解决01背包问题实例
  13. 程序员月薪3万?2020年12月程序员平均薪资14222元,招聘近40万人!
  14. 【蓝桥杯专题】 贪心(C++ | 洛谷 | acwing | 蓝桥)
  15. 免费双因素身份认证服务
  16. Caj转pdf有哪些不收费的转换方法?
  17. 新浪sina gitlab邮件收不到
  18. Android Camera(一):camera模组CMM介绍
  19. 小程序如何分享到朋友圈,实现裂变
  20. ngrok 内网穿透+实现远程桌面

热门文章

  1. 12 - 函数式编程
  2. 基于卷积神经网络的匹配代价算法
  3. Linux安装/卸载软件教程
  4. mycat 编辑schema.xml
  5. 进击的docker 二 : docker 快速入门
  6. 《转载》POI导出excel日期格式
  7. Hibernate中常用对象、方法、属性的理解
  8. ACE前摄器Proactor模式
  9. machit r语言_机器学习应该准备哪些数学预备知识?
  10. element vue 纵向滑动条_【求助】vue element搭建的后台,侧边栏如何设置滚动条?...